Terça-feira técnica:Dominando AgentOps para implantação de IA empresarial
Os agentes de IA estão migrando de demonstrações para cargas de trabalho de produção que envolvem dados reais, sistemas reais e resultados de negócios reais. De acordo com o relatório 2025 AI Agents Insights do G2, 57% das empresas já possuem agentes de IA em produção, um sinal claro de que isso não é mais experimental. No entanto, com a implantação da produção surge uma nova classe de encargos operacionais:controle de acesso a ferramentas, auditabilidade, detecção de desvios e prevenção de custos descontrolados.
Esta mudança exige uma nova disciplina operacional para os líderes de TI e tecnologia.
AgentOps, abreviação de operações de agentes, é um conjunto emergente de práticas para gerenciar todo o ciclo de vida de agentes de IA em produção. Estende princípios de DevOps e MLOps para sistemas de agentes, com foco em confiabilidade, governança, transparência, segurança e controle de custos.
Ao contrário das operações de software tradicionais, o AgentOps deve lidar com comportamento não determinístico, uso autônomo de ferramentas e raciocínio dependente do contexto. Estes são desafios que a monitorização convencional não consegue resolver, e que foram demonstrados em novas pesquisas. Wang et al. (2025) formalizam isso em sua pesquisa, “A Survey on AgentOps”, propondo uma estrutura operacional de quatro estágios (monitoramento, detecção de anomalias, análise de causa raiz e resolução) especificamente adaptada para sistemas de agentes alimentados por modelo de linguagem grande (LLM).
Esta postagem descreve as melhores práticas práticas para AgentOps corporativos. Abrange objetivos e proteções, conectividade de ferramentas e dados, orquestração para processos de longa execução, governança do ciclo de vida, padrões humanos no circuito e otimização contínua por meio de avaliação e telemetria operacional. Posteriormente, mapeamos essas práticas para como a UiPath Platform™ oferece suporte à orquestração de agentes na produção.
Uma lista de verificação de AgentOps que você pode reutilizar
Antes de colocar os agentes em produção, as equipes devem ser capazes de responder claramente a estas perguntas:
-
Sabemos pelo que cada agente é responsável e quem é o proprietário?
-
Podemos controlar quais ferramentas o agente pode usar e com quais informações?
-
Podemos explicar o que o agente fez em uma determinada execução, incluindo quais ferramentas ele chamou e quais dados usou?
-
Podemos validar o comportamento do agente antes do lançamento, não apenas os resultados, mas também a escolha da ferramenta e o caminho de execução?
-
Podemos detectar desvios e regressões usando critérios de avaliação consistentes ao longo do tempo?
-
Podemos vincular e prever fatores de custos como chamadas de modelo, novas tentativas, tamanho do contexto e duração da orquestração?
-
Podemos implementar alterações com segurança com controle de versão, promoção de ambiente e reversões?
-
Temos um modelo humano claro para ações e exceções de alto impacto?
Do agente imediato ao agente operacional:objetivos, barreiras e confiança
Um agente de produção precisa de um propósito definido, restrições e responsabilidade. Deve ter clareza sobre o resultado pelo qual é responsável, as políticas a que deve obedecer, quais as provas ou justificações necessárias e quando ceder a uma pessoa.
A primeira prática recomendada é definir os objetivos, limites e regras de escalonamento de cada agente antes da implantação.
As organizações devem aplicar múltiplas camadas de governança para que o comportamento dos agentes permaneça alinhado com os requisitos de segurança e conformidade. No mínimo, a governação precisa de abranger quem pode construir e publicar agentes de IA, quais os modelos que podem ser utilizados, que dados e ferramentas estão acessíveis em tempo de execução e que ações são permitidas sem supervisão humana.
Os agentes de IA devem ser limitados por proteções de ferramentas que definam quais ferramentas podem ser chamadas, quais entradas são permitidas, quais efeitos colaterais são permitidos e quando uma chamada de ferramenta deve ser bloqueada ou encaminhada para um ser humano.
Por meio de experiências de desenvolvimento codificado e de baixo código, as equipes devem ser capazes de definir o conjunto de regras do agente (comportamento, acesso à ferramenta e restrições de tempo de execução) de maneira estruturada, confiável e transparente. Pontuação, avaliações e monitoramento integrados ajudam a manter o desempenho consistente do agente e evitam desvios e regressões.
Tão importante quanto isso, as equipes precisam de uma maneira segura de testar como um agente se comporta antes de ser conectado a sistemas ativos. Ser capaz de validar e gerar novos cenários de tempo de execução antes da produção por meio de simulações ajuda a detectar antecipadamente as fragilidades da integração, reduz surpresas no tempo de execução e estabelece a confiança de que os agentes se comportarão de maneira confiável quando conectados a aplicativos empresariais reais. Os usuários devem ser capazes de gerar cenários de entrada que seu agente possa encontrar e, quando apropriado, simular chamadas de ferramentas em execuções de depuração e avaliação de ponta a ponta. Isso torna mais fácil ver se o agente seleciona as ferramentas certas, transmite entradas válidas, lida com falhas de ferramentas normalmente e produz os resultados esperados sem arriscar sistemas ou dados ativos.
Conectando agentes de IA a ferramentas e dados empresariais
Para criar valor comercial, os agentes de IA devem se conectar a aplicativos empresariais como gerenciamento de relacionamento com o cliente (CRM), planejamento de recursos empresariais (ERP), emissão de tickets, repositórios de conhecimento e APIs internas, incluindo sistemas que não possuem APIs limpas.
Uma prática recomendada importante do AgentOps é o acesso controlado à ferramenta. As ferramentas devem ser explícitas, governadas e auditáveis. Na prática, isso significa que um agente não deve executar ações arbitrárias de forma descontrolada. Deve operar por meio de interfaces aprovadas com entradas e saídas definidas, validação, registro e tratamento de erros.
Cada invocação de ferramenta deve ser observável e auditável para que os operadores possam entender o que aconteceu e por quê.
Abordagens padronizadas para ferramentas de publicação e contexto podem ajudar as equipes a dimensionar isso com segurança. Por exemplo, os servidores Model Context Protocol (MCP) fornecem uma maneira estruturada de expor os recursos corporativos aos agentes em um formato consistente e detectável, ao mesmo tempo em que impõem autenticação, autorização e controles de política. A padronização também permite a reutilização entre agentes e fluxos de trabalho, para que ativos de automação confiáveis possam ser compartilhados de forma segura e consistente.
As organizações também precisam de padrões de implantação flexíveis. Um agente de IA pode ampliar um processo determinístico com raciocínio, ser exposto como uma ferramenta reutilizável ou executado como um componente independente orquestrado como parte de um fluxo de trabalho de negócios mais amplo. A flexibilidade é importante porque permite a adoção incremental, preservando ao mesmo tempo o controle, a segurança e a confiabilidade operacional.
Governança do ciclo de vida:gerenciamento de agentes como ativos empresariais
À medida que as implantações de agentes aumentam, as organizações devem tratar os agentes como ativos corporativos. As práticas recomendadas incluem manter um inventário de agentes, propriedade clara, controle de versão, permissões e visibilidade sobre o que cada agente toca.
Os executivos e as equipes de risco precisam de respostas claras sobre quais agentes existem, quem os possui, quais dados e sistemas eles acessam, quais processos dependem deles e quais versões estão sendo executadas em quais ambientes.
Essa abordagem de ciclo de vida depende de identidade, gerenciamento de acesso e rastreabilidade. Os agentes devem ser executados sob identidade com escopo com permissões de privilégio mínimo. A governança deve impor quem pode construir, implantar e operar agentes e quais comportamentos de tempo de execução são permitidos. As abordagens de baixo código e codificadas podem desempenhar um papel. O low-code pode tornar a lógica revisável e colaborativa, enquanto os caminhos codificados podem permitir validação reforçada, bibliotecas compartilhadas e aplicação de políticas padronizadas entre as equipes.
A transparência é igualmente importante. AgentOps de nível de produção requer a capacidade de entender o que o agente de IA fez, quais ferramentas ele chamou, quais entradas e saídas estavam envolvidas e por que tomou uma decisão. Essa rastreabilidade apoia auditorias, revisão de incidentes e construção de confiança entre as partes interessadas técnicas e comerciais.
A visibilidade operacional no nível da instância é onde isso se torna concreto em escala. As equipes precisam de visualizações agregadas de toda a frota de agentes, incluindo a capacidade de reproduzir sessões, ver tendências de confiabilidade por agente ou versão e entender quais integrações estão sendo usadas com mais frequência e quais estão falhando.
Estas opiniões são importantes porque, sem elas, as organizações acabam por gerir agentes no escuro, incapazes de dizer se um aumento no custo é causado por um único agente mal configurado ou por um problema sistémico em toda a frota.
Human-in-the-loop como um padrão de primeira classe
A supervisão humana continua essencial para muitos fluxos de trabalho empresariais. A melhor maneira de projetar etapas humanas é planejá-las de forma proativa, e não apenas como uma alternativa. As pessoas podem aprovar ações de alto impacto, corrigir resultados, fornecer contexto ausente ou assumir o controle em cenários de exceção.
AgentOps deve oferecer suporte a etapas explícitas de atividade humana, como aprovações, revisões e tratamento de exceções. Os agentes devem ser configurados para escalar com base em limites de confiança, risco de transação ou restrições políticas. Isso cria um modelo operacional controlado onde a IA lida com casos rotineiros e as pessoas governam casos extremos e decisões de alto risco.
Otimização contínua:mantenha os agentes de IA confiáveis e melhorando
A implantação de um agente é o início do seu ciclo de vida, não o fim. Na produção, os agentes encontram novas entradas, dados em evolução e sistemas em mudança. Uma grande preocupação emergente é a deriva dos agentes, onde os agentes na produção têm um desempenho diferente do que durante a avaliação devido a mudanças nos objetivos, contexto, raciocínio ou interações de ferramentas. A deriva pode se manifestar de diversas maneiras. A distribuição das tarefas recebidas muda, os dados subjacentes ou as fontes de conhecimento mudam, o comportamento do LLM evolui entre versões do modelo ou as integrações com ferramentas externas são degradadas.
A detecção contínua de desvios deve ser uma responsabilidade central do AgentOps, calculada em intervalos regulares, comparada com as linhas de base e acionando a correção quando os limites são excedidos.
Uma filosofia de desenvolvimento orientada para a avaliação trata as avaliações como artefatos de primeira classe ao longo deste ciclo de vida, e não como portas únicas. As avaliações em tempo de design e pós-implantação formam um ciclo contínuo que define a qualidade, mede-a de forma consistente e orienta a iteração segura à medida que os agentes evoluem.
Avaliações em tempo de design e tempo de execução ancoradas por um sinal de qualidade consistente
No momento do design, as avaliações estabelecem o que é “bom” antes de um agente chegar à produção, abrangendo tanto os resultados quanto os comportamentos importantes, como seleção de ferramentas, decisões intermediárias e trajetórias de execução.
Após a implantação, os mesmos critérios podem ser aplicados a execuções reais de produção usando rastreamentos de execução. Os resultados de ambas as fases devem se transformar em um sinal de desempenho consistente para monitorar a qualidade ao longo do tempo, comparar versões e detectar regressões antecipadamente, ao mesmo tempo que permite que as equipes se aprofundem nas causas raízes.
Otimização, feedback e memória como parte do loop
Os resultados da avaliação fazem mais do que medir a qualidade. Eles devem impulsionar ativamente a melhoria. O feedback humano e os resultados operacionais podem ser vinculados a avaliações e rastreamentos, expandindo o conjunto de regressões e, quando apropriado, informando a memória do agente governado.
Juntos, avaliação, ciclos de feedback controlados e práticas de memória disciplinadas criam um sistema onde os agentes melhoram por meio de mudanças mensuráveis, explicáveis e continuamente validadas.
Gerenciamento de custos como uma disciplina de AgentOps
Os agentes de IA introduzem direcionadores de custos dinâmicos vinculados ao comportamento do tempo de execução. Chamadas de modelo, uso de ferramentas, novas tentativas, duração da orquestração e tamanho do contexto, tudo isso se soma.
O custo deve ser tratado desde o início como uma preocupação de primeira classe.
As equipes devem ser capazes de comparar a eficiência entre as versões dos agentes antes da implantação, identificar trajetórias desnecessárias ou chamadas de ferramentas desnecessárias e capturar contextos superdimensionados antes que se torne caro na produção.
Na produção, as organizações precisam de visibilidade de custos por execução, por agente e em conjunto, para que operadores, administradores e líderes trabalhem a partir da mesma fonte de verdade. Limites e alertas ajudam a evitar gastos descontrolados, enquanto os controles de orquestração, como novas tentativas, tempos limite e caminhos de escalonamento, mantêm a execução limitada. Juntos, isso permite a otimização contínua de custos, onde as alterações são avaliadas quanto à qualidade e eficiência antes do lançamento e validadas com dados reais de execução após o lançamento.
Padronização e implantação em escala empresarial
O dimensionamento da automação de agentes requer um modelo operacional repetível, onde novos agentes herdam padrões comprovados por padrão. A padronização reduz a variação entre as equipes, ao mesmo tempo que garante que os controles de qualidade, segurança e custos sejam aplicados de forma consistente. Estruturas reutilizáveis, contratos de ferramentas consistentes e abordagens de avaliação compartilhadas ajudam as equipes a avançar mais rapidamente sem reaprender as mesmas lições.
No tempo de execução, as organizações se beneficiam de um plano de controle unificador que rege a execução, independentemente de como os agentes são criados. Preocupações comuns como aprovações, novas tentativas, tratamento de exceções e envolvimento humano devem ser implementadas uma vez e reutilizadas em todos os fluxos de trabalho. Ativos, políticas e proteções compartilhadas devem propagar melhorias em toda a frota de agentes, ao mesmo tempo em que suportam low-code e code para que as equipes possam passar da experimentação para a produção reforçada sem quebrar o ciclo de vida ou perder visibilidade do custo e do uso à medida que a escala aumenta.
Como a UiPath oferece suporte a AgentOps na prática
Metas, barreiras e confiança
A UiPath fornece uma base de confiança e governança projetada para alinhar o comportamento do agente com os requisitos de segurança e conformidade da empresa. As organizações podem aplicar múltiplas camadas de governança:
-
Governança agêntica:as proteções políticas no nível da plataforma impõem o acesso do desenvolvedor, o uso do LLM, verifica o valor da pontuação do agente em eventos de publicação e o acesso aos dados. Os agentes podem ser projetados com LLM e proteções de ferramentas que restringem a forma como os agentes interagem com os sistemas corporativos, incluindo quais ferramentas podem ser chamadas, quais entradas são permitidas, quais efeitos colaterais são permitidos e quando uma chamada de ferramenta deve ser bloqueada ou roteada para um ser humano.
-
Governança de TI:a UiPath fornece identidade para artefatos executáveis, rastreamento de controle de acesso baseado em função (RBAC), detecção em trânsito de informações de identificação pessoal (PII) e governança de dados para proteger automações de agentes confidenciais. O acesso é intencional e transparente.
-
Governança de infraestrutura:residência de dados, criptografia, limites de rede, fortalecimento da segurança e conformidade com padrões como Regulamento Geral de Proteção de Dados (GDPR), Lei de Portabilidade e Responsabilidade de Seguros de Saúde de 1996 (HIPAA), Programa Federal de Gerenciamento de Riscos e Autorizações (FedRAMP®) e ISO 27001.
A UiPath também oferece suporte à construção de confiança na pré-produção por meio de simulações. Os usuários podem usar linguagem natural para gerar cenários de entrada que seu agente pode encontrar quando invocado. Eles também podem optar por simular chamadas de ferramenta em execuções de depuração e avaliação de ponta a ponta para entender a trajetória. Isso ajuda a validar a seleção de ferramentas, a correção de entrada, a resiliência a falhas de ferramentas e os resultados esperados sem arriscar sistemas ou dados ativos.
Conectividade de ferramentas e dados
Na plataforma UiPath, “ferramentas” são integrações e automações concretas com entradas e saídas definidas, validação, registro e tratamento de erros. Cada invocação de ferramenta pode ser monitorada, rastreada e controlada.
A UiPath também oferece suporte a servidores MCP como uma forma padronizada de expor automação e recursos corporativos aos agentes. Os servidores MCP atuam como gateways governados que publicam ferramentas, ações e contexto em um formato consistente e detectável, ao mesmo tempo em que impõem autenticação, autorização e controles de políticas. Os servidores MCP permitem ainda a reutilização entre agentes e fluxos de trabalho, garantindo que os mesmos ativos de automação confiáveis possam ser compartilhados de forma segura e consistente.
UiPath oferece suporte a padrões de implantação flexíveis. Um agente pode ser incorporado para aumentar um processo determinístico com raciocínio, exposto via MCP como um agente ou ferramenta reutilizável ou implantado como um componente de agente autônomo orquestrado como parte de um fluxo de trabalho de negócios mais amplo no UiPath Maestro™.
Governança e rastreabilidade do ciclo de vida
Cada agente pode ser executado sob uma identidade com escopo com permissões de privilégio mínimo. A governança da plataforma impõe quem pode construir, implantar e operar agentes e quais comportamentos de tempo de execução são permitidos. As abordagens de baixo código e codificação ajudam a manter a governança em escala.
O serviço de rastreamento UiPath fornece um log de tempo de execução detalhado do estado do agente, chamadas de ferramentas e explicações do raciocínio LLM no loop do agente. Isso está disponível em tempo de design, tempo de avaliação e tempo de execução para todos os agentes gerenciados no UiPath e é extensível via OTEL para fornecedores de business intelligence com suporte.
A UiPath apresenta visualizações agregadas em toda a frota de agentes, incluindo replays de sessões, painéis de taxa de falhas que revelam tendências de confiabilidade por agente ou versão e estatísticas de uso de ferramentas.
Padrões humanos no circuito
A UiPath oferece suporte a etapas explícitas de atividades humanas, como aprovações, revisões e tratamento de exceções. Os agentes podem ser configurados para escalar com base em limites de confiança, risco de transação ou restrições de política.
Avaliação, otimização e memória controlada
Os resultados da avaliação em tempo de design e tempo de execução são agregados ao Agent Score, um sinal de desempenho consistente para monitorar a qualidade ao longo do tempo, comparar versões e detectar regressões antecipadamente.
Os recursos de otimização do UiPath Maestro™ e do Agent Builder do UiPath Studio avaliam dados de avaliação e de tempo de execução para criar sugestões medidas de melhoria que podem ser aplicadas de volta às definições correspondentes. O feedback humano e os resultados operacionais podem ser vinculados a avaliações e rastreamentos, expandindo o conjunto de regressões e, quando apropriado, informando a memória do agente governado.
Gerenciamento de custos e execução limitada
A UiPath oferece visibilidade de custos por execução, por agente e em conjunto. Limites rígidos de licenciamento e alertas evitam gastos excessivos, enquanto controles de orquestração, como novas tentativas, tempos limite e caminhos de escalonamento, mantêm a execução limitada.
Padronização e orquestração
Em tempo de execução, o UiPath Maestro atua como um plano de controle unificador que governa a execução, independentemente de como os agentes são criados. Preocupações comuns como aprovações, novas tentativas, tratamento de exceções e envolvimento humano são implementadas uma vez e reutilizadas em todos os fluxos de trabalho. Ativos, políticas e proteções compartilhadas propagam melhorias em toda a frota de agentes de IA.
Resumo
AgentOps transforma agentes de IA em um recurso empresarial durável. Exige governança, transparência, engenharia de confiabilidade, rigor na avaliação e controle de custos.
A combinação do Maestro e do Agent Builder da plataforma UiPath no UiPath Studio atende a esses requisitos, combinando criação e avaliação de agentes com orquestração durável e governança corporativa. Juntos, eles apoiam um modelo empresarial onde os agentes lidam com a interpretação e o planejamento, as automações executam etapas determinísticas e as pessoas permanecem firmemente no controle por meio de aprovações e supervisão.
Esta é a base que as empresas precisam para escalar a automação de agentes com segurança e credibilidade. Os agentes de IA operam como ativos governados dentro de processos de negócios reais, com responsabilidade clara, desempenho mensurável e melhoria contínua.
Sistema de controle de automação
- Como automatizar sua empresa:cinco práticas recomendadas de automação operacional
- Entrevista:Gerente líder de fundos de automação e robótica planejando lançar um novo veículo de investimento
- Robôs, funcionários da oficina colaboram, maximizando sinergia e segurança
- Os robôs Yaskawa SCARA fornecem processamento compacto de peças pequenas
- BIN95 destaca treinamento em automação e manutenção para estudantes preparados para o futuro para o sucesso da força de trabalho
- A Cruise Automation da GM apresenta novo veículo elétrico sem motorista
- O que vem a seguir para a revolução da automação?
- Automação:Nova fonte e recursos para robôs colaborativos
- Como a automação industrial é usada na Estação Espacial Internacional
- GE divulga novos recursos de fabricação digital