Liberte a produtividade:combine a automação da UI com a automação baseada em LLM
Recentemente, várias empresas líderes de IA lançaram novos recursos que aproveitam seus poderosos modelos fundamentais de linguagem grande (LLMs) para automatizar rapidamente muitas ações que as pessoas realizam nas telas. O Computer Use da Anthropic, o Amazon Q Business e o próximo "Operador" OpenAI podem entender rapidamente as telas, operar o software que está sendo usado e emular as ações desejadas do usuário - sem qualquer codificação ou treinamento de modelo.
A automação baseada em LLM é uma nova maneira de automatizar. É significativamente diferente da automação da UI, que depende de modelos treinados e abordagens baseadas em regras para extrair informações e interagir com telas, sistemas e software. Como a automação baseada em LLM é muito mais simples de usar, alguns observadores do setor sugeriram que ela poderia substituir a automação da UI.
Realizámos uma avaliação extensiva destas novas tecnologias e estamos entusiasmados com o seu potencial para alargar o impacto da automação a empresas e utilizadores. Na verdade, estamos integrando o que há de melhor em nossa plataforma. Como permitem que a IA interaja com o software da mesma forma que os humanos, acreditamos que podem realmente revolucionar as interações entre as pessoas e as telas. Eles têm o potencial de aumentar a produtividade pessoal a novos patamares e permitir que praticamente qualquer pessoa se torne um desenvolvedor cidadão para automatizar suas tarefas tediosas e repetitivas.
No entanto, a automação baseada em LLM nunca substituirá completamente a automação da UI em todos os processos. Por exemplo, a automação da UI é uma escolha muito melhor para processos automatizados de missão crítica e de alto volume que envolvem o acesso a vários sistemas e o trabalho com dados confidenciais ou proprietários. Esses tipos de processos são abundantes nas empresas e, em geral, são mais bem gerenciados pela automação da UI.
Para entender por que isso acontece, vamos dar uma olhada rápida em como cada abordagem funciona.
A automação da UI e a automação baseada em LLM funcionam de maneira diferente, e isso é importante
As abordagens baseadas em LLM normalmente empregam um LLM multimodal (compreensão de imagens, palavras, áudio, etc.) para “ler” uma tela e agir. A abordagem depende de um LLM compreender as informações da tela (dados, campos, etc.) hospedadas na nuvem. O modelo então prevê as ações que o ser humano realizaria e envia instruções para realizar a ação (copiar e colar dados, etc.).
Por outro lado, na automação da UI, os robôs seguem um conjunto pré-desenvolvido de instruções para concluir tarefas definidas. Eles podem ser executados no ambiente do cliente e/ou usuário. Os dados só podem ser interpretados localmente e os robôs seguem um conjunto de instruções claro e determinístico. Avanços recentes alimentados por IA melhoraram significativamente a estabilidade e a confiabilidade, abordando muitos dos problemas iniciais da automação da IU com fragilidade e quebra.
Os benefícios claros da automação da IU
As diferenças entre essas duas abordagens fazem TODA a diferença na automatização de processos multissistema complexos, de alto volume e que exigem alta segurança e precisão. Para esses tipos de fluxos de trabalho, a automação da IU é uma opção muito melhor. Aqui está o porquê:
Precisão e integridade:processos de missão crítica, como do pedido ao pagamento, dependem da extração, movimentação e postagem precisas de dados de um local para outro, bem como da documentação e das comunicações relacionadas a essas atividades. Nesta área, as abordagens baseadas em LLM não podem igualar o desempenho da automação da UI.
Por exemplo, uma análise dos dados da UiPath mostra que 96,5% de todas as automações de nossos clientes são executadas com sucesso com nossas abordagens de automação de UI. Os dados disponíveis publicamente sobre a automação baseada em IA sugerem que ela é significativamente menos confiável. Por exemplo, a Anthropic relatou uma taxa de precisão de 14,9% em um teste projetado para avaliar as tentativas dos desenvolvedores de fazer com que os modelos usassem computadores – muito abaixo do nível de habilidade humana de 70-75%. Embora a precisão certamente melhore com o tempo, há um longo caminho a percorrer antes de alcançar a paridade com a automação da IU.
Existem outras questões também. Todos os LLMs são propensos a alucinações e podem realizar ações imprevisíveis. Por exemplo, os pesquisadores da Anthropic observaram casos em que seu LLM de repente saiu da tarefa – clicando nas telas erradas ou baixando inexplicavelmente fotos de parques nacionais. Os robôs determinísticos da automação da UI simplesmente não têm a capacidade de se tornarem desonestos dessa forma.
Depois, há a questão da completude. Uma abordagem que tira fotos da tela visível pode perder dados em listas suspensas que se estendem abaixo das margens. E pode ignorar ações de curta duração que não estavam ocorrendo quando as fotos foram tiradas. A automação da UI não apresenta esses problemas.
Segurança e governança:quando se trata de garantir a privacidade, bloquear incursões maliciosas e manter dados proprietários dentro de firewalls, a automação da UI é uma escolha significativamente menos arriscada. Por exemplo, com a automação da UI, apenas os dados necessários são coletados. Em contraste com a automação baseada em LLM, a automação da UI não envolve extração em massa de capturas de tela que possam inadvertidamente conter dados confidenciais. Além disso, os robôs de software UiPath que realizam nossa automação de UI podem ser credenciados e seu acesso a dados confidenciais controlado. Esse nível de segurança não está disponível atualmente com automação baseada em LLM.
Para nós, não é um ou outro, é ambos
Ao olharmos para o futuro, fica claro que a ascensão da automação baseada em LLM representa um grande salto em frente para certos tipos de processos e atividades. O mundo está perto de realizar o sonho de colocar a automação dinâmica, sem código e orientada por prompts nas mãos de praticamente todos que usam telas e software – inaugurando uma nova era de produtividade e desempenho pessoal diferente de tudo que já vimos antes.
Já estamos tomando medidas para trazer esses tipos de recursos para a UiPath Platform™. Em particular, em breve iremos incorporá-lo em nossas experiências de usuário final, como o Autopilot™ for Everyone, além de fornecer automação baseada em LLM como uma opção adicional para desenvolvedores cidadãos e especialistas em automação.
Sabemos que as empresas vão querer tirar partido destas novas capacidades, mas querem fazê-lo de forma segura e com controlo total. Portanto, temos expandido as capacidades da nossa plataforma para fornecer a orquestração, gestão e governança necessárias que as empresas exigem, independentemente do modelo ou modelos que adotam.
Mas mesmo à medida que expandimos a funcionalidade e o suporte para automação baseada em LLM, continuamos a aprimorar nossos recursos de automação de UI, porque a automação de UI será a melhor solução para uma ampla gama de processos empresariais críticos. Continuaremos a aproveitar os avanços emergentes da IA para tornar a nossa automação de UI ainda mais inteligente, mais fácil de compreender e agir sem codificação e treinamento significativos, e mais resiliente. Um excelente exemplo:o novo UiPath Healing Agent (agora em versão prévia pública), que pode autocurar automações com falhas.
Resumindo, a UiPath acredita em um futuro de automação baseada em LLM em todas as suas formas, incluindo abordagens baseadas em UI e LLM. Cada um tem pontos fortes únicos; cada um é a melhor escolha para um conjunto específico de oportunidades de automação. Nosso objetivo é disponibilizar ambos – juntamente com quaisquer novas abordagens de IA que surjam – por meio de uma plataforma empresarial que possa orquestrar, governar e gerenciar toda a panóplia de opções de automação disponíveis hoje e no futuro.
Sistema de controle de automação
- Por que os fabricantes devem adotar IA e Big Data?
- Melhorando a produtividade dos negócios por meio da automação inteligente
- Nenhum plano B – COVID-19 expõe as deficiências do ensino técnico
- Aplicação da indústria 4.0 em diferentes setores
- A automação está em toda parte
- VDMA desenvolverá um roteiro para impressão 3D com roteiro de fabricação
- Central McGowan expande seu hub de distribuição altamente automatizado
- Mercado de robótica vê crescimento acelerado em meio ao boom do comércio eletrônico
- Halter CNC Automation adiciona pegada pequena Halter Compact
- Da IU à IA:uma jornada de automação