Pular para o conteúdo

Agentes de IA generativa: o que muda com o ChatGPT agent da OpenAI

Homem sentado em mesa de escritório trabalhando em laptop com gráfico colorido na tela.

Estamos a entrar na terceira fase da IA generativa. Primeiro vieram os chatbots; depois, os assistentes. Agora começam a aparecer os agentes: sistemas que ambicionam mais autonomia e conseguem trabalhar em “equipes” ou recorrer a ferramentas para executar tarefas complexas.

O produto mais comentado do momento é o ChatGPT agent, da OpenAI. Ele reúne dois produtos já existentes (Operator e Deep Research) num único sistema mais potente que, segundo o próprio desenvolvedor, “pensa e age”.

Essas novas soluções representam um avanço em relação às ferramentas anteriores. Entender como funcionam e do que são capazes - além das suas limitações, desvantagens e riscos - está a tornar-se rapidamente indispensável.

De chatbots a agentes

O ChatGPT inaugurou a era dos chatbots em novembro de 2022, mas, apesar da enorme popularidade, a interface conversacional restringia o que era possível fazer com a tecnologia.

Em seguida entrou em cena o assistente de IA, ou copilot. São sistemas construídos sobre os mesmos grandes modelos de linguagem que sustentam os chatbots de IA generativa, porém concebidos para realizar tarefas com orientação e supervisão humanas.

Os agentes são o próximo degrau. A proposta é que eles persigam objetivos (em vez de apenas cumprir tarefas) com diferentes níveis de autonomia, apoiando-se em capacidades mais avançadas, como raciocínio e memória.

Em alguns casos, múltiplos sistemas de agentes de IA podem atuar em conjunto, comunicando-se para planejar, agendar, decidir e coordenar a resolução de problemas complexos.

Além disso, agentes também são “usuários de ferramentas”, porque conseguem acionar softwares especializados - como navegadores, planilhas, sistemas de pagamento e outros recursos.

Um ano de desenvolvimento acelerado

A IA com agentes parecia iminente desde o fim do ano passado. Um marco importante ocorreu em outubro passado, quando a Anthropic deu ao seu chatbot Claude a capacidade de interagir com um computador de forma muito semelhante à de uma pessoa. O sistema conseguia consultar múltiplas fontes de dados, localizar informações relevantes e enviar formulários online.

Outros desenvolvedores de IA reagiram rapidamente. A OpenAI lançou um agente de navegação na web chamado Operator, a Microsoft anunciou agentes do Copilot, e vimos o lançamento do Vertex AI, do Google, e de agentes do Llama, da Meta.

No começo deste ano, a startup chinesa Monica demonstrou o seu agente Manus AI comprando imóveis e convertendo gravações de aulas em anotações-resumo. Outra startup chinesa, a Genspark, lançou um agente de motor de busca que devolve uma visão geral numa única página (semelhante ao que o Google faz hoje), com links integrados para tarefas online, como encontrar as melhores ofertas de compras.

Já a Cluely, outra startup, oferece um agente um tanto fora de controle, descrito como “colar em qualquer coisa”, que chamou atenção, mas ainda não entregou resultados relevantes.

Nem todo agente é pensado para uso geral. Alguns são desenhados para áreas específicas.

Programação e engenharia de software estão na linha de frente, com o agente de programação do Microsoft Copilot e o Codex, da OpenAI, entre os principais nomes. Esses agentes conseguem escrever, avaliar e fazer commit de código de forma independente, além de analisar código escrito por humanos em busca de erros e de quedas de desempenho.

Busca, sumarização e muito mais

Um dos pontos fortes centrais dos modelos de IA generativa é a capacidade de buscar e resumir informação. Agentes podem explorar isso para executar tarefas de pesquisa que levariam dias para um especialista humano concluir.

O Deep Research, da OpenAI, enfrenta tarefas complexas por meio de pesquisas online em múltiplas etapas. Já o “co-cientista” de IA do Google é um sistema multiagente mais sofisticado, criado para ajudar cientistas a gerar novas ideias e propostas de pesquisa.

Agentes conseguem fazer mais - e errar mais

Apesar de todo o entusiasmo, agentes de IA vêm com várias ressalvas. A Anthropic e a OpenAI, por exemplo, recomendam supervisão humana ativa para reduzir erros e riscos.

A OpenAI também afirma que o seu ChatGPT agent é de “alto risco” por poder ajudar na criação de armas biológicas e químicas. No entanto, como a empresa não publicou os dados que sustentam essa afirmação, fica difícil avaliar.

Os riscos em situações do mundo real aparecem em exemplos como o Project Vend, da Anthropic. O Vend colocou um agente de IA a gerir, como um pequeno negócio, uma máquina de venda automática para funcionários - e o projeto acabou por se desintegrar em alucinações ao mesmo tempo engraçadas e chocantes, além de um frigorífico cheio de cubos de tungsténio em vez de comida.

Noutro alerta, um agente de programação apagou toda a base de dados de um desenvolvedor e, mais tarde, disse que tinha “entrado em pânico”.

Agentes no escritório

Ainda assim, agentes já estão a encontrar usos práticos.

Em 2024, a Telstra implementou em larga escala assinaturas do Microsoft copilot. A empresa afirma que resumos de reuniões e rascunhos de conteúdo gerados por IA poupam, em média, 1–2 horas por semana ao pessoal.

Muitas grandes organizações estão a seguir caminhos semelhantes. Empresas menores também fazem testes com agentes, como o uso, pela construtora Geocon (sediada em Canberra), de um agente de IA interativo para gerir defeitos nos seus empreendimentos de apartamentos.

Custos humanos e outros custos

Por enquanto, o principal risco trazido por agentes é a substituição tecnológica. À medida que evoluírem, podem substituir trabalhadores humanos em muitos setores e tipos de atividade. Ao mesmo tempo, o uso de agentes pode acelerar o declínio de vagas administrativas de nível inicial.

Quem usa agentes de IA também enfrenta riscos. Pode haver dependência excessiva, com a transferência de tarefas cognitivas importantes para a IA. E, sem supervisão adequada e barreiras de segurança, alucinações, ciberataques e erros que se acumulam podem rapidamente desviar um agente da sua tarefa e dos seus objetivos, causando danos, perdas e lesões.

Os custos reais também não são claros. Todos os sistemas de IA generativa consomem muita energia, o que, por sua vez, influencia o preço de usar agentes - sobretudo em tarefas mais complexas.

Aprenda sobre agentes - e crie o seu

Apesar dessas preocupações contínuas, é de esperar que agentes de IA fiquem mais capazes e mais presentes no trabalho e no dia a dia. Por isso, faz sentido começar a usar (e talvez a desenvolver) agentes por conta própria, entendendo pontos fortes, riscos e limitações.

Para o utilizador médio, o acesso mais simples tende a ser pelo Microsoft Copilot Studio. Ele já inclui salvaguardas, governança e uma loja de agentes para tarefas comuns.

Para quem quer ir além, é possível criar o seu próprio agente de IA com apenas cinco linhas de código usando o framework Langchain.

Daswin de Silva, Professor de IA e Analytics, Diretor de Estratégia de IA, La Trobe University

Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário