Chegou o ChatGPT Agent: de conversas, para ações reais

ChatGPT Agent: o novo assistente que usa um computador virtual para fazer tarefas complexas por você.
Solicitação de adesivos em estilo anime. Solicitação de adesivos em estilo anime.

O ChatGPT acaba de dar um salto significativo com o lançamento do ChatGPT Agent, uma ferramenta que transforma o assistente em um verdadeiro “faz-tudo digital”, capaz de realizar tarefas complexas em múltiplas etapas, acessando ferramentas como navegador, terminal, gerador de imagens, editores de slides e planilhas, além de APIs conectadas à sua conta.

A seguir, um resumo do que o novo recurso é capaz de fazer e por que ele representa um avanço importante no uso cotidiano de IA.

Um agente com cérebro e mãos

O ChatGPT Agent é mais do que uma conversa inteligente: ele é uma IA com acesso a um computador virtual próprio, equipado com ferramentas como:

Navegador de texto (para leitura rápida e eficiente de conteúdo na web);
Navegador visual (para interagir com interfaces gráficas de sites, clicar, preencher formulários, arrastar elementos);
Terminal de código (para rodar scripts, acessar planilhas, editar arquivos e chamar APIs como Google Drive, Calendar, GitHub e SharePoint);
Geração de imagens (para criar ilustrações e slides visuais durante o processo).

Esse conjunto permite que o agente vá muito além do texto: ele pensa, executa e entrega resultados concretos — de reservas e compras online até relatórios, apresentações e roteiros de viagem.

Treinado para usar a ferramenta certa, na hora certa

O modelo foi treinado por reforço com tarefas complexas e realistas, para aprender não só a usar cada ferramenta, mas a saber qual usar, quando e como. O resultado é um comportamento mais inteligente, eficiente e adaptável.

Por exemplo: se o usuário pede para planejar uma viagem, o agente primeiro faz pesquisas com o navegador de texto, depois acessa sites com o navegador visual para ver imagens, checar disponibilidade, e pode finalizar com geração de uma planilha com roteiro, preços e datas.

Interativo, colaborativo e flexível

O ChatGPT Agent é projetado para colaborar com você, como faria um assistente humano. Ele:

– Faz perguntas para esclarecer dúvidas;
– Permite interrupções durante o processo (você pode dar novas instruções no meio do caminho);
– Solicita confirmações antes de ações críticas, como compras ou envios;
– Permite que o usuário assuma o controle manual do navegador a qualquer momento.

Isso garante mais segurança, autonomia e fluidez no uso.

Casamento planejado, presente escolhido e sapato novo

No exemplo prático demonstrado, o agente foi encarregado de planejar um casamento: escolheu roupa com base no clima e dress code, buscou hotéis no Booking.com, sugeriu presentes e ainda foi interrompido para adicionar um novo par de sapatos ao carrinho. Tudo isso com registros visuais e ações concretas — como capturas de tela e links prontos para finalizar compras.

Um roteiro completo pelos estádios da MLB

Outro exemplo criativo foi a criação de um roteiro otimizando visitas aos 30 estádios da MLB, priorizando eventos como “Hello Kitty nights”. O agente pesquisou datas, construiu rotas, gerou uma planilha detalhada e até desenhou um mapa do trajeto.

Desempenho e benchmarks

O ChatGPT Agent também foi avaliado em diversos benchmarks:

– Obteve 27% de acerto em raciocínio matemático avançado (Front TMS);
– Superou modelos anteriores em tarefas web (WebArena) e navegação online (BrowseComp);
– Teve desempenho destacado na criação e manipulação de planilhas reais (Spreadsheet Bench) e até em tarefas típicas de analistas de banco de investimento.

Segurança e precauções

A equipe reforça que, apesar de robusto, o agente representa uma nova “superfície de risco”. Um exemplo é o risco de prompt injection, em que sites maliciosos tentam induzir o agente a compartilhar informações sensíveis. Para isso, o modelo foi treinado para ignorar comandos suspeitos, há camadas de monitoramento em tempo real, e o uso de dados sensíveis deve ser feito com cautela (preferencialmente por input manual do usuário).

Disponibilidade

O recurso está sendo liberado gradualmente para:

Usuários Pro: 400 queries por mês
Usuários Team: 40 queries por mês
Enterprise e EDU: previsto até o final do mês

 

O ChatGPT Agent marca uma nova era da interação com IA: de conversas para ações reais. Ele executa tarefas complexas, entende contexto, usa ferramentas diversas e colabora com o usuário de forma dinâmica e segura.

Ainda está no início, mas já é uma revolução para quem quer economizar tempo e deixar a IA trabalhar de verdade.