Novo Claude 3.5 Sonnet vai interagir com seu computador

A Anthropic revelou grandes atualizações para seus modelos Claude AI, introduzindo um Claude 3.5 Sonnet aprimorado com recursos de codificação aprimorados, um novo modelo Claude 3.5 Haiku que oferece alto desempenho a um custo menor e um recurso inovador de “uso do computador” que permite que Claude interaja diretamente com interfaces de computador.

Interação com seu computador

Uma inovação empolgante é a capacidade de uso de computador, que permite que os modelos interajam com interfaces de forma semelhante aos humanos, realizando tarefas como clicar e digitar.

Essa funcionalidade está em beta e promete revolucionar a automação de processos. O Haiku, por sua vez, é projetado para respostas rápidas e concisas, ideal para criação de microconteúdo.

Cronograma de lançamento de modelos de IA.

O modelo Claude 3.5 Sonnet atualizado demonstra melhorias significativas em vários benchmarks, particularmente em tarefas de codificação e uso de ferramentas. Os principais aprimoramentos incluem:

SWE-bench Verified score aumenta de 33,4% para 49,0%, superando todos os modelos disponíveis publicamente.
Aumento do desempenho da bancada TAU de 62,6% para 69,2% no varejo e de 36,0% para 46,0% nos domínios das companhias aéreas
Pontuações GPQA e MMLU Pro aprimoradas, superando o Gemini 1.5 Pro

Esses avanços não têm custo adicional ou penalidade de velocidade em comparação com seu antecessor. O feedback inicial de empresas como GitLab e Cognition indica melhorias substanciais na codificação baseada em IA, com raciocínio até 10% mais forte em vários casos de uso

O novo recurso de interação com computadores no Claude 3.5 oferece diversos benefícios significativos:

Automação de Tarefas: Permite que a IA execute ações como clicar, digitar e preencher formulários, reduzindo a carga de trabalho manual em tarefas administrativas.
Integração com Aplicativos: Claude pode interagir com qualquer software de desktop, possibilitando um uso mais eficiente de ferramentas existentes, como editores de texto e navegadores.
Aprimoramento da Produtividade: Empresas como Replit já estão explorando essa funcionalidade para automatizar a avaliação de aplicativos, aumentando a eficiência no desenvolvimento.
Segurança e Controle: A Anthropic implementou medidas para garantir que os usuários mantenham controle sobre as ações da IA, permitindo acesso limitado conforme necessário.

clique para ampliar

Recursos do Claude 3.5 Haiku

Quatro celulares exibem diferentes temas de textos.

Claude 3.5 Haiku, o mais novo modelo leve da Anthropic, oferece desempenho impressionante a um preço mais acessível. Os principais recursos incluem:

Corresponde ao desempenho do Claude 3 Opus em muitos benchmarks, mantendo custos mais baixos e velocidades mais rápidas
Pontua 40,6% no SWE-bench Verified, superando o Claude 3.5 Sonnet original e o GPT-4 Turbo
Inicialmente disponível como um modelo somente texto, com suporte a imagens chegando posteriormente
Adequado para produtos voltados para o usuário, tarefas especializadas de subagentes e geração de experiências personalizadas a partir de grandes volumes de dados

O Claude 3.5 Haiku estará disponível no final deste mês por meio da API da Anthropic e dos principais provedores de nuvem, oferecendo aos desenvolvedores uma opção econômica para recursos de IA de alto desempenho