Na terça-feira, o grande modelo de linguagem Claude 3 Opus, criado pela Anthropic, superou o GPT-4 da OpenAI (do ChatGPT) pela primeira vez na Chatbot Arena, um ranking muito consultado por pesquisadores de IA para avaliar o desempenho relativo dos modelos de linguagem artificial.
“O rei se foi”, postou Nick Dobos, um desenvolvedor de software, ao comparar o GPT-4 Turbo com o Claude 3 Opus em uma mensagem que viralizou nas redes sociais.
“Descanse em paz, GPT-4.”
O Claude 3 da Anthropic
Desde a inclusão do GPT-4 na Chatbot Arena em torno de 10 de maio de 2023 (o ranking começou em 3 de maio daquele ano), variações do GPT-4 sempre ocuparam as primeiras posições até este momento, o que faz da sua superação um evento marcante na ainda curta história dos modelos de linguagem de IA.
Um modelo menor da Anthropic, o Haiku, também tem recebido bastante atenção pelo seu desempenho no ranking.
“Pela primeira vez, os modelos mais avançados — Opus para tarefas complexas, Haiku para economia e eficiência — são de uma empresa que não é a OpenAI”, disse Simon Willison, pesquisador independente de IA, para a Ars Technica.
“Isso é positivo — a diversidade de empresas líderes nesse setor beneficia a todos. Mas vale lembrar que o GPT-4 já tem mais de um ano e só agora alguém conseguiu superá-lo.”