Ilustração representando mentes interconectadas
Anthropic/Reprodução

A Anthropic lançou nesta quinta-feira (20) seu mais novo modelo, chamado Claude 3.5 Sonnet, que promete igualar ou superar o GPT-4 da OpenAI e o Gemini do Google em uma ampla gama de tarefas.

O Claude 3.5 Sonnet já está disponível para usuários do Claude na web e no iOS, e a Anthropic também o disponibilizou para desenvolvedores explorarem suas capacidades. Vale destacar a nomenclatura adotada pela empresa para seus modelos: Haiku para o menor, Sonnet para a opção intermediária e Opus para o mais avançado. E a Anthropic garante que o 3.5 Sonnet supera o 3 Opus com folga, além de ser duas vezes mais rápido.

É importante analisar benchmarks de IA com cautela. Afinal, existem muitos deles, com metodologias variadas, e o cenário muda rapidamente. No entanto, os resultados do Claude 3.5 Sonnet impressionam. O modelo superou o GPT-4o, o Gemini 1.5 Pro e o Llama 3 400B da Meta em sete de nove benchmarks gerais e quatro de cinco benchmarks de visão. Isso indica que a Anthropic criou um competidor forte na corrida da IA.

Mas o que isso significa na prática? A Anthropic afirma que o Claude 3.5 Sonnet terá um desempenho superior em diversas tarefas. Ele será capaz de escrever e traduzir códigos com mais eficiência, gerenciar fluxos de trabalho complexos, interpretar gráficos e tabelas com precisão, e até mesmo transcrever textos de imagens. Além disso, o novo Claude apresenta uma melhora significativa no entendimento de humor e na capacidade de escrita, aproximando-se ainda mais da linguagem natural humana.

Para acompanhar o lançamento do modelo, a Anthropic também introduziu um novo recurso chamado Artifacts. Através dele, os usuários poderão visualizar e interagir com os resultados das solicitações feitas ao Claude. Por exemplo, se você pedir para o modelo projetar algo, o Artifacts permitirá visualizar o projeto e editá-lo diretamente no aplicativo. Da mesma forma, emails gerados pelo Claude poderão ser editados na própria plataforma, sem necessidade de cópias para outros softwares. Embora pareça um recurso simples, o Artifacts revela a visão de longo prazo da Anthropic para o Claude.

A empresa tem focado seus esforços no mercado corporativo, apesar de contratar profissionais da área de tecnologia de consumo, como Mike Krieger, engenheiro brasileiro cofundador do Instagram. No comunicado oficial sobre o Claude 3.5 Sonnet, a Anthropic deixa claro seu objetivo de transformar o Claude em uma ferramenta para empresas “centralizar com segurança seus conhecimentos, documentos e trabalho em andamento em um espaço compartilhado”. Essa visão se assemelha mais a plataformas como Notion ou Slack do que ao ChatGPT, com os modelos da Anthropic como núcleo do sistema.

Rápida evolução

A velocidade de evolução impressiona. Em março, a Anthropic lançou o Claude 3 Opus, orgulhosa de seu desempenho equivalente ao GPT-4 e ao Gemini 1.0. Pouco tempo depois, OpenAI e Google lançaram versões aprimoradas de seus modelos. Agora, a Anthropic responde com o Claude 3.5 Sonnet, e a corrida pela liderança em IA certamente não vai parar por aí. O Claude pode não ser tão popular quanto o Gemini ou o ChatGPT, mas é um competidor de peso e merece ficar no radar do setor.

Na semana passada, a Apple anunciou a integração dos modelos GPT-3.5 e GPT-4 no iOS e MacOS para oferecer recursos de inteligência artificial nos dispositivos da marca rodando localmente. O Claude, assim como o Gemini, foi citado como modelo de IA que será integrado futuramente ao sistema “Apple Intelligence”, o que deve tornar as ferramentas de IA da Anthropic mais populares.

Como usar o Claude no Brasil?

Infelizmente, o Claude ainda não é acessível no Brasil, apesar de conseguir responder em português brasileiro, mas existem algumas formas de usar a ferramenta. A mais fácil é utilizando um aplicativo de VPN, mudando sua localização para um dos países onde o Claude funciona.

Outro método é através da ferramenta Merlin AI, que permite experimentar mais de 25 modelos diferentes de IA generativas em uma única interface no navegador – de graça, mas com limite diário de interações. O Poe é um serviço similar, mas também com limitações.