Ilustração de um robô rodeado de janelas de chat
Imagem: Shutterstock

Depois de meses de rumores e especulação, a OpenAI anunciou o GPT-4: o mais recente modelo de linguagem de AI em sua linha que alimenta aplicativos como ChatGPT e a nova busca do Bing.

A empresa afirma que o modelo é mais criativo e colaborativo do que nunca e pode resolver problemas difíceis com maior precisão. Ele pode analisar tanto entrada de texto quanto de imagem, embora só possa responder por meio de texto. A OpenAI também alerta que os sistemas mantêm muitos dos mesmos problemas dos modelos de linguagem anteriores, incluindo a tendência de inventar informações (ou “alucinar”) e a capacidade de gerar texto violento e prejudicial.

A OpenAI diz que já se associou a várias empresas para integrar o GPT-4 em seus produtos, incluindo Duolingo, Stripe e Khan Academy. O novo modelo está disponível para o público em geral por meio do ChatGPT Plus, a assinatura mensal de US$ 20 do ChatGPT, e está alimentando o chatbot do Bing, da Microsoft. Ele também estará acessível através de uma API para que desenvolvedores possam utilizá-lo em seus projetos — com uma lista de espera, no entanto.

Diferenças entre GPT-3 e GPT-4

Em um comunicado, a OpenAI disse que a distinção entre o GPT-4 e seu antecessor GPT-3.5 é “sutil” em uma conversa casual — o GPT-3.5 é o modelo que alimenta o ChatGPT.

A empresa informou que o modelo de linguagem GPT-4 pode ser “menos capaz que um humano em diversos cenários”, mas ela exibe desempenho em nível humano em “várias tarefas profissionais e acadêmicas”. A empresa usou como exemplo o desempenho da IA no exame de advogados dos Estados Unidos. Segundo a empresa, a tecnologia teve uma pontuação próxima das 10% melhores notas - ou nota superior a 90% dos outros candidatos. Em comparação, o GPT-3.5 ficou entre os 10% piores resultados.

A especulação sobre o GPT-4 e suas capacidades tem sido intensa nos últimos meses, com muitos sugerindo que seria um grande salto em relação aos sistemas anteriores. No entanto, julgando pelo anúncio da OpenAI, a melhoria é mais iterativa, como a empresa havia previsto anteriormente.

“As pessoas estão implorando para se decepcionarem e elas ficarão”, disse Altman em uma entrevista sobre o GPT-4 em janeiro.

Exemplos de respostas do GPT-4 Exemplos de respostas com GPT-4. (Imagem: OpenAI/Reprodução)

*

O rumor ganhou mais fôlego ainda na semana passada, depois que um executivo da Microsoft deixou escapar que o sistema seria lançado esta semana em uma entrevista à imprensa alemã. O executivo também sugeriu que o sistema seria multimodal - ou seja, capaz de gerar não apenas texto, mas outros tipos de mídia, como imagens e áudio. Essa capacidade multimodal seria um grande avanço na tecnologia de IA e poderia ter muitas aplicações em áreas como mídia, publicidade e entretenimento. No entanto, também há preocupações em relação ao potencial uso irresponsável de tal tecnologia e a necessidade de garantir que seja desenvolvida e usada de maneira ética e responsável. Ainda assim, muitos estão ansiosos para ver o que o novo sistema de IA da Microsoft pode fazer e como ele pode mudar a maneira como interagimos com a tecnologia.

Ética

À medida que a OpenAI e outras empresas continuam a desenvolver e aprimorar modelos de linguagem de IA, é importante considerar as implicações éticas de seu uso. O potencial desses sistemas para gerar conteúdo prejudicial ou tendencioso é uma preocupação séria, e esforços devem ser feitos para garantir que sejam desenvolvidos e implantados de maneira responsável.

Apesar dessas preocupações, o desenvolvimento do GPT-4 é uma conquista significativa no campo da IA. Sua capacidade de analisar tanto entradas de texto quanto de imagem e gerar respostas precisas representa um grande avanço no desenvolvimento de sistemas de IA mais capazes. À medida que a OpenAI e outras empresas continuam a empurrar os limites do que a IA pode fazer, podemos esperar ver ainda mais inovações impressionantes nos próximos anos.