Reddit, Quora e Stack Overflow vendem conteúdo para OpenAI e Google
Centenas de milhões de postagens criadas por usuários das redes sociais serão usadas para treinar inteligências artificiais como o GPT e o Gemini
Nos últimos meses, as redes sociais Reddit e Quora, firmaram acordos com a OpenAI, criadora do ChatGPT, para fornecer o conteúdo criado pelos usuários para treinar seus grandes modelos de linguagem (LLMs). Nesta semana, foi a vez do Stack Overflow se juntar ao grupo.
Embora os termos de uso dessas plataformas provavelmente permitam esse tipo de compartilhamento de dados, a iniciativa levanta questões éticas, já que muitos usuários contribuem com conteúdo esperando apenas interação e aprendizado mútuo. Além disso, algumas plataformas tomaram medidas que dificultam o acesso de terceiros a esses dados, como o bloqueio de acesso às APIs públicas, o que gera questionamentos sobre a transparência e a real intenção por trás desses acordos.
Reddit lucrando com o conteúdo dos usários?
Pouco antes de abrir seu capital, no final de março, o Reddit anunciou uma parceria com o Google para permitir que a empresa explore e treine inteligências artificiais, como o Gemini, com o conteúdo dos seus fóruns, conhecidos como subreddits, que têm um total de mais de 82 milhões de usuários ativos.
O valor do acordo não foi divulgado, mas estima-se que seja de US$ 60 milhões por ano, o que é considerado relativamente baixo. Especialmente se levarmos em conta o valor estratégico desse tipo de conteúdo para o desenvolvimento de IA e o fato de o Google pagar à Mozilla mais de US$ 400 milhões anuais para ser o buscador padrão do Firefox, que tem uma participação de mercado bem menor.
Além disso, a recente decisão do Reddit de fechar sua API pública gera dúvidas sobre o real interesse da plataforma em lucrar com o licenciamento de conteúdo. Afinal, dificultar o acesso de aplicativos e ferramentas de terceiros parece contraditório a uma estratégia de monetização baseada em dados.
Nesta terça (7), a empresa já perdeu US$ 575 milhões de valor de mercado desde que disponibilizou suas ações na Bolsa, apesar de divulgar um lucro 48% maior (US$ $243 milhões) no primeiro trimestre fiscal, que vai de outubro a dezembro, nos E UA.
Quora e sua colaboração com a OpenAI
Em novembro de 2023, a OpenAI viveu um momento de turbulência com a demissão e posterior recontratação de seu CEO e co-fundador, Sam Altman. Adam D’Angelo, CEO do Quora e membro do conselho da OpenAI na época, se manteve em sua posição durante toda a crise.
Esse episódio coincidiu com um período de grandes investimentos do Quora em inteligência artificial. A empresa lançou o Poe (sigla para Plataforma para Exploração Aberta), que tem o modelo GPT-4, da OpenAI, e o Claude-V1.2, da Anthropic, como bases, e são treinados com dos dados de milhões de perguntas e respostas criadas pelos usuários da plataforma.
Veja também: Claude 3: um modelo de Inteligência Artificial que promete superar GPT-4 e Gemini
D’Angelo minimizou a possibilidade de competição com a OpenAI e já destacou a importância da colaboração entre as duas organizações. Até onde essa colaboração vai, não sabemos.
Stack Overflow fornece dados para treinar IAs
Nessa segunda-feira (6), foi a vez do Stack Overflow, o mais popular fórum de programação do mundo, anunciar uma parceria com a OpenAI para fornecer dados através da sua API. Essa colaboração visa aprimorar os modelos de linguagem da OpenAI, com o GPT-4, com o conteúdo técnico presente na plataforma e, ao mesmo tempo, oferecer aos usuários do ChatGPT acesso a respostas validadas pela plataforma.
Através da API do Stack Overflow, a OpenAI terá acesso a um vasto banco de mais de 24 milhões de perguntas e 35 milhões de respostas relacionadas a programação e desenvolvimento de software, criadas por uma base de 23 milhões de usuários registrados na plataforma. Além disso, poderá colher feedbacks da comunidade de desenvolvedores para melhorar o desempenho de seus modelos. Por sua vez, o ChatGPT passará a fornecer atribuições (citações com links) ao Stack Overflow sempre que o usuário fizer perguntas técnicas ou relacionadas a código.
Veja também:
- Stack Overflow é adquirido pela Prosus por US$ 1,8 bilhão
- Substack lança funcionalidade “Notes” para concorrer com o Twitter
O Stack Overflow utilizará os modelos de linguagem avançada da OpenAI para expandir o Overflow AI, ferramenta de pesquisa com recursos de inteligência artificial anunciada em 2023. O Overflow AI tem como objetivo implementar buscas por linguagem natural no Stack Overflow.
Vale ressaltar que essa não é a primeira parceria do Stack Overflow relacionada à inteligência artificial. Em fevereiro de 2024, a empresa firmou um acordo com o Google para disponibilizar o recurso Gemini aos usuários, oferecendo sugestões de código diretamente do Stack Overflow.
Há anos, o Stack Overflow se consolidou como a principal plataforma para consulta de dúvidas relacionadas a programação. Apesar de um grande investimento em contratações em 2022, a empresa surpreendeu o mercado ao demitir 28% de seu quadro funcional em outubro do mesmo ano. Os motivos para o corte não foram divulgados, mas a decisão coincidiu com o crescente interesse em ferramentas de programação assistidas por IA. Inclusive, em 2022, o Stack Overflow chegou a banir temporariamente o compartilhamento de respostas geradas pelo ChatGPT em seu site, mas logo mudou de ideia. Eu me pergunto o que pode ter feito a empresa repensar essa decisão.