Meta, dona do Facebook, lança modelo de inteligência artificial de código aberto
O LLaMA 2 já está disponível para uso comercial e gratuito no Microsoft Azure, AWS e outros provedores
Atualizado em
A Meta, proprietária do Facebook, causou um grande impacto no mundo da inteligência artificial ao anunciar o LLaMA 2 (Large Language Model Meta AI), um modelo de linguagem de código aberto. Diferentemente de seu antecessor, o LLaMA 2 não apenas está disponível para uso comercial, mas também é gratuito. Esta revelação foi feita no cenário da conferência Microsoft Inspire, e a Microsoft mostrou apoio ao LLaMA 2.
Esse anúncio sacudiu o campo em constante evolução da IA generativa, oferecendo uma alternativa gratuita às empresas que desejam adotar a IA, enquanto anteriormente tinham que considerar opções comerciais, como o ChatGPT, da OpenAI, ou produtos concorrentes, como Cohere.
Rumores sobre o LLaMA 2 já circulavam na indústria há algum tempo, com senadores dos EUA questionando a disponibilidade desse modelo de IA. A primeira versão do LLaMA era destinada a acadêmicos e pesquisadores, com uma licença de pesquisa. No entanto, a divulgação dos detalhes subjacentes ao LLaMA gerou controvérsias e uma investigação governamental. Agora, com o LLaMA 2, a Meta coloca de lado essas polêmicas e avança com um modelo mais poderoso, amplamente disponível e capaz de revolucionar o cenário de modelos de linguagem grandes (LLMs).
A Microsoft Investe na IA
O modelo LLaMA 2 está sendo disponibilizado na plataforma Microsoft Azure. Isso é notável, uma vez que o Azure também é a casa da OpenAI, concorrente da Meta, e da família de LLMs GPT-3/GPT-4. A Microsoft é investidora tanto na Meta, antiga proprietária do Facebook, quanto na OpenAI.
Mark Zuckerberg, fundador e CEO da Meta, expressou entusiasmo pelo fato de o LLaMA ser de código aberto. Ele destacou o histórico da Meta em contribuições para código aberto, especialmente na área de IA com o framework de aprendizado de máquina PyTorch. Zuckerberg enfatizou que o código aberto impulsiona a inovação, permitindo que mais desenvolvedores explorem novas tecnologias e, ao mesmo tempo, melhora a segurança, pois mais pessoas podem inspecionar e corrigir problemas em software aberto.
Yann LeCun, vice-presidente e cientista-chefe de IA da Meta, também celebrou o lançamento de código aberto do LLaMA 2 no Twitter, destacando que isso mudará o cenário do mercado de LLMs. Ele mencionou que o LLaMA 2 estará disponível não apenas no Microsoft Azure, mas também na AWS, Hugging Face e outros provedores.
O Que Traz o LLaMA 2?
O LLaMA é um modelo de linguagem baseado em transformadores, projetado para tarefas generativas. A primeira versão, LLaMA 1, foi detalhada publicamente em fevereiro e possuía 65 bilhões de parâmetros, sendo capaz de executar uma ampla variedade de tarefas de IA generativa.
Por outro lado, o LLaMA 2 oferece diferentes tamanhos de modelo, incluindo versões com 7, 13 e 70 bilhões de parâmetros. A Meta afirma que esses modelos pré-treinados foram treinados em um conjunto de dados muito maior, 40% maior do que o usado para o LLaMA 1. Além disso, o LLaMA 2 tem um contexto expandido de até dois trilhões de tokens, o dobro do contexto do LLaMA 1. Além do treinamento aprimorado, a Meta afirma que o LLaMA 2 supera seu antecessor em benchmarks de desempenho.
Ênfase na Segurança
O LLaMA 2 não se destaca apenas pelo aumento de potência, mas também por suas medidas de segurança. O modelo passa por uma fase inicial de pré-treinamento com dados disponíveis publicamente. Em seguida, segue para uma série de etapas de ajuste fino supervisionado (SFT). Como camada adicional de segurança, o LLaMA 2 é aprimorado com um ciclo de aprendizado por reforço a partir do feedback humano (RLHF).
O artigo de pesquisa da Meta sobre o LLaMA 2 detalha as medidas abrangentes adotadas para garantir a segurança e minimizar possíveis preconceitos no modelo. O documento enfatiza a importância de entender os dados de pré-treinamento para aumentar a transparência e identificar possíveis problemas futuros, como viéses, auxiliando na tomada de decisões responsáveis no uso do modelo.
A iniciativa da Meta de disponibilizar o LLaMA 2 como código aberto e de investir em medidas de segurança robustas representa um marco significativo no campo da IA. Essa oferta gratuita pode ter um impacto substancial em setores que buscam adotar a IA em suas operações. Com o LLaMA 2, a Meta oferece uma ferramenta poderosa, aberta e segura para impulsionar a inovação e o progresso no campo da inteligência artificial.