Captura de um vídeo super realista feito por inteligência artificial mostrando um astronauta com capacete vermelho aberto no que parecer ser um planeta de gelo
OpenAi/Sora/Divulgação

A OpenAI, empresa responsável pelo desenvolvimento do ChatGPT, surpreendeu o mundo tecnológico ao lançar o Sora, um modelo de inteligência artificial capaz de criar vídeos realistas a partir de textos curtos. Essa inovação representa um avanço significativo na área de IA multimodal, combinando linguagem e visão computacional para gerar conteúdo visual impressionante.

O Sora utiliza uma técnica chamada “difusão”, que cria imagens a partir de pontos aleatórios. No início do processo, o vídeo tem uma aparência de ruído estático, semelhante ao efeito de TVs antigas sem sinal. No entanto, à medida que o modelo processa as informações do texto, ele transforma esses pontos em cenas altamente detalhadas, com movimentos de câmera complexos e personagens expressivos.

gif de um trecho do video de demostração do Sora mostrando três mamutes adultos caminhando sobre a neve em direção à câmera Vídeo de mamutes completamente gerado por AI (OpenAI/Sora/Digulgação)

*

As demonstrações do Sora incluem tanto animações quanto imagens com estilo realista. Surpreendentemente, nenhum vídeo foi gravado por humanos; todos foram gerados pela IA a partir de pequenos textos descritivos. Por exemplo:

Cena de Mamutes no Gelo: O vídeo que mostra um grupo de mamutes caminhando no gelo foi criado com a seguinte descrição: “Vários mamutes peludos gigantes se aproximam caminhando por um prado nevado, seu longo pelo lanoso balança levemente ao vento enquanto caminham, árvores cobertas de neve e montanhas dramáticas cobertas de neve ao longe, luz do meio da tarde com nuvens finas e um sol alto a distância cria um brilho quente, a visão baixa da câmera é impressionante, capturando o grande mamífero peludo com uma bela fotografia e profundidade de campo.”

Aplicações e desafios

O Sora tem potencial para revolucionar áreas como cinema, publicidade, educação e entretenimento. No entanto, a OpenAI está ciente dos riscos de uso indevido e promete adotar medidas de segurança antes de disponibilizar a ferramenta ao público. Pesquisadores estão analisando o modelo em relação a questões como desinformação, conteúdo de ódio e preconceito. Além disso, artistas visuais também têm acesso à ferramenta para explorar suas possibilidades criativas.

Exemplos

Veja alguns dos exemplos de vídeos criados usando o Sora e divulgados pela OpenAI.