porta azul trancada com cadeado com um adesivo de proibidos robores colado
Unsplash/dizzydizz, Freepik/julia84

A era da inteligência artificial trouxe consigo avanços tecnológicos notáveis, como ChatGPT e Google Gemini, antigo Bard, sistemas de processamento de linguagem natural que permitem a máquina entender e gerar texto de forma quase humana. Enquanto essas ferramentas são úteis em muitos aspectos, algumas preocupações de privacidade e violação de direitos autorias podem surgir quando se trata de proteger o conteúdo de um site. Neste artigo, exploremos como impedir ChatGPT e Gemini de lerem o seu site.

ChatGPT e Gemini: Quem são eles?

Antes de discutirmos como bloquear essas IA, é importante entender o que são o ChatGPT e o Gemini.

ChatGPT

O ChatGPT é um chatbot baseado em GPT, um modelo de linguagem desenvolvido pela OpenAI, treinado para entender e gerar texto em linguagem natural. Ele é amplamente utilizado em aplicações de chatbots e assistentes virtuais. A OpenAI disponibiliza uma API que permite a integração do ChatGPT em diversos produtos e serviços.

O GPT é treinado em duas etapas:

  1. Pré-treinamento: O modelo é treinado em um grande conjunto de textos da internet para aprender a língua natural e o conhecimento humano geral, usando uma rede neural chamada Transformer.
  2. Ajuste Fino: O modelo é refinado em tarefas específicas, usando dados rotulados, para torná-lo especializado em tarefas como tradução ou resposta a perguntas. Isso o torna versátil e aplicável em várias áreas.

Gemini

O Gemini é uma tecnologia semelhante, baseada no modelo de inteligência artificial generativa PaLM 2, desenvolvida pelo Google, que também é capaz de entender e gerar texto de maneira natural a partir do treinamento com milhões de textos disponíveis abertamente na internet. Ele pode ser usado em gemini.google.com, mas o Google já promete integrar a ferramenta a outros serviços da empresa, como o Google Docs.

Bloqueando o ChatGPT e o Gemini

Existem alguns métodos para bloquear o acesso de um ou mais agentes a um site.

Arquivo robots.txt

Uma maneira eficaz de bloquear bots de busca, incluindo o ChatGPT e o Gemini, é por meio do arquivo robots.txt. Este arquivo é colocado na raiz do seu site e instrui os bots sobre quais partes do site eles podem ou não rastrear e indexar.

User-agent: GPTBot
Disallow: /

User-agent: Google-Extended
Disallow: /

No exemplo acima, estamos bloqueando tanto o ChatGPT (GPTBot) quanto o Gemini (Google-Extended) de acessar qualquer parte do site. No entanto, lembre-se de que bots de boa fé, como os mecanismos de busca, geralmente respeitam as diretrizes do robots.txt, mas nem todos os bots o fazem.

O Google-Extended é um crawler criado pelo Google para melhorar o modelo de inteligência artificial generativa por trás do Gemini e das APIs do Vertex AI.

Leia também: Criando um arquivo robots.txt perfeito para SEO

Bloqueio por endereço IP

Bloquear endereços IP específicos conhecidos por pertencerem a bots indesejados pode ser uma estratégia eficaz. No entanto, essa abordagem requer monitoramento contínuo e pode resultar na exclusão de visitantes legítimos se não for implementada com cuidado.

Estes são os IPs conhecidos do GPTBot:

20.15.240.64/28
20.15.240.80/28
20.15.240.96/28
20.15.240.176/28
20.15.241.0/28
20.15.242.128/28
20.15.242.144/28
20.15.242.192/28
40.83.2.64/28

O bloqueio pode ser feito no painel de controle do servidor que hospeda o seu site ou no gerenciador de DNS do domínio, caso você use serviços como a CloudFlare. A opção de bloqueio de IP, geralmente, está dentro das opções de Firewall.

Autenticação de Usuário

Outra abordagem para limitar o acesso ao seu site é a autenticação de usuário. Exigir que os visitantes façam login antes de acessar o conteúdo pode ser eficaz em impedir que bots acessem informações sensíveis. Muitos sistemas de gerenciamento de conteúdo (CMS), como WordPress, oferecem recursos integrados de autenticação de usuário que podem ser configurados de acordo com suas necessidades.

Recaptcha e Captchas

A implementação de sistemas de verificação humana, como o Recaptcha do Google, pode ajudar a proteger seu site contra acessos automatizados. Esses sistemas exigem que os visitantes realizem ações que são fáceis para humanos, mas difíceis para bots, como resolver quebra-cabeças visuais ou responder a perguntas específicas.

O equilíbrio entre privacidade e visibilidade

É importante observar que, ao bloquear o acesso de bots como o ChatGPT e o Gemini, você também pode limitar a visibilidade do seu site nos mecanismos de busca. Portanto, é essencial encontrar um equilíbrio entre a proteção da privacidade e a garantia de que seu conteúdo seja acessível para os usuários legítimos e para as pesquisas orgânicas.

Atualização: Em fevereiro de 2024, o Bard passou a ser chamado Gemini, mesmo nome do modelo de linguagem criado pelo Google.