Estadão

Sites bloqueiam robôs que abastecem a IA

Diversos sites de grandes empresas, como Amazon, Reuters e <i>The New York Times</i>, bloquearam o GPTBot, robô da OpenAI, lançado no dia 8, que tem função de rastrear textos na internet para alimentar e treinar o ChatGPT. Até o dia 22 de agosto, ao menos 69 sites bloquearam o dispositivo, segundo análise da Originality.ai, empresa de verificação de conteúdos gerados por inteligência artificial (IA) e plágio.

Pelo menos 15% dos mil sites mais populares barraram o GPTBot nas últimas duas semanas. "O GPTBot foi lançado há 14 dias e a porcentagem dos mil principais sites que o bloqueiam aumenta constantemente", afirma a pesquisa.

A obstrução impede o uso do conteúdo protegido por direitos autorais para alimentar e treinar o chatbot de IA. "Propriedade intelectual é a força vital dos nossos negócios, e precisamos proteger os direitos autorais do nosso conteúdo", disse um porta-voz da agência de notícias Reuters ao jornal <i>The Guardian</i>.

A análise foi feita entre os dias 8 e 22 de agosto. Durante o estudo, foram analisados todos os arquivos robots.txt dos endereços selecionados para verificar se o GPTBot estava bloqueado ou não.

A discussão sobre os direitos autorais dos conteúdos usados por IAs generativas não é de hoje. Em janeiro, por exemplo, o banco de imagens Getty Images processou os criadores da IA Stable Diffusion por treinar o sistema usando imagens protegidas por direitos autorais.

O ChatGPT foi lançado em novembro do ano passado e deu início a uma onda de inteligências artificiais generativas capazes de gerar textos, imagens e até vídeos. Influenciadas pela nova tecnologia, grandes empresas, como Microsoft e Google, também passaram a investir mais nessa área.
As informações são do jornal <b>O Estado de S. Paulo.</b>

Posso ajudar?