As empresas detentoras de ferramentas de Inteligência Artificial (IA) generativa fazem hoje uso do jornalismo para a produção de conteúdo sem que haja, no momento, qualquer intenção do reconhecimento da propriedade intelectual (PI) dos editores e um caminho para a remuneração aos veículos jornalísticos por esse serviço.
“A verdade é que todas essas atuais ferramentas de IA que geram conteúdo se baseiam no jornalismo como fonte”, diz Alan Jhonson, Diretor de Estratégia Digital na 5heads e com mais de 20 anos de experiência em comunicação digital. “No entanto, há um problema: ao contrário dos motores de busca, essas ferramentas não fornecem links diretos para os portais de onde obtêm informações para oferecer uma resposta”, assinala, reforçando que falta transparência na forma como os dispositivos utilizam os conteúdos jornalísticos.
O especialista afirma ainda que os jornais enfrentam grande complexidade na tarefa de bloquear o acesso dos crawlers de IA a seus conteúdos e não há certeza de sucesso. “Os programadores podem falsificar o campo ‘User-Agent’ (que normalmente está presente nos crawlers) nas solicitações”, destaca. “Ferramentas como o ChatGPT não deixam muito claro como coletam notícias, e também não possuem um user-agent como os mecanismos de busca tradicionais, que podem ser instruídos a não indexar determinado conteúdo”.
Por outro lado, o uso de IA nas redações já é uma realidade que se mostra eficaz em vários procedimentos típicos da indústria jornalística. “A IA já está desempenhando um papel fundamental na geração de informações altamente personalizadas. Permite a criação de newsletters exclusivas, bate-papos interativos que aumentam o tempo de utilização da ferramenta e até mesmo oferece assistentes pessoais exclusivos para cada usuário”, afirma. “Essas capacidades estão incentivando os usuários a consumirem conteúdo de forma mais significativa e a considerarem essas assinaturas como parte essencial de sua experiência”.
Leia abaixo a entrevista na íntegra.
Associação Nacional de Jornais (ANJ): A IA vai substituir a informação jornalística?
Alan Jhonson: Por enquanto, a inteligência artificial está em estágio inicial neste segmento. Portanto, não acredito que o jornalismo como um todo esteja ameaçado neste momento. No entanto, é de se esperar que, em algum momento, algumas grandes empresas de tecnologia, como o Google e o Meta, que utilizam informações como base para seus usuários, se movimentem para coletar dados de redes sociais e gerar notícias em tempo real, escritas por IA, provenientes de várias fontes de usuários, mesmo antes de se tornarem virais.
ANJ: Como a IA pode ser usada de forma complementar?
Alan Jhonson: Hoje em dia, ferramentas como o ChatGPT, Bard, Chatsonic e outras podem ser de grande ajuda no lançamento de notícias com pautas mais leves, por exemplo, sobre como fazer bolo de laranja ou quem foi Zumbi de Palmares. Essas ferramentas são úteis não apenas para notícias sem uma base factual, mas também para notícias com uma agenda definida, resumos de notícias e geração de conteúdo personalizado com base em interesses e histórico de navegação.
Além disso, essas ferramentas podem auxiliar os editores a corrigirem textos de maneira mais rápida ou até mesmo criar uma base de texto que pode ser enriquecida posteriormente por um jornalista. Existem também ferramentas que podem gerar imagens genéricas quando necessário, como o DALL·E, o Midjorney, por exemplo, e até mesmo vídeos, como o Runway.
ANJ: Como os jornais podem se proteger da ingestão de seus conteúdos pela IA?
Alan Jhonson: A verdade é que todas essas atuais ferramentas de IA que geram conteúdo se baseiam no jornalismo como fonte. No entanto, há um problema: ao contrário dos motores de busca, essas ferramentas não fornecem links diretos para os portais de onde obtêm informações para oferecer uma resposta. O Bing é o único que está dando esse passo de responder perguntas e mostrar a fonte, embora ainda haja falta de transparência quanto à maneira como essas respostas são geradas e à forma como a IA consome, de forma gratuita, as informações geradas pelos grandes portais de notícias.
ANJ: É possível rastrear conteúdos dos jornais usados por sistemas de IA?
Alan Jhonson: Infelizmente, não. Existem até mesmo ferramentas que se orgulham de passar em qualquer teste de autenticidade. Embora haja um link para identificar textos gerados pelo ChatGPT, esse link não testa textos gerados no Bing, Bard, Chatsonic, entre outros.
ANJ: Os jornais podem bloquear o acesso dos crawlers de IA a seus conteúdos? Como fazer isso?
Alan Jhonson: Essa é uma tarefa um pouco complexa, pois os programadores podem falsificar o campo ‘User-Agent’ (que normalmente está presente nos crawlers) nas solicitações. A forma mais segura de bloquear conteúdo é identificar com base na quantidade de acessos e padrões encontrados nos registros do servidor, e, em seguida, bloquear o IP ou faixa de IP correspondente. No entanto, é importante ter um conhecimento sólido sobre os dados, pois ocasionalmente você pode acabar bloqueando um acesso legítimo.
Ferramentas como o ChatGPT não deixam muito claro como coletam notícias, e também não possuem um user-agent como os mecanismos de busca tradicionais, que podem ser instruídos a não indexar determinado conteúdo.
ANJ: Alguns jornais começam a mudar seus Termos de Uso para desautorizar o uso não pactuada de seus conteúdos pela IA. Como deve ser essa mudança? Qual deve ser o teor dos novos termos de uso?
Alan Jhonson: Na verdade, acredito que, neste momento, ainda falta uma parceria entre as empresas de IA e os grupos jornalísticos. Seria benéfico para ambas as partes a capacidade de coletar grandes volumes de dados de informação para treinar a máquina, do ponto de vista das empresas de IA, e, do lado dos grupos jornalísticos, uma oportunidade adicional de monetização. No entanto, prevejo que essa questão seguirá um caminho semelhante ao que aconteceu com os motores de busca alguns anos atrás: uma discussão lenta e uma negociação contínua.
Um tópico relevante a ser considerado é a possibilidade de limitar a quantidade de notícias que a IA pode consumir, de acordo com um plano especificado pelos grupos jornalísticos. Isso seguiria a prática comum de muitas ferramentas de IA, que estabelecem limites para seus usuários.
ANJ: IA como ferramenta de alavancagem de assinantes já é ou será uma realidade?
Alan Jhonson: Certamente, a IA já está desempenhando um papel fundamental na geração de informações altamente personalizadas, semelhante ao que vemos na Netflix. Além disso, ela permite a criação de newsletters exclusivas, bate-papos interativos que aumentam o tempo de utilização da ferramenta e até mesmo oferece assistentes pessoais exclusivos para cada usuário. Essas capacidades estão incentivando os usuários a consumirem conteúdo de forma mais significativa e a considerarem essas assinaturas como parte essencial de sua experiência.
ANJ: Como usar essas ferramentas?
Alan Jhonson: Normalmente, as pessoas não estão tão acostumadas a conversar com uma “máquina”, mas o processo é muito semelhante a um chat comum, envolvendo perguntas e respostas. Um método que costumo utilizar quando busco respostas mais aprofundadas é pedir à máquina que me faça perguntas sobre o meu projeto. Isso ajuda a máquina a compreender o que preciso que ela responda e, assim, aprimorar a precisão da resposta que recebo.
Quanto à aplicação dentro do portal de notícias, a abordagem dependerá em grande parte da linguagem do Sistema de Gerenciamento de Conteúdo (CMS). Pode ser necessário realizar uma integração com o CMS existente ou desenvolver um microserviço separado. Essa escolha acabará se tornando uma decisão de infraestrutura mais do que uma questão de tecnologia.
Tanto o ChatGPT quanto o Bard disponibilizam uma API (com custos associados) para uso público, o que significa que podemos utilizar essa engine, por exemplo, para criar nossas próprias notícias, newsletters, imagens, vídeos, etc.
Sobre o entrevistado
Alan Jhonson é Diretor de Estratégia Digital na 5heads, graduado em Publicidade, Psicologia e Sistemas de Informação, com mais de 20 anos de experiência em Comunicação Digital. Tem especialização em gestão de grandes portais e é apaixonado por métricas, Business Intelligence, SEO, CRM, mídia paga, programática e redes sociais.