A Encyclopedia Britannica, responsável pela famosa enciclopédia e pela marca Merriam-Webster, entrou com um processo contra a OpenAI, acusando-a de violação de direitos autorais. A ação alega que a OpenAI utilizou artigos e verbetes da enciclopédia e do dicionário sem autorização ou compensação financeira para treinar seus modelos de linguagem, como o ChatGPT.
Quais são as acusações contra a OpenAI?
De acordo com informações do TecMundo, a Britannica afirma que os conteúdos gerados pelo ChatGPT são “substancialmente similares” aos seus materiais. O processo destaca que o GPT-4 teria “memorizado” grande parte do conteúdo da enciclopédia, respondendo com “cópias quase idênticas de porções significativas” de texto. A editora apresentou comparações entre seus textos e as respostas da IA para demonstrar a alegada cópia.
Como a OpenAI responde às acusações?
Em resposta, a OpenAI declarou à Reuters que seus modelos “empoderam inovação e são treinados em dados publicamente disponíveis, baseados no princípio do uso justo (fair use)”. No entanto, essa não é a primeira vez que empresas de IA enfrentam processos relacionados a direitos autorais e ao uso de conteúdos no treinamento de suas plataformas.
Qual é o impacto do uso de IA nos direitos autorais?
O processo também aborda a questão do tráfego na web, alegando que a OpenAI “canibalizou” o tráfego dos sites da enciclopédia ao competir diretamente com seus serviços, em vez de direcionar usuários para a fonte original dos conteúdos. Essa situação levanta preocupações sobre o impacto das IAs no tráfego e na visibilidade de sites originais.
“Pedir permissão para usar conteúdos nessa etapa de treinamento ‘mataria’ a indústria”, afirmou um ex-executivo da Meta no ano passado, destacando a importância do uso dessas obras na programação de uma IA.
Fonte original: TecMundo