Home News Os criadores pedem que Ottawa force a divulgação do treinamento do sistema...

Os criadores pedem que Ottawa force a divulgação do treinamento do sistema de IA da ‘caixa preta’

11
0


Os criadores e editores canadenses querem que o governo faça algo a respeito do uso não autorizado e geralmente não relatado de seu conteúdo para treinar sistemas geradores de inteligência artificial.

Mas as empresas de IA afirmam que a utilização do material para treinar os seus sistemas não viola os direitos de autor e dizem que limitar a sua utilização impediria o desenvolvimento da IA ​​no Canadá.

Os dois lados estão defendendo seus argumentos em submissões publicadas recentemente para uma consulta sobre direitos autorais e IA que está sendo realizada pelo governo federal enquanto considera como as leis de direitos autorais do Canadá deveriam abordar o surgimento de sistemas de IA generativos como o ChatGPT da OpenAI.

A IA generativa pode criar textos, imagens, vídeos e códigos de computador com base em um simples prompt, mas para fazer isso, os sistemas devem primeiro estudar grandes quantidades de conteúdo existente.

Em sua submissão ao governo, a Access Copyright argumentou que a maioria e potencialmente todos os grandes modelos de linguagem “estão atualmente lucrando com o uso e reprodução não autorizados de obras protegidas por direitos autorais”.

Está acontecendo em uma “caixa preta”, segundo a Access Copyright, que representa escritores, artistas visuais e editores.

“Os titulares de direitos sabem que isso está acontecendo, mas devido à assimetria de informações entre eles e as plataformas de IA, eles não conseguem determinar quem está conduzindo a atividade, com quais obras, e não têm nenhum mecanismo para impedir que isso aconteça.”

A Music Canada, que representa as principais gravadoras do país, disse no ano passado que uma música falsa gerada por IA imitando as vozes de Drake e The Weeknd “deixou uma coisa bastante clara: modelos e sistemas de IA já ingeriram grandes quantidades de conjuntos de dados proprietários sem autorização”. da fonte dos dados ou dos titulares dos direitos.”

O Writers’ Guild of Canada pediu ao governo que começasse a implementar obrigações básicas de divulgação e relatórios. Ele disse que os desenvolvedores têm todo o conhecimento do trabalho que está sendo extraído e como ele está sendo usado, enquanto os criadores não têm nenhuma dessas informações.

Algumas organizações assinaram acordos de licenciamento com empresas de IA. Mas a Associação Canadense de Autores disse que os detentores de direitos enfrentam “imensos obstáculos” no licenciamento de seu conteúdo “porque são mantidos no escuro sobre quais de suas obras estão sendo usadas” e por quais empresas.

Solicitou ao Canadá que esclarecesse que a mineração de textos e dados está sujeita às leis de direitos autorais.

Numerosos processos judiciais estão em curso nos Estados Unidos sobre a utilização de materiais protegidos por direitos de autor por sistemas generativos de IA, incluindo um lançado esta semana pelas maiores editoras discográficas do mundo contra dois geradores de música de IA.

A Associação Canadense de Produtores de Mídia disse que os casos legais ilustram o problema colocado pela falta de transparência, citando um caso em que a empresa de IA argumentou que o detentor dos direitos não poderia prosseguir com a alegação de violação a menos que pudesse especificar o trabalho exato usado para o treinamento.

“Os titulares de direitos também enfrentarão, sem dúvida, problemas probatórios semelhantes, já que muitos conjuntos de dados usados ​​para treinar sistemas de IA generativa são supostamente destruídos após a conclusão do treinamento inicial”, afirmou.

O grupo disse que é uma questão que “exige atenção imediata” e pediu ao governo que implemente requisitos de transparência.

Mas as empresas de IA afirmam que o tipo de transparência que os detentores de direitos pedem não é realista.

A Microsoft disse ao governo que o treinamento de sistemas de IA em grande escala envolve “vastos volumes” de dados, e as empresas não deveriam ter que manter registros disso ou divulgar o conteúdo usado para treinamento.

“Não seria viável registar tais informações e qualquer exigência desse tipo inibiria o desenvolvimento da IA”, afirmou.

A empresa argumentou que não é “violação de direitos autorais analisar obras e aprender conceitos e fatos”.

O Google disse que o treinamento em IA já está isento pela lei de direitos autorais existente, embora o governo devesse adotar uma isenção para tornar isso explícito.

O Google disse que exigir permissão para usar conteúdo para fins de treinamento exporia informações competitivamente sensíveis e “bloquearia efetivamente o desenvolvimento e o uso de grandes modelos de linguagem e outros tipos de IA de ponta”.

Ele também disse que os desenvolvedores de IA não têm acesso a informações precisas sobre o status dos direitos autorais.

“Na verdade, não existe tal fonte de verdade em nenhum lugar do mundo. Assim, o cumprimento das regras de divulgação pode simplesmente revelar-se impossível desde o início.”

A empresa canadense de IA Cohere disse que o uso de conteúdo para treinar sistemas de IA funciona de forma semelhante à forma como um indivíduo lê livros para se tornar mais informado.

A empresa disse que o processo não viola direitos autorais e argumentou que isso precisa ficar claro na lei. Caso contrário, “as ambições do Canadá de ser o lar de empresas e ecossistemas de IA líderes mundiais” poderiam ser prejudicadas.

O Conselho de Inovadores Canadenses, que representa o setor de tecnologia canadense, disse que os requisitos de divulgação prejudicariam as empresas menores, em oposição aos seus rivais da Big Tech. Ele alertou que isso “prejudicaria seriamente o potencial de expansão significativa das empresas canadenses”.


Este relatório da The Canadian Press foi publicado pela primeira vez em 30 de junho de 2024.



Source link