Des créateurs demandent à Ottawa de protéger leurs droits d’auteur face à l’IA

Par Anja Karadeglija, La Presse Canadienne 6:45 PM - 30 juin 2024

Temps de lecture :

Une personne écrit sur un ordinateur portable lors d’une table ronde sur l’intelligence artificielle (IA) à laquelle participent des experts et des dirigeants de l’IA de partout au Canada, à Gatineau, au Québec, le lundi 27 mai 2024. LA PRESSE CANADIENNE/Sean Kilpatrick

Des créateurs et éditeurs canadiens veulent que le gouvernement fasse quelque chose contre l’utilisation non autorisée et généralement non signalée de leur contenu pour former des systèmes d’intelligence artificielle (IA) générative.

Mais les entreprises d’IA soutiennent que l’utilisation de ce matériel pour entraîner leurs systèmes ne viole pas le droit d’auteur, et affirment que limiter son utilisation entraverait le développement de l’IA au Canada.

Les deux parties font valoir leurs arguments dans des soumissions récemment publiées dans le cadre d’une consultation sur le droit d’auteur et l’IA menée par le gouvernement fédéral, qui examine la manière dont les lois canadiennes sur le droit d’auteur devraient répondre à l’émergence d’IA génératives comme ChatGPT et Claude.

L’IA générative peut créer du texte, des images, des vidéos et du code informatique sur la base d’une simple demande, mais pour ce faire, les systèmes doivent d’abord étudier de grandes quantités de contenu existant.

Dans son mémoire adressé au gouvernement, Access Copyright a soutenu que la plupart, et potentiellement tous les grands modèles linguistiques, «profitent actuellement de l’utilisation et de la reproduction non autorisées d’œuvres protégées par le droit d’auteur».

Cela se déroule dans une «boîte noire», selon Access Copyright, qui représente les écrivains, les artistes visuels et les éditeurs.

«Les titulaires de droits d’auteur savent que cela se produit, mais en raison de l’asymétrie d’information entre eux et les plateformes d’IA, ils ne peuvent pas déterminer qui mène l’activité, avec les œuvres de qui, et ne disposent d’aucun mécanisme pour l’empêcher de se produire.»

Music Canada, qui représente les principales maisons de disques du pays, a déclaré l’année dernière qu’une fausse chanson générée par l’IA imitant les voix de Drake et The Weeknd «montrait une chose très claire: les modèles et les systèmes d’IA ont déjà ingéré des quantités massives d’ensembles de données sans autorisation de la source des données ou des titulaires de droits».

La Guilde des écrivains du Canada a demandé au gouvernement de commencer à imposer des obligations de base aux entreprises d’IA en matière de divulgation et de déclaration. Elle indique que les développeurs ont toutes les connaissances sur le travail exploité et sur la manière dont il est utilisé, alors que les créateurs n’ont aucune de ces informations.

Certaines organisations ont signé des accords de licence avec des sociétés d’IA. Mais l’Association des auteurs canadiens a déclaré que les titulaires de droits se heurtent à «d’immenses obstacles» pour obtenir des licences sur leur contenu «parce qu’ils ne savent pas quelles œuvres sont utilisées» par quelles entreprises.

L’association a demandé au Canada de préciser que l’exploration de textes et de données est soumise aux lois sur le droit d’auteur.

De nombreuses poursuites sont en cours aux États-Unis concernant l’utilisation de matériels protégés par le droit d’auteur par des systèmes d’IA générative, dont une lancée cette semaine par les plus grandes maisons de disques du monde contre deux intelligences artificielles génératrices de musique.

L’Association canadienne des producteurs de médias (CMPA) a déclaré que des affaires judiciaires illustrent le problème posé par le manque de transparence, citant un cas dans lequel une entreprise en IA a soutenu que le titulaire des droits ne pouvait pas donner suite à l’allégation de violation à moins de pouvoir préciser le travail exact utilisé pour la formation.

«Les titulaires de droits seront également sans aucun doute confrontés à des problèmes de preuve similaires, car de nombreux ensembles de données utilisés pour former les systèmes d’IA générative sont prétendument détruits une fois la formation initiale terminée», indique le communiqué.

Le groupe a déclaré qu’il s’agissait d’une question qui «exige une attention immédiate» et a demandé au gouvernement de mettre en œuvre des exigences de transparence.

Le secteur de l’IA rétorque

Les sociétés d’IA soutiennent que le type de transparence que demandent les titulaires de droits n’est pas réaliste.

Microsoft a déclaré au gouvernement que la formation de systèmes d’IA à grande échelle implique de «vastes volumes» de données et que les entreprises ne devraient pas avoir à conserver de traces de ces données ni à divulguer le contenu utilisé pour la formation.

«Il ne serait pas possible d’enregistrer de telles informations et une telle exigence entraverait le développement de l’IA», a affirmé l’entreprise.

La société stipule qu’analyser des œuvres et apprendre des concepts et des faits ne constitue pas une «violation du droit d’auteur».

Google a déclaré que la formation d’IA est déjà exemptée en vertu de la loi actuelle sur le droit d’auteur, mais que le gouvernement devrait adopter une exemption pour rendre cela explicite.

Google a stipulé qu’exiger l’autorisation d’utiliser du contenu à des fins de formation exposerait des informations sensibles sur le plan concurrentiel et «bloquerait efficacement le développement et l’utilisation de grands modèles de langage et d’autres types d’IA de pointe».

La multinationale indique également que les développeurs d’IA n’ont pas accès à des informations précises sur le statut des droits d’auteur.

«En fait, une telle source de données unique n’existe nulle part dans le monde. Ainsi, se conformer aux règles de divulgation peut s’avérer tout simplement impossible dès le départ.»

La société canadienne d’IA Cohere a déclaré que l’utilisation de contenu pour former des systèmes d’IA fonctionne de la même manière que la façon dont un individu lit des livres pour devenir plus informé.

L’entreprise a assuré que le processus ne violait pas le droit d’auteur et a fait valoir que cela devait être clair dans la loi. Autrement, «les ambitions du Canada de devenir le foyer d’entreprises et d’écosystèmes d’IA de calibre mondial» pourraient être compromises.

Le Conseil canadien des innovateurs, qui représente le secteur technologique canadien, a indiqué que les exigences de divulgation nuiraient aux petites entreprises, par opposition à leurs rivales des grandes entreprises technologiques. Il prévient que cela «entraverait sérieusement le potentiel des entreprises canadiennes à se développer de manière significative».

Partager cet article