Au cœur de l'IA
4 minutes de lecture

Le droit d’auteur protège t il suffisamment les auteurs face à l’IA ?

Publié le
23/04/2024

Au menu aujourd’hui :

📙 Les droits d’auteurs autour de l’IA générative : à qui appartiennent les inputs et les outputs ?

🇪🇺 Le futur règlement européen AI Act protège-t-il les droits des auteurs ?

👁️ Quelles sont les grandes lignes de l’AI Act ?

👀 Où se renseigner - les sources recommandées par Thomas

🍰 MF : A qui appartiennent les données d’entrainement des IA?

👉 Thomas :

En principe, toute œuvre originale (image, photo, peinture, article, base de données, etc.) appartient à son auteur. L’auteur d’une photographie, par exemple, détient sur celle-ci des droits d’auteur lui permettant d’en autoriser ou interdire toute exploitation. A priori donc, toute utilisation d’une œuvre d’un auteur, y compris pour entrainer une IA, devrait être soumise à autorisation de l’auteur. Cependant, le code de la propriété intellectuelle prévoit une exception à ce monopole permettant aux entreprises entrainant des IA de collecter de façon automatique ces création si elles y ont été accédées de manière licite (par exemple sur un site internet public), sauf opposition formulée par l’auteur. Cette opposition peut être formulée notamment dans les CGU du site ou tout autre procédé lisible par machine, y compris des métadonnées.

En dehors de cette exception ou en cas d’opposition, l’utilisation de toute œuvre devrait donc être soumise à autorisation du titulaire des droits d’auteur. Juridiquement, il s’agira de conclure un contrat de licence autorisant l’utilisation de la création à des fins d’entrainement d’une IA. C’est par exemple ce qu’ont fait Le Monde et Open AI.

🍰 MF : A qui appartient l’output d’une IA générative?

👉 Thomas :

D’un point de vue juridique, on pourrait penser à 3 auteurs potentiels: le développeur du logiciel d’IA, les auteurs des données d’entrainement, et bien sûr l’auteur du prompt. La question mérite d’être posée car le critère juridique de protection par le droit d’auteur est l’”originalité” de l’œuvre, c’est à dire, selon la jurisprudence, que l’”empreinte de la personnalité de l’auteur” doit se refléter dans l’œuvre. Or, s’il semble assez évident qu’une part de l’auteur du prompt puisse se retrouver dans l’output, il ne peut être exclu que ceux qui ont contribué à la création de l’IA comme le développeur du logiciel ou les auteurs des œuvres utilisées pour alimenter l’IA s’y retrouvent également. D’ailleurs, une proposition de loi de septembre 2023 projette d’octroyer les droits d’auteur sur les output aux auteurs des œuvres antérieures utilisées pour entrainer l’œuvre générée. A ma connaissance, la jurisprudence française ne s’est pas encore prononcée sur cette question mais on peut rapprocher une décision récente de la Beijing Internet Court qui a refusé d’accorder les droits d’auteur sur une image aux développeurs de l’outil d’IA mais les a accordés à l’auteur du prompt. Cette décision se fondait sur la notion d’”investissement intellectuel”, qui ne semble a priori pas si éloignée de celle d’”empreinte de la personnalité de l’auteur”. L’US Copyright Office quant à lui a pu refuser la protection au motif d’une insuffisance d’intervention humaine dans la génération de l’output.

D’un point de vue philosophique, accorder la qualité d’auteur de l’output (et donc de titulaire des droits d’auteurs) à l’auteur du prompt ne semble pas dénué de sens puisque cela revient à accorder les droits à celui qui a eu l’intention de générer l’œuvre. Or, à certains égards, une œuvre d’art peut être qualifiée d’intention.

🍰 MF : Quelles sont les grandes lignes du nouveau règlement européen sur l’IA du point de vue du droit d’auteur?

👉 Thomas :

Du point de vue du droit d’auteur, l’apport principal de ce règlement est d’imposer au fournisseur d’IA de publier un résumé suffisamment détaillé des données utilisées pour l’entrainement. Le futur Bureau de l’IA devrait diffuser un modèle de ce résumé. L’objectif de cette transparence est en théorie de permettre aux auteurs de réclamer l’application de leurs droits. Mais reste à savoir si le résumé sera suffisamment détaillé pour permettre une telle réclamation.

Les gouvernements français, allemand et italien avaient sévèrement critiqué cette obligation, estimant qu’elle serait un frein important à l’innovation dans le domaine de l’IA.

🍰 MF : Ce règlement était il nécessaire?

👉 Thomas :

En ce qui concerne le droit d’auteur, un éclaircissement était en effet nécessaire. D’un côté, les créateurs craignaient de se voir spolier de leurs œuvres à cause de l’exception de fouille de texte. D’un autre côté, les fournisseurs d’IA ont un besoin vital de données dans des quantités très importantes pour alimenter leurs systèmes. La réponse de l’UE a finalement été d’imposer la publication d’un résumé sur les données d’entrainement. Bien qu’aucun modèle de résumé n’ait encore été publié, il est à craindre que cette obligation ne soit finalement satisfaisante pour personne. Si les artistes ne parviennent pas à y retrouver in extenso leurs créations, alors il y a fort à parier que ce résumé leur soit de peu d’utilité. A l’inverse, la publication d’un résumé, même peu détaillé, risque d’être perçu par les startups de l’IA comme une obligation assez lourde faisant craindre de potentielles actions en contrefaçon de droit d’auteur.

Mais le règlement a tout de même permis d’éditer d’autres règles sans lien avec le droit d’auteur. Ainsi, le règlement procède d’une approche par les risques en interdisant les systèmes d’IA les plus dangereux pour la sécurité et les libertés et en réglementant ceux qu’elle estime “à haut risque” ainsi que les IA à finalité générale dont on déduit de la définition qu’elles comprennent les LLM. Parmi les mesures emblématiques imposées aux IA à haut risque figurent par exemple l’obligation de mettre en place une gouvernance des données, d’établir une documentation, un système de gestion de la qualité ou encore la soumission à une procédure d’évaluation de la conformité menant à un marquage CE. Pour les IA à finalité générale, et en particulier les IA génératives, des obligations de transparence ont été adoptées. Par exemple, l’obligation d’informer les utilisateurs qu’ils interagissent avec une IA, l’obligation de marquer les outputs par un procédé lisible par machine ou d’informer sur le fait que des contenus ont été manipulés par une IA.

Finalement, le règlement tend plus à encadrer la sécurité d’IA considérées comme risquées et à imposer une certaine transparence qu’à protéger les créateurs. Le règlement était donc nécessaire mais, à mon avis, parviendra difficilement à concilier les intérêts des créateurs et des fournisseurs d’IA du point de vue des droits d’auteur.

🍰 MF : merci Thomas ! Est-ce que tu peux nous laisser les sources que tu recommandes pour aller plus loin sur le sujet ?

👉 Thomas :

  • https://artificialintelligenceact.eu/fr/

Très belle semaine à tous !

— l’équipe millefeuille.ai

Image graphique d'un millefeuille
Millefeuille.ai

Le média explorant l'impact de l'IA sur la société et les métiers, présenté par un collectif d'ingénieurs & entrepreneurs français.

Comprendre les enjeux de l’IA pour y prendre goût !

Millefeuille.ai c’est le recap quotidien de toutes les news sur l’IA !

Les newsletters du moment

Les ESN : Pilier Incontournable de l'Adoption de l'IA Générative

Aujourd’hui, vous pourrez découvrir plus en détail ce que sont les entreprises de services numériques (ESN).

5 minutes de lecture

Les Ops : Le Moteur Caché de la Transformation IA des Entreprises

Aujourd’hui, vous pourrez découvrir quelques analyses sur le métier d'Ops.

5 minutes de lecture

Réinventer les compétences dans un monde dominé par la Tech ! et ... l'IA !

Aujourd’hui, vous pourrez découvrir quelques analyses sur l'évolution des compétences sur le marché du travail à l'heure de l'IA et de la croissance de la tech dans notre quotidien.

5 minutes de lecture

La meilleure façon de prendre goût à l'IA.

Applications concrètes. Actualités. Analyses d'experts.
Si comme près de 5'000 personnes tu veux tout comprendre à l'IA, abonne-toi.