Meta se retrouve encore une fois au cœur d’une controverse majeure. La firme a récemment admis avoir utilisé une collection de livres piratés pour entraîner ses modèles d’intelligence artificielle (IA), ravivant ainsi les débats houleux sur les droits d’auteur et l’IA.
Cette révélation survient au milieu d’une action en justice initiée par plusieurs auteurs. Meta a confirmé avoir partiellement utilisé la base de données Books3, qui comprend de nombreux ouvrages piratés, pour développer ses modèles IA Llama. Books3, créée par Shawn Presser en 2020, est une base de données controversée rassemblant environ 37 Go de livres issus du site de piratage Bibliotik.
L’utilisation de Books3 par Meta et d’autres géants de la tech comme OpenAI pour affiner leurs modèles d’IA générative a soulevé de sérieuses questions juridiques. Plusieurs détenteurs de droits, y compris des auteurs, des maisons de disque, des artistes et même le New York Times, se sont manifestés contre l’utilisation de contenus protégés sans compensation. En réponse à la pression exercée par le collectif anti-piratage Rights Alliance, The Eye a retiré Books3 de sa plateforme en été 2023.
L’affaire a pris une tournure particulière lorsqu’en réponse à un procès intenté par des personnalités telles que Sarah Silverman et Richard Kadrey, Meta a admis avoir utilisé Books3 pour ses modèles Llama 1 et Llama 2. Cependant, la société a nié d’autres accusations et a invoqué le principe du fair use comme ligne de défense. Cette doctrine juridique permet l’utilisation de matériel protégé sans la permission des détenteurs des droits dans certaines circonstances spécifiques. Meta soutient qu’elle n’avait pas besoin de consentement ni de compensation pour utiliser ces œuvres protégées.
Cette affaire vient encore souligner un dilemme juridique et éthique croissant dans l’industrie de l’IA. Elle pourrait même atteindre la Cour suprême, et potentiellement établir de nouvelles normes juridiques pour le secteur.