Selon le New York Times, certaines entreprises auraient potentiellement enfreint les droits d'auteur des créateurs YouTube. Quelles pourraient être les conséquences de telles violations ?
- OpenAI et Google auraient utilisé des vidéos YouTube pour entraîner leurs IA, potentiellement enfreignant les droits d’auteur.
- OpenAI aurait transcrit plus d’un million d’heures de vidéos YouTube pour entraîner GPT-4.
- Google aurait également utilisé des vidéos YouTube pour entraîner ses propres modèles IA.
- Google aurait modifié sa politique de confidentialité en juin 2022 pour couvrir l’utilisation de contenu public pour entraîner ses IA.
Utilisation controversée de YouTube par OpenAI et Google
Selon une récente révélation du New York Times, OpenAI et Google ont utilisé des vidéos YouTube pour entraîner leurs modèles d’intelligence artificielle, ce qui pourrait constituer une violation des droits d’auteur des créateurs de contenu. Ce rapport arrive quelques jours seulement après une interview du PDG de YouTube, Neal Mohan, avec Bloomberg Originals, dans laquelle il déclarait que l’utilisation supposée de vidéos YouTube par OpenAI pour entraîner son nouveau générateur de texte en vidéo, Sora, irait à l’encontre des politiques de la plateforme.
OpenAI et le cas GPT-4
Le NYT a indiqué que OpenAI a utilisé son outil de reconnaissance vocale, Whisper, pour transcrire plus d’un million d’heures de vidéos YouTube. Ces transcriptions ont ensuite été utilisées pour entraîner le modèle de langage GPT-4. Greg Brockman, le président de OpenAI, aurait fait partie de cette équipe. Selon le porte-parole de Google, Matt Bryant, l’extraction ou le téléchargement non autorisé de contenu YouTube ne sont pas autorisés. Il a également affirmé au NYT que Google n’était pas au courant d’une telle utilisation par OpenAI.
Google et l’entraînement de ses propres modèles IA
Le rapport du NYT prétend cependant que certains employés de Google étaient au courant de cette situation, mais n’ont pas pris de mesures contre OpenAI, car Google utilisait également des vidéos YouTube pour entraîner ses propres modèles d’IA. Google a affirmé au NYT qu’il n’utilise que des vidéos de créateurs qui ont accepté de participer à un programme expérimental. Google a également modifié sa politique de confidentialité en juin 2022 pour englober une utilisation plus large du contenu public, y compris Google Docs et Google Sheets, pour entraîner ses modèles d’IA et ses produits.
L’avis de la rédaction
Ces révélations soulignent l’importance de la transparence et du respect des droits d’auteur dans le domaine de l’intelligence artificielle. Il est essentiel que les grandes entreprises technologiques agissent de manière responsable et respectueuse envers les créateurs de contenu dont elles utilisent les œuvres pour entraîner leurs modèles d’IA. À l’ère du numérique, la propriété intellectuelle doit être protégée, et il est urgent de mettre en place des mesures de contrôle adéquates pour prévenir de telles violations.