Runway, la startup d’intelligence artificielle qui a formé ses algorithmes sur des milliers de vidéos YouTube sans autorisation
Un porte-parole de YouTube a fait remarquer à Engadget qu'une éventuelle infraction serait une 'violation flagrante' de ses conditions d'utilisation. Quelles pourraient être les conséquences d'une telle violation ?
Tl;dr
- Runway aurait utilisé des milliers de vidéos YouTube et des films piratés pour entraîner son IA.
- Des feuilles de calcul internes présumées indiquent des contenus de Disney, Netflix, Pixar et d’autres médias populaires.
- La société aurait utilisé des logiciels proxy pour télécharger les vidéos sans détection.
- Runway n’a pas répondu à une demande de commentaire à ce sujet.
Controverses autour de l’IA de Runway
La société d’IA Runway est sous le feu des projecteurs après avoir été accusée d’avoir exploité des milliers de vidéos YouTube et des films piratés sans autorisation pour entraîner son modèle Gen-3. D’après les informations obtenues par 404 Media, des feuilles de calcul internes présumées révèlent que la startup a fait appel à des contenus provenant de chaînes telles que Disney, Netflix, Pixar et d’autres médias populaires.
Des méthodes douteuses pour entraîner l’IA
Un ancien employé de Runway a confié à la publication que la société utilisait ces feuilles de calcul pour repérer les vidéos qu’elle souhaitait inclure dans sa base de données. Elle aurait ensuite téléchargé ces vidéos à l’insu de leurs propriétaires, en utilisant des logiciels proxy open-source pour dissimuler ses agissements. Une liste de près de 4 000 chaînes YouTube a ainsi été compilée, avec des « chaînes recommandées » telles que CBS New York, AMC Theaters, Pixar, Disney Plus, Disney CD et le Monterey Bay Aquarium.
Des résultats troublants
404 Media a constaté que lorsque l’on alimentait le générateur de vidéos avec les noms de certains YouTubers figurant dans la feuille de calcul, on obtenait des résultats étonnamment ressemblants. En revanche, le modèle Gen-2 de Runway, entraîné avant les données présumées de la feuille de calcul, génère des résultats sans rapport avec les YouTubers mentionnés. Après que la publication a contacté Runway à ce sujet, l’outil IA a cessé de générer ces ressemblances.
L’avis de la rédaction
Cette affaire souligne l’importance d’une régulation stricte des pratiques d’entraînement des IA. Si les allégations contre Runway sont avérées, elles mettent en lumière une course effrénée à la domination du marché, où le respect des droits d’auteur semble relégué au second plan. Pourtant, l’innovation ne doit jamais justifier le non-respect des règles éthiques et légales.