Es deutete sich bereits an, nun scheint es sich zu bestätigen: Im Gespräch mit der « New York Times » betonte YouTube-Chef Neal Mohan Anfang April 2024 Il est très clair qu’il est contraire aux conditions d’utilisation de sa plateforme d’utiliser ses vidéos sans demander la formation des systèmes d’IA. Sa déclaration semblait faire référence à la question de savoir si la société OpenAI développerait son prochain générateur vidéo[–>Sora aurait pu être alimenté par des clips YouTube. Mohan n’a pas voulu le confirmer, mais a indiqué qu’il pourrait y avoir de graves conséquences juridiques. Maintenant, elle rapporte[–> »New York Times » (Paywall) citant des sources internes selon lesquelles OpenAI a en fait exploité YouTube à des fins de formation – mais pas pour Sora.
Die Tippgegeber stammen sowohl aus OpenAI- als auch aus Google-Kreisen und berichten übereinstimmend, dass das KI-Start-up rund eine Million Stunden Videomaterial verwendet habe, um seine Vorzeige-KI ChatGPT se remettre à flot. Après que l’entreprise ait introduit dans son système fin 2021 pratiquement tous les textes en langue anglaise disponibles gratuitement sur Internet, elle aurait commencé à transcrire des vidéos YouTube. Selon le rapport, l’entreprise a utilisé l’outil interne Whisper, qui convertit les mots prononcés en texte écrit. Ce faisant, OpenAI a très probablement violé les droits d’auteur des créateurs de vidéos et les conditions d’utilisation de YouTube. Ce qui est vraiment explosif, cependant, c’est que, selon Issern, la filiale de Google, YouTube, a remarqué le processus mais n’a rien fait pour empêcher l’utilisation non autorisée.
Auch Google nutzte YouTube-Videos für KI
Der Grund dafür ist wohl so simpel wie haarsträubend: YouTube wollte seinem Mutterkonzern offenbar nicht an den Karren fahren. Google hatte laut Bericht zu diesem Zeitpunkt bereits selbst YouTube-Videos verwendet, um seine eigenen KI-Systeme zu trainieren – und damit möglicherweise ebenfalls gegen das Urheberrecht verstoßen. Insbesondere in den USA häufen sich aktuell Urheberrechtsklagen gegen Betreiber von KI-Systemen. Die Rechtslage ist allerdings noch nicht abschließend geklärt. Firmen wie Google und Facebook lassen sich die Rechte zur Verwendung des bei ihnen hochgeladenen Materials zu KI-Trainingszwecken mittlerweile vorsorglich von Usern standardmäßig genehmigen.
Dennoch bleibt es Dritten weiterhin untersagt, die Inhalte für eigene Trainingszwecke abzuzweigen, sodass außer Frage stehen dürfte, dass OpenAI gegen YouTubes Regeln verstoßen hat. Dass die Videoplattform darauf vorerst nicht reagiert, könnte aber auch daran liegen, dass eine Million Stunden Videomaterial nur einen minimalen Prozentsatz des gesamten Videokontingents der Plattform ausmachen. Schon vor rund fünf Jahren gab YouTube an, dass User pro Minute rund 500 Stunden Videomaterial hochladen. Eine Million Stunden entsprechen also der Upload-Menge von weniger als anderthalb Tagen.