Customize this title in frenchAffirmation : OpenAI a utilisé YouTube pour former GPT-4 !

Make this article seo compatible,Let there be subheadings for the article, be in french, create at least 700 words

Selon le New York Times, OpenAI a utilisé plus d’un million de vidéos YouTube pour entraîner GPT-4, sachant qu’il pourrait s’agir d’une violation du droit d’auteur.

Bien que les modèles d’intelligence artificielle nous laissent constamment bouche bée, ces outils soulèvent certains points d’interrogation. L’une d’elles concerne les données utilisées pour la formation. Utilisation des données sans autorisation violation des droits d’auteur Il peut causer

Un rapport partagé par le New York Times attire également l’attention sur ce point. Selon l’affirmation partagée dans l’actualité, OpenAI travaille à former le modèle d’intelligence artificielle. Il a utilisé les données de Google.

Plus d’un million d’heures de vidéos YouTube ont été utilisées pour entraîner GPT-4

L’affirmation du NYT a révélé qu’OpenAI bénéficiait d’une quantité importante de données YouTube. Ainsi, le géant de l’intelligence artificielle, Chuchoter avec un outil de reconnaissance vocale appelé à partir d’un million d’heures a transcrit de nombreuses vidéos YouTube et les a compilées en utilisant le modèle linguistique le plus avancé. Lors de la formation de GPT-4 utilisé.

De plus, l’entreprise savait que cette situation pouvait soulever des questions juridiques, mais ça ne posera aucun problème Il a également été rapporté qu’il y réfléchissait. Il a été affirmé que Greg Brockman, qui était président de la société, avait également participé à la collecte des vidéos. L’article du Times ajoute qu’OpenAI a épuisé les ressources utilisées pour s’entraîner en 2021, puis a commencé à discuter de son projet de transcrire le contenu YouTube. Jusque-là, l’entreprise utilisait des codes de Github, des bases de données d’échecs et du contenu scolaire de Quizlet.

Matt Bryant, porte-parole de Google, propriétaire de YouTube, a déclaré à The Verge qu’il avait vu des « rapports non confirmés » sur la question et que de telles utilisations non autorisées Interdit Il a déclaré que c’était le cas. Aussi, comme nous l’avons partagé avec vous, il y a quelques jours, le PDG de YouTube, Neal Mohan, a annoncé que la plateforme utiliser leurs données serait une violation il a déclaré. Mohan, le nouveau modèle d’OpenAI celui de Sora Il a fait une telle déclaration en raison d’allégations selon lesquelles il aurait été formé sur YouTube.

NOUVELLES CONNEXES

Avertissement sévère de YouTube à OpenAI : n’utilisez pas de vidéos YouTube pour entraîner Sora !

Google a lui-même formé des modèles avec des données YouTube

En dehors de cela, il existe des informations selon lesquelles Google collecte lui-même des données sur YouTube. Porte-parole Bryant : Conformément aux accords de Google avec les producteurs de contenu former leurs propres modèles Il a déclaré avoir utilisé du contenu YouTube. Pour cette raison, il a également été affirmé qu’il n’avait pris aucune mesure contre OpenAI.

Toutes ces affirmations révèlent un autre visage de l’intelligence artificielle. L’utilisation non autorisée des données peut potentiellement créer des problèmes majeurs de violation du droit d’auteur. Nous attendrons de voir ce qui se passera concernant ce problème.

NOUVELLES CONNEXES

OpenAI a développé de nouveaux outils qui rendent ChatGPT beaucoup plus performant

NOUVELLES CONNEXES

Un « appareil physique » sera publié pour ChatGPT : Sam Altman recherche un financement

NOUVELLES CONNEXES

Apple aurait signé un accord de « 50 millions de dollars » avec Shutterstock : mais pourquoi ?



Source link -57