Customize this title in frenchLe PDG de Google DeepMind pense qu’il est difficile de faire correspondre Sora d’OpenAI : rapport

Make this article seo compatible, Let there be subheadings for the article, be in french, create at least 700 words

  • Le PDG de Google DeepMind pense peut-être que le générateur texte-vidéo d’OpenAI, Sora, a un avantage.
  • Demis Hassabis a déclaré à un collègue qu’il serait difficile pour Google d’égaler Sora, a rapporté The Information.
  • Ses commentaires interviennent alors que les grandes entreprises technologiques s’affrontent dans une course à l’IA pour créer des produits concurrents.

Demis Hassabis pense peut-être que le générateur texte-vidéo d’OpenAI est plus avancé que celui créé par sa propre entreprise.

Selon The Information, le PDG de Google DeepMind a récemment déclaré à un collègue qu’il pourrait être difficile pour Google d’égaler Sora d’OpenAI.

Sora peut générer des vidéos d’une durée maximale d’une minute pouvant consister en « scènes complexes avec plusieurs personnages », a déclaré OpenAI lors de son dévoilement. Les démos des vidéos générées par Sora sont devenues virales en février et ont semblé impressionner de nombreuses personnes.

Google possède son propre générateur de texte en vidéo, Lumiere, qu’il a révélé dans un document de recherche en janvier. Il peut générer des clips de cinq secondes avec une invite de texte.

La société, qui a récemment publié son modèle expérimental d’IA Gemini 1.5, a déclaré dans le document de recherche qu’il était crucial de créer des outils capables de détecter « les biais et les cas d’utilisation malveillants » pour garantir sa sécurité.

C’est parce qu’il existe un « risque d’utilisation abusive pour créer du contenu faux ou nuisible » avec Lumiere, et il a été confronté à un tel problème avec le générateur d’images de Gemini en février. Google a suspendu le déploiement de son générateur d’images après avoir produit des images de personnes de couleur dans des contextes historiquement inexacts.

Le point de vue de Hassabis sur Lumiere par rapport à Sora intervient alors que les grandes entreprises technologiques continuent dans une course à l’IA avec des produits concurrents. Mais pour remporter la victoire, il faut obtenir une quantité importante de données pour alimenter leurs systèmes et faire avancer la technologie.

La directrice de la technologie d’OpenAI, Mira Murati, a déclaré le mois dernier au Wall Street Journal qu’elle ne savait pas si Sora avait été formé sur des vidéos YouTube.

Le PDG de YouTube, Neal Mohan, a ensuite déclaré à Bloomberg la semaine dernière qu’il ne savait pas si OpenAI utilisait le contenu YouTube pour former son générateur vidéo. Il a ajouté que cela constituerait une « violation flagrante » des conditions d’utilisation de la plateforme.

Le New York Times a rapporté la semaine dernière qu’OpenAI avait utilisé des vidéos YouTube pour améliorer son outil de reconnaissance vocale Whisper, citant des sources anonymes.

Selon le rapport, OpenAI a transcrit plus d’un million d’heures de vidéos YouTube et le texte transcrit a été intégré dans son modèle GPT-4.

Google a également utilisé YouTube pour transcrire des vidéos et former ses modèles d’IA, a rapporté le Times. Cela pourrait enfreindre les droits d’auteur détenus par les créateurs de contenu.

Google DeepMind et OpenAI n’ont pas immédiatement répondu aux demandes de commentaires de Business Insider, formulées en dehors des heures normales de travail.

Source link -57