Titre : DeepSeek, le chatbot chinois, réalise davantage de tâches avec moins de GPU, une avancée saluée par Nvidia comme une excellente nouvelle.

Titre : DeepSeek, le chatbot chinois, réalise davantage de tâches avec moins de GPU, une avancée saluée par Nvidia comme une excellente nouvelle.

DeepSeek R1, un modèle de langage chinois, attire l’attention en rivalisant avec OpenAI tout en utilisant moins de ressources. Développé avec seulement 2 000 GPU H800 pour un coût de 6 millions de dollars, il met en question la nécessité d’une telle puissance pour l’IA. Cette avancée a impacté la valeur boursière de Nvidia, mais l’entreprise reste positive. DeepSeek pourrait favoriser une démocratisation de l’IA, rendant son développement plus accessible.

DeepSeek R1 : Une Révolution dans le Monde de l’IA

Le modèle de langage DeepSeek R1, développé en Chine, a récemment captivé l’attention en rivalisant, voire en surpassant, les performances d’acteurs majeurs comme OpenAI, tout en nécessitant un nombre nettement inférieur de GPU. Quelle est la réaction de Nvidia face à cette avancée ? Selon l’entreprise, R1 représente une ‘excellente’ nouvelle, soulignant ainsi la demande croissante pour ses puces d’accélération AI.

Des Performances Impressionnantes avec Moins de Ressources

Les chiffres sont révélateurs : le développement de DeepSeek a été réalisé avec seulement 2 000 GPU H800 de Nvidia et un budget d’entraînement de 6 millions de dollars. En comparaison, il est rapporté qu’OpenAI a utilisé 25 000 GPU A100 pour entraîner ChatGPT 4. Bien qu’il soit difficile d’établir une comparaison directe entre les modèles H800 et A100, il apparaît clairement que DeepSeek a réalisé davantage avec moins.

Cela a entraîné une réaction sur le marché boursier, où Nvidia a vu sa valeur boursière diminuer de 600 milliards de dollars cette semaine. Cette situation soulève des questions sur la nécessité de disposer autant de puces pour faire avancer l’IA. Nvidia, toutefois, reste optimiste, affirmant que DeepSeek illustre bien comment la technique de mise à l’échelle ‘Test Time’ peut mener à des modèles AI plus robustes.

Alors que certains experts estiment que DeepSeek pourrait dépenser entre 500 millions et 1 milliard de dollars par an, il est généralement reconnu que cette entreprise parvient à obtenir des résultats significatifs avec un investissement bien inférieur à celui de géants comme Microsoft, qui prévoit de dépenser 80 milliards de dollars cette année.

Ce changement de paradigme pourrait signifier une accessibilité accrue au développement de l’IA, rendant le domaine moins dominé par quelques acteurs extrêmement riches et ouvrant la voie à une démocratisation de la technologie. Qui sait, DeepSeek pourrait bien être le catalyseur d’une nouvelle ère dans l’intelligence artificielle.