2024 - Customize this title in frenchUh-Oh — On dirait que le modèle d'IA de ChatGPT est redevenu paresseux

Make this article seo compatible, Let there be subheadings for the article, be in french, create at least 700 words

Le modèle haut de gamme d’OpenAI a un problème : il semble continuer à devenir paresseux.
Les utilisateurs de GPT-4 se sont adressés au forum des développeurs d’OpenAI pour se plaindre.
Certains sont tellement frustrés qu’ils cherchent à rivaliser avec les modèles d’IA jusqu’à ce qu’il y ait une solution.

Le GPT-4 d’OpenAI semble être devenu paresseux – encore une fois.

Cette fois, cependant, les utilisateurs frustrés du modèle qui alimente le service payant de ChatGPT ne cherchent pas tous une solution rapide.

Ils se tournent plutôt vers d’autres modèles, un en particulier retenant leur attention : Claude d’Anthropic.

Le top model d’OpenAI semble toujours paresseux

Ces derniers jours, certains utilisateurs de GPT-4, qui a été publié pour la première fois en mars 2023, se sont rendus sur le forum des développeurs et sur les réseaux sociaux d’OpenAI pour s’exprimer sur le modèle qui semblait beaucoup moins performant qu’il ne l’était autrefois.

Certains se plaignent du fait qu’il ne suit pas les « instructions explicites » en fournissant du code tronqué lorsqu’on leur demande le code complet. D’autres citent des problèmes pour que le modèle réponde complètement à leurs requêtes.

« La réalité est qu’il est devenu inutilisable », a écrit la semaine dernière un utilisateur sur le forum en ligne d’OpenAI.

Ce n’est pas la première fois que les performances du modèle sont à la traîne. GPT-4 est censé être le meilleur produit d’OpenAI : une personne paie 20 $ par mois pour l’utiliser.

Comme mon collègue Alistair Barr l’a signalé pour la première fois, des signes indiquant que GPT-4 devenait plus paresseux sont apparus au cours de l’été de l’année dernière : le modèle semblait présenter une « logique affaiblie » et renvoyer de mauvaises réponses aux utilisateurs.

De nouvelles preuves de paresse sont apparues plus tôt cette année, le PDG d’OpenAI, Sam Altman, reconnaissant même que GPT-4 avait été relâché. Il a publié sur X en février qu’un correctif avait été publié pour répondre aux plaintes.

gpt-4 a démarré lentement sur ses résolutions du nouvel an mais devrait maintenant être beaucoup moins paresseux maintenant !

– Sam Altman (@sama) 4 février 2024

Cependant, à l’époque où les premiers signes de faiblesse sont apparus, aucune autre entreprise n’avait publié un modèle qui, du moins sur le papier, offrait des performances comparables à celles du GPT-4 d’OpenAI. Cela a maintenu les utilisateurs attachés à l’entreprise, ce qui a sans doute déclenché l’engouement pour l’IA générative de l’année dernière.

Ce n’est pas le cas actuellement.

Des alternatives GPT-4 émergent

Face à une nouvelle série de problèmes avec GPT-4, les utilisateurs peuvent expérimenter de nombreux autres modèles qui ont depuis émergé. Certains d’entre eux semblent non seulement correspondre à l’offre phare d’OpenAI, mais ils pourraient également la surpasser.

Prenez Claude d’Anthropic. Le rival d’OpenAI, soutenu par Google et Amazon, a publié plus tôt ce mois-ci une version premium de son modèle Claude appelée Claude 3 Opus. Considérez-le comme un équivalent de GPT-4.

Lors de sa sortie, Anthropic a partagé des données comparant les performances de Claude 3 Opus à celles de ses pairs sur plusieurs critères tels que « connaissances de premier cycle », « résolution de problèmes mathématiques », « code » et « évaluations mixtes ». Dans presque tous les cas, Claude est arrivé en tête.

Ce ne sont pas seulement les données d’Anthropic qui indiquent que son modèle est meilleur. Cette semaine, Claude 3 Opus a dépassé GPT-4 au classement de LMSYS Chatbot Arena, une plateforme ouverte d’évaluation des modèles d’IA.

Bien sûr, il y a une différence entre quelque chose qui semble bon sur papier et qui peut être mis en œuvre dans la pratique. Mais à la suite des problèmes de GPT-4, même les fidèles d’OpenAI ont été fortement incités à essayer des alternatives comme Claude.

Il est clair que beaucoup sont plus qu’impressionnés.

Après une séance de codage avec Claude 3 Opus la semaine dernière, un ingénieur logiciel a posté sur X qu’il pensait que cela écrasait GPT-4. « Je ne pense pas que les critères standards rendent justice à ce modèle », a-t-il écrit.

Je viens de passer une longue session de codage avec l’opus Claude 3 et il écrase absolument gpt-4. Je ne pense pas que les critères standards rendent justice à ce modèle

– Antoine (@abacaj) 19 mars 2024

Allie K. Miller, un investisseur providentiel en IA, a déclaré que GPT-4 semble être pire maintenant qu’il y a quelques mois. « La plupart des gens que je connais utilisent Claude 3 », a-t-elle écrit sur X, ainsi que sur le modèle Mixtral 8x7B de Mistral AI.

Ethan Mollick, un professeur de Wharton, a même trouvé que Claude 3 connaissait mieux les langues elfiques construites par JRR Tolkien, le sindarin et le quenya. « Lorsqu’on lui demande de traduire ‘Mon aéroglisseur est plein d’anguilles’, Claude 3 fait une traduction originale, GPT-4 effectue une recherche sur le Web », a-t-il écrit sur X.

Sur le forum des développeurs d’OpenAI, certains utilisateurs ont déclaré que Claude Opus 3 est beaucoup plus fiable en matière de codage et qu’il est similaire en termes de performances à GPT-4 lors de sa première sortie.

OpenAI n’a pas répondu à une demande de commentaires de Business Insider concernant les problèmes de performances de GPT-4.

Certains, comme Miller, ne pensent pas que ces problèmes suffisent à abandonner complètement OpenAI. La baisse des performances, a-t-elle déclaré, pourrait être due au fait que « OpenAI se concentre sur le prochain modèle » et pourrait y consacrer des ressources.

Cela pourrait être le cas. Comme mes collègues Kali Hays et Darius Rafieyan l’ont rapporté ce mois-ci, OpenAI est sur le point de publier GPT-5 d’ici le milieu de l’année.

Le moins qu’on puisse faire, c’est de ne pas être paresseux.

Source link -57

Les Steelers libèrent un joueur de la liste des blessés et réintègrent un vétéran le lendemain de son départ.

Des joueurs liés à une star de 146 millions de dollars pour un échange potentiel avec Kuminga

Prévisions de Santander : Les taux d’intérêt atteindront 3,75 % l’an prochain, en contraste avec les estimations optimistes de Goldman Sachs.

Transmettre notre maison secondaire de 450 000 £ à nos fils adolescents : un don échelonné sur dix ans ?

Des robes royales en double : La princesse Amalia des Pays-Bas et Fergie, un style déjà-vu parmi d’autres reines et princesses.

Titre : Analyse exclusive : Pourquoi Meghan Markle est-elle si proche du prince Harry ? Un expert en langage corporel déchiffre le « double clutch » de la duchesse comme un signe de possession.

Arsenal doit lutter contre l’indiscipline pour relancer sa course au titre après l’expulsion de William Saliba face à Bournemouth, selon ISAAN KHAN.

Kate Cassidy, la compagne de Liam Payne, évoque leurs discussions sur le mariage avant le décès du chanteur

Cooper Koch adresse une lettre à Erik Menendez en prison, sept ans avant de le jouer dans ‘Monsters’

Top fournisseurs d’accès Internet à Santa Ana, Californie

Boîte aux lettres : Adieu à la GameCube, le système de matchmaking de Mario Party et les nouvelles tarifications – Les nouvelles de Nintendo Life

Lucy Walker aborde l’art de la narration documentaire : le défi de révéler des secrets personnels

Les projets d’Apple pour améliorer Siri toujours reportés à une date ultérieure

Alexander Zverev élimine Stefanos Tsitsipas en quart de finale des Masters de Paris ; Holger Rune en lice pour les finales ATP

Profitez des meilleures promotions du Black Friday dans votre boîte mail : actualités, avis et bien plus encore.

Customize this title in frenchUh-Oh — On dirait que le modèle d’IA de ChatGPT est redevenu paresseux

Le top model d’OpenAI semble toujours paresseux

Des alternatives GPT-4 émergent