2025 - OpenAI admet une erreur de transparence après un accès secret à des données, remettant en question les performances de son modèle d'IA selon Sam Altman

OpenAI s’apprête à lancer o3 mini, un modèle d’IA compact promettant des capacités avancées en mathématiques, sciences et programmation. Cependant, des rumeurs évoquent un financement secret de FrontierMath par OpenAI, suscitant des doutes sur la transparence et la validité des résultats obtenus. Malgré les préoccupations, certains experts affirment que les performances d’OpenAI sont authentiques, tandis que des mesures sont prises pour garantir une évaluation impartiale du nouveau modèle.

OpenAI s’apprête à lancer o3 mini

Dans les semaines à venir, OpenAI révèlera o3 mini, une version compacte de sa série o3, dotée de capacités de raisonnement avancées dans les domaines des mathématiques, des sciences et de la programmation. Le PDG Sam Altman a déclaré que ce modèle est « très prometteur » et pourrait même surpasser les performances de la série o1, qui a donné naissance à ChatGPT. L’entreprise prévoit également de lancer simultanément l’API et ChatGPT pour ce nouveau modèle.

Inquiétudes concernant le projet FrontierMath

Malgré le manque de détails concernant ce modèle d’intelligence artificielle, certaines rumeurs suggèrent qu’OpenAI a discrètement financé et accédé aux données de référence de FrontierMath. Cela soulève des interrogations sur l’utilisation de ces données pour l’entraînement de o3. Bien que le modèle d’IA ait obtenu de bons résultats dans divers tests, les préoccupations croissantes pourraient remettre en question l’authenticité de ces résultats.

De plus, des allégations indiquent qu’OpenAI a financé le développement de FrontierMath sans en informer les mathématiciens impliqués. Des révélations récentes ont mis en lumière ce financement secret, laissant entendre que les mathématiciens n’étaient pas conscients des liens avec OpenAI. La validité de FrontierMath, qui est censé servir de référence pour tester des modèles d’IA, est donc mise en péril. Si OpenAI possédait déjà les réponses, le projet perdrait de son intérêt en tant qu’outil d’évaluation équitable.

Selon un article de Meemi sur Shortform, les mathématiciens qui ont conçu les problèmes pour FrontierMath n’étaient pas informés du soutien financier d’OpenAI. Des règles strictes de confidentialité ont été mises en place pour éviter toute fuite d’information. Cela soulève des questions sur la transparence et l’intégrité du projet.

Il est à noter que Tamay Besiroglu, directeur associé d’Epoch AI, a confirmé des détails sur le financement tout en mentionnant qu’il existe un « jeu de réserve » qui limite l’accès d’OpenAI à certaines données. Bien qu’OpenAI ait accès à la majorité des problèmes et solutions de FrontierMath, il existe un ensemble de données qui n’est pas accessible à l’entreprise pour garantir une évaluation impartiale des performances du modèle.

En revanche, Elliot Glazer, le mathématicien principal d’Epoch AI, a une perspective différente, affirmant que les scores d’OpenAI sont légitimes. Il a précisé que l’entreprise ne s’est pas entraînée sur l’ensemble de données et qu’ils ne déforment pas leurs performances internes. Epoch AI travaille sur un ensemble de données de réserve pour tester le modèle o3, mais les résultats ne pourront pas être garantis avant l’achèvement de leur propre évaluation.

Emily Damari montre sa main blessée après 470 jours de détention par Hamas, son geste de « rock on » incarne la liberté.

Hansi Flick : un retour incroyable qui inonde le monde de passion et d’émotions

Hailey Bieber partage une adorable image de Justin endormi après le scandale du désabonnement

La mère et le grand-père d’Alex Batty échappent aux poursuites pour l’enlèvement d’un adolescent pendant six ans dans une secte

Un soignant décède après avoir été agressé par un gang masqué dans une gare lors d’une attaque aléatoire

La vedette de ‘Squid Game’ révèle un indice inquiétant sur la saison 3, promettant un chapitre des plus sombres.

La Slovaquie et l’influence russe : Analyse de la politique de Fico

9 révélations choc d’Emmerdale à ne pas manquer la semaine prochaine

Top fournisseurs d’accès Internet à Hayward, Californie : Guide complet

Mass Effect 5 ne comptera pas immédiatement sur une équipe de 250 à 300 personnes après la fin de Dragon Age: The Veilguard.

Guide pour restaurer le moulin à vent des plaines dans Final Fantasy 7 Rebirth

Économisez sur vos déclarations d’impôts avec TurboTax et H&R Block : Offres de logiciels fiscaux à ne pas manquer

Découvrez la révolution des SSD Gen 6 de 32 Go : un pas en avant par rapport aux PCIe Gen 5 !

BioShock 4 : Exploration des nouveautés et attentes

Nvidia GeForce RTX 5090 surpasse le 4090 de 53 % selon des tests 3DMark révélateurs

OpenAI admet une erreur de transparence après un accès secret à des données, remettant en question les performances de son modèle d’IA selon Sam Altman

OpenAI s’apprête à lancer o3 mini

Inquiétudes concernant le projet FrontierMath