OpenAI s’apprête à lancer o3 mini, un modèle d’IA compact promettant des capacités avancées en mathématiques, sciences et programmation. Cependant, des rumeurs évoquent un financement secret de FrontierMath par OpenAI, suscitant des doutes sur la transparence et la validité des résultats obtenus. Malgré les préoccupations, certains experts affirment que les performances d’OpenAI sont authentiques, tandis que des mesures sont prises pour garantir une évaluation impartiale du nouveau modèle.
OpenAI s’apprête à lancer o3 mini
Dans les semaines à venir, OpenAI révèlera o3 mini, une version compacte de sa série o3, dotée de capacités de raisonnement avancées dans les domaines des mathématiques, des sciences et de la programmation. Le PDG Sam Altman a déclaré que ce modèle est « très prometteur » et pourrait même surpasser les performances de la série o1, qui a donné naissance à ChatGPT. L’entreprise prévoit également de lancer simultanément l’API et ChatGPT pour ce nouveau modèle.
Inquiétudes concernant le projet FrontierMath
Malgré le manque de détails concernant ce modèle d’intelligence artificielle, certaines rumeurs suggèrent qu’OpenAI a discrètement financé et accédé aux données de référence de FrontierMath. Cela soulève des interrogations sur l’utilisation de ces données pour l’entraînement de o3. Bien que le modèle d’IA ait obtenu de bons résultats dans divers tests, les préoccupations croissantes pourraient remettre en question l’authenticité de ces résultats.
De plus, des allégations indiquent qu’OpenAI a financé le développement de FrontierMath sans en informer les mathématiciens impliqués. Des révélations récentes ont mis en lumière ce financement secret, laissant entendre que les mathématiciens n’étaient pas conscients des liens avec OpenAI. La validité de FrontierMath, qui est censé servir de référence pour tester des modèles d’IA, est donc mise en péril. Si OpenAI possédait déjà les réponses, le projet perdrait de son intérêt en tant qu’outil d’évaluation équitable.
Selon un article de Meemi sur Shortform, les mathématiciens qui ont conçu les problèmes pour FrontierMath n’étaient pas informés du soutien financier d’OpenAI. Des règles strictes de confidentialité ont été mises en place pour éviter toute fuite d’information. Cela soulève des questions sur la transparence et l’intégrité du projet.
Il est à noter que Tamay Besiroglu, directeur associé d’Epoch AI, a confirmé des détails sur le financement tout en mentionnant qu’il existe un « jeu de réserve » qui limite l’accès d’OpenAI à certaines données. Bien qu’OpenAI ait accès à la majorité des problèmes et solutions de FrontierMath, il existe un ensemble de données qui n’est pas accessible à l’entreprise pour garantir une évaluation impartiale des performances du modèle.
En revanche, Elliot Glazer, le mathématicien principal d’Epoch AI, a une perspective différente, affirmant que les scores d’OpenAI sont légitimes. Il a précisé que l’entreprise ne s’est pas entraînée sur l’ensemble de données et qu’ils ne déforment pas leurs performances internes. Epoch AI travaille sur un ensemble de données de réserve pour tester le modèle o3, mais les résultats ne pourront pas être garantis avant l’achèvement de leur propre évaluation.