L IA d OpenAI résout parfaitement un examen de maths universitaire pour 25¢! Po-Shen Loh, ex-coach olympique, confirme que le modèle o1 a réussi des problèmes originaux jamais vus dans ses données d entraînement. L ère des tuteurs IA abordables est-elle arrivée? #IA #Éducation

Article en référence: https://i.redd.it/7gz5egq9ruoe1.png

Récapitulatif factuel

Un professeur de mathématiques de l’Université Carnegie Mellon, Po-Shen Loh, a récemment partagé sur les réseaux sociaux qu’il avait soumis son examen de mathématiques à o1, le modèle d’IA de raisonnement d’OpenAI. Le résultat est frappant : o1 a obtenu un score parfait à cet examen de niveau universitaire.

Po-Shen Loh n’est pas n’importe quel professeur - il est l’ancien entraîneur de l’équipe américaine pour les Olympiades Internationales de Mathématiques (IMO), une compétition prestigieuse pour les jeunes mathématiciens du monde entier. Les problèmes qu’il a soumis étaient des questions originales conçues pour son cours de mathématiques discrètes, couvrant notamment des suites récursives, des polynômes caractéristiques et des limites.

Dans son partage, le professeur mentionne que le coût pour obtenir ces réponses était d’environ 25 cents, bien que certains commentateurs aient souligné que ce calcul pourrait être légèrement sous-estimé en raison de la façon dont les modèles d’IA facturent par token (unité de texte) plutôt que par mot.

Ce qui rend cette démonstration particulièrement remarquable, c’est que ces problèmes n’étaient pas dans les données d’entraînement du modèle, puisqu’ils ont été créés récemment spécifiquement pour cet examen. Cela suggère que le modèle possède une véritable capacité de raisonnement mathématique plutôt qu’une simple mémorisation de solutions existantes.

Point de vue neutre

Cette démonstration s’inscrit dans une tendance plus large où les modèles d’IA franchissent régulièrement des jalons que l’on croyait encore lointains il y a quelques années. Cependant, il convient de nuancer ce succès.

D’une part, les problèmes mathématiques universitaires, bien que complexes, suivent généralement des structures de raisonnement bien définies. Les modèles comme o1 excellent particulièrement dans ce type de tâches où les règles sont claires et les méthodes de résolution sont documentées, même si les problèmes spécifiques sont nouveaux.

D’autre part, plusieurs utilisateurs dans les commentaires ont souligné que ces modèles peuvent encore échouer sur des problèmes de raisonnement apparemment plus simples mais moins conventionnels. La performance d’un modèle d’IA dépend fortement du type de problème qu’on lui soumet et du domaine concerné.

Ce que nous observons probablement, c’est une capacité impressionnante mais inégale. Les modèles d’IA actuels peuvent surpasser les humains dans certains domaines spécifiques tout en restant étonnamment limités dans d’autres. Cette réalité suggère que nous entrons dans une ère où la complémentarité entre l’intelligence humaine et artificielle sera plus pertinente que la simple comparaison de leurs performances respectives.

La question n’est peut-être plus de savoir si l’IA peut résoudre des problèmes complexes, mais plutôt comment nous pouvons tirer parti de ces capacités tout en reconnaissant leurs limites actuelles.

Exemple

Imaginez que vous avez un ami, appelons-le Albert. Albert est un prodige des échecs - il peut battre presque n’importe qui dans votre entourage et même certains joueurs professionnels. Impressionnant, n’est-ce pas?

Un jour, vous décidez d’emmener Albert faire du camping. À votre grande surprise, il est complètement perdu quand vient le temps de monter une tente. Pire encore, quand vous lui demandez d’allumer un feu, il empile le bois d’une façon si mathématiquement parfaite que c’en est presque comique, mais il n’arrive pas à comprendre pourquoi ça ne s’enflamme pas.

“Albert,” lui dites-vous, “comment peux-tu être si brillant aux échecs et si… disons… créativement défié en camping?”

Il vous regarde avec un sourire confus: “Les échecs ont des règles claires et des millions de parties documentées que j’ai étudiées. Le camping? C’est… imprévisible. Le vent change, le bois est humide, les instructions de la tente semblent avoir été écrites par un poète surréaliste…”

C’est un peu comme ça avec nos modèles d’IA actuels. Ils peuvent résoudre des équations différentielles complexes en un clin d’œil (leur jeu d’échecs), mais demandez-leur de comprendre pourquoi votre grand-mère met toujours trois cuillères de sucre dans sa tarte aux pommes “parce que c’est comme ça que ça se fait”, et ils sont aussi perdus qu’Albert avec son feu de camp géométriquement parfait mais fondamentalement non fonctionnel.

Point de vue optimiste

Ce que nous voyons ici n’est rien de moins que le début d’une révolution dans l’éducation et la recherche scientifique! Imaginez un monde où chaque étudiant a accès à un tuteur personnel capable de résoudre n’importe quel problème mathématique, d’expliquer les concepts les plus complexes et de guider l’apprentissage de façon personnalisée - le tout pour quelques cents par session.

Les implications vont bien au-delà de l’éducation. Dans les domaines scientifiques, ces modèles pourraient accélérer considérablement la recherche en automatisant la résolution de problèmes mathématiques complexes qui prendraient des heures, voire des jours aux chercheurs humains. Cela pourrait libérer un temps précieux pour la créativité et l’innovation.

Et ce n’est que le début! Si o1 peut déjà résoudre des problèmes mathématiques de niveau universitaire, imaginez ce que les prochaines générations de modèles pourront accomplir. Nous pourrions voir des avancées majeures dans des domaines comme la physique théorique, la biologie computationnelle ou la recherche médicale, simplement parce que nous aurons supprimé les goulots d’étranglement mathématiques qui ralentissent actuellement le progrès.

Cette démonstration n’est pas seulement impressionnante - c’est la preuve que nous sommes à l’aube d’une nouvelle ère d’augmentation intellectuelle, où la collaboration entre l’humain et la machine permettra de repousser les frontières de la connaissance à une vitesse jamais vue auparavant. L’avenir s’annonce brillant, et il est alimenté par des algorithmes!

Point de vue pessimiste

Cette démonstration soulève des questions troublantes sur l’avenir de l’éducation mathématique et de nombreuses professions intellectuelles. Si un modèle d’IA peut résoudre parfaitement un examen universitaire pour quelques cents, quelle est la valeur d’un diplôme en mathématiques qui coûte des dizaines de milliers de dollars?

Les étudiants vont rapidement comprendre qu’ils peuvent simplement soumettre leurs devoirs à ces modèles et obtenir des réponses parfaites sans développer leur propre compréhension. Comment les professeurs pourront-ils évaluer véritablement les connaissances de leurs étudiants? Comment distinguer l’apprentissage authentique de la simple délégation à l’IA?

Plus inquiétant encore, cette tendance pourrait créer une génération de professionnels qui semblent compétents sur papier mais qui, en réalité, dépendent entièrement de l’IA pour résoudre des problèmes fondamentaux dans leur domaine. Imaginez des ingénieurs qui ne comprennent pas vraiment les principes mathématiques sous-jacents à leurs conceptions, ou des chercheurs incapables de vérifier indépendamment les résultats générés par l’IA.

Et que dire des emplois? Si ces modèles continuent de s’améliorer à ce rythme, de nombreux rôles qui nécessitent des compétences mathématiques avancées - des actuaires aux analystes financiers en passant par certains types d’ingénieurs - pourraient voir leur valeur sur le marché du travail s’effondrer. Nous risquons de créer une société où la maîtrise humaine des mathématiques devient une compétence obsolète, reléguée aux livres d’histoire comme la navigation céleste ou le calcul mental de racines carrées.

Cette démonstration n’est pas tant une célébration du progrès qu’un avertissement sur la façon dont nous risquons de dévaluer l’expertise humaine au profit d’une efficacité algorithmique sans discernement.

Redirection en cours...

Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈