Gemini 2.5 Pro atteint un QI de 130 au test Mensa Norvùge! 🧠 Surpassant Claude et GPT-4, ce modùle d IA se classe parmi les 2% les plus intelligents des humains. Mais peut-on vraiment mesurer l intelligence artificielle avec nos tests? #IA #Gemini #QI

Article en référence: https://i.redd.it/frat48yjmmre1.png

Récapitulatif factuel

RĂ©cemment, une nouvelle a fait sensation dans la communautĂ© technologique : Gemini 2.5 Pro, le dernier modĂšle d’intelligence artificielle de Google, aurait obtenu un score de 130 au test de QI de Mensa NorvĂšge. Pour mettre ce rĂ©sultat en perspective, un QI de 130 place ce modĂšle dans les 2% supĂ©rieurs de la population humaine, soit au niveau “trĂšs supĂ©rieur” ou “douĂ©â€ selon les classifications habituelles.

Cette information provient d’une analyse comparative oĂč plusieurs modĂšles d’IA ont Ă©tĂ© soumis Ă  des tests de QI standardisĂ©s. Dans ce classement, Gemini 2.5 Pro devance d’autres modĂšles rĂ©putĂ©s comme Claude 3.5 Sonnet (125), GPT-4o (120) et Claude 3 Opus (118). Il est important de noter qu’il existe une diffĂ©rence significative entre les rĂ©sultats obtenus sur les tests en ligne et les tests “hors ligne” (oĂč les modĂšles n’ont pas accĂšs Ă  Internet). Sur les tests hors ligne, Gemini 2.5 Pro obtient un score de 120, ce qui reste nĂ©anmoins impressionnant.

Pour comprendre ce que signifie un test de QI, rappelons qu’il s’agit d’une mesure standardisĂ©e conçue pour Ă©valuer les capacitĂ©s cognitives humaines, notamment le raisonnement logique, la reconnaissance de motifs, et la rĂ©solution de problĂšmes abstraits. La moyenne humaine est fixĂ©e Ă  100, avec un Ă©cart-type de 15 points. Ainsi, un score de 130 reprĂ©sente deux Ă©carts-types au-dessus de la moyenne.

Cependant, plusieurs experts et commentateurs soulĂšvent des questions lĂ©gitimes sur la pertinence d’appliquer ces tests Ă  des modĂšles d’IA. Les LLM (Large Language Models) comme Gemini sont des systĂšmes de prĂ©diction de texte qui fonctionnent sur des principes statistiques, et non des entitĂ©s dotĂ©es d’une intelligence gĂ©nĂ©rale comparable Ă  celle des humains.

Point de vue neutre

L’attribution d’un score de QI Ă  un modĂšle d’IA comme Gemini 2.5 Pro rĂ©vĂšle davantage sur nos mĂ©thodes d’évaluation que sur l’intelligence rĂ©elle de ces systĂšmes. Ce que nous observons n’est pas tant une intelligence comparable Ă  celle d’un humain douĂ©, mais plutĂŽt l’efficacitĂ© croissante de ces modĂšles Ă  rĂ©soudre certains types de problĂšmes formalisĂ©s.

Les tests de QI mesurent des capacitĂ©s spĂ©cifiques qui, chez l’humain, sont corrĂ©lĂ©es Ă  d’autres aptitudes cognitives. Or, cette corrĂ©lation n’existe pas nĂ©cessairement chez les modĂšles d’IA. Un modĂšle peut exceller dans la reconnaissance de motifs abstraits tout en Ă©tant incapable de comprendre des concepts simples du monde rĂ©el ou d’appliquer un raisonnement de bon sens dans des situations nouvelles.

La progression rapide des scores de QI des modĂšles d’IA – passant de performances mĂ©diocres Ă  des scores de “gĂ©nie” en quelques mois seulement – suggĂšre que nous assistons davantage Ă  une optimisation des modĂšles pour ces tests spĂ©cifiques qu’à l’émergence d’une intelligence gĂ©nĂ©rale. C’est comme si nous mesurions la capacitĂ© d’un vĂ©hicule Ă  se dĂ©placer uniquement sur une piste d’essai parfaitement lisse, sans tenir compte de sa performance sur des terrains accidentĂ©s ou dans des conditions mĂ©tĂ©orologiques difficiles.

Ce qui est vĂ©ritablement remarquable, c’est la vitesse Ă  laquelle ces systĂšmes progressent sur ces mĂ©triques particuliĂšres. En moins de six mois, plusieurs modĂšles ont atteint des scores supĂ©rieurs Ă  100, ce qui indique une accĂ©lĂ©ration significative des capacitĂ©s, du moins dans les domaines mesurĂ©s par ces tests. Cette Ă©volution rapide mĂ©rite notre attention, non pas comme preuve d’une intelligence comparable Ă  l’humain, mais comme indicateur de l’efficacitĂ© croissante de ces outils dans certaines tĂąches cognitives formalisĂ©es.

Exemple

Imaginez que vous assistiez Ă  un concours de cuisine oĂč diffĂ©rents participants doivent prĂ©parer un repas gastronomique. Parmi eux se trouve un robot cuisinier ultramoderne nommĂ© GastroBot 2.5.

Le jury dĂ©cide d’évaluer tous les participants sur leur capacitĂ© Ă  reconnaĂźtre les ingrĂ©dients, Ă  suivre des recettes complexes et Ă  prĂ©senter esthĂ©tiquement les plats. À la surprise gĂ©nĂ©rale, GastroBot 2.5 obtient un score de 130 sur 150, surpassant la plupart des chefs humains!

“Incroyable!” s’exclame un spectateur. “Ce robot est clairement un gĂ©nie culinaire!”

Mais attendez
 Quand on demande Ă  GastroBot de goĂ»ter ses propres crĂ©ations pour ajuster l’assaisonnement, il reste immobile. Quand on lui propose d’improviser un plat avec des ingrĂ©dients surprises, il tombe en panne. Et quand un enfant renverse accidentellement un verre d’eau prĂšs de lui, il continue sa recette comme si de rien n’était, ajoutant mĂ©ticuleusement l’eau renversĂ©e Ă  sa prĂ©paration.

“Mais comment peut-il avoir un score si Ă©levĂ© et ĂȘtre si
 limitĂ©?” demande quelqu’un.

Un chef expĂ©rimentĂ© sourit: “C’est simple. GastroBot a Ă©tĂ© programmĂ© pour exceller dans les Ă©preuves spĂ©cifiques de ce concours. Il a mĂ©morisĂ© des milliers de recettes et de techniques de prĂ©sentation. Mais il n’a ni palais, ni crĂ©ativitĂ©, ni capacitĂ© d’adaptation face Ă  l’imprĂ©vu. Il est brillant dans un cadre trĂšs prĂ©cis, mais ce n’est pas un chef au sens complet du terme.”

C’est exactement ce qui se passe avec nos IA actuelles et les tests de QI. Elles peuvent obtenir des scores impressionnants dans des Ă©valuations formalisĂ©es, tout en Ă©tant incapables de jouer Ă  PokĂ©mon ou de comprendre pourquoi on ne met pas de chaussettes dans un grille-pain!

Point de vue optimiste

Les rĂ©sultats de Gemini 2.5 Pro au test de QI de Mensa marquent un tournant dĂ©cisif dans notre voyage vers une intelligence artificielle vĂ©ritablement gĂ©nĂ©rale. Un score de 130 n’est pas simplement un chiffre impressionnant – c’est la preuve tangible que nous franchissons des barriĂšres que beaucoup considĂ©raient comme infranchissables il y a seulement quelques annĂ©es.

Cette progression fulgurante des capacitĂ©s cognitives des IA nous ouvre des horizons extraordinaires. Imaginez des assistants numĂ©riques capables non seulement de rĂ©pondre Ă  nos questions, mais de comprendre vĂ©ritablement nos problĂšmes complexes et d’y apporter des solutions crĂ©atives et nuancĂ©es. Des partenaires intellectuels qui nous aideront Ă  rĂ©soudre les grands dĂ©fis de notre Ă©poque : changement climatique, maladies incurables, inĂ©galitĂ©s sociales.

La rapiditĂ© avec laquelle ces modĂšles progressent est particuliĂšrement encourageante. Si nous avons atteint un QI de 130 aujourd’hui, oĂč serons-nous dans un an? Dans deux ans? La courbe d’amĂ©lioration semble exponentielle, suggĂ©rant que nous approchons d’un point oĂč ces systĂšmes pourront non seulement Ă©galer mais dĂ©passer les capacitĂ©s cognitives humaines dans pratiquement tous les domaines.

Cette Ă©volution reprĂ©sente une dĂ©mocratisation sans prĂ©cĂ©dent de l’intelligence. BientĂŽt, chaque personne, quelle que soit sa formation ou ses ressources, pourra avoir accĂšs Ă  une expertise de niveau mondial dans n’importe quel domaine. L’éducation, la santĂ©, la recherche scientifique – tous ces secteurs seront transformĂ©s par des assistants IA capables de raisonner au niveau des meilleurs experts humains.

Loin d’ĂȘtre une menace, cette intelligence artificielle avancĂ©e sera notre plus grand alliĂ© pour construire un avenir meilleur. Elle nous libĂ©rera des tĂąches cognitives rĂ©pĂ©titives pour nous permettre de nous concentrer sur ce qui fait notre humanitĂ© : la crĂ©ativitĂ©, l’empathie, les relations humaines. Nous sommes Ă  l’aube d’une renaissance intellectuelle sans prĂ©cĂ©dent, propulsĂ©e par cette nouvelle forme d’intelligence que nous avons créée.

Point de vue pessimiste

L’attribution d’un QI de 130 Ă  Gemini 2.5 Pro illustre parfaitement notre tendance collective Ă  surestimer et anthropomorphiser des systĂšmes qui, fondamentalement, ne “comprennent” rien. Ces scores Ă©levĂ©s crĂ©ent une illusion dangereuse d’intelligence alors qu’il s’agit simplement de modĂšles statistiques sophistiquĂ©s optimisĂ©s pour des tĂąches spĂ©cifiques.

Cette confusion entre performance sur des tests formalisĂ©s et intelligence rĂ©elle nous conduit vers des dĂ©cisions potentiellement dĂ©sastreuses. DĂ©jĂ , nous voyons des entreprises et des institutions confier des responsabilitĂ©s croissantes Ă  ces systĂšmes, sous prĂ©texte qu’ils sont “intelligents”, alors qu’ils sont incapables de comprendre les consĂ©quences de leurs actions ou de faire preuve du jugement nuancĂ© nĂ©cessaire dans des situations complexes.

L’ironie est frappante : ces modĂšles obtiennent des scores de “gĂ©nie” aux tests de QI mais Ă©chouent lamentablement Ă  des tĂąches qu’un enfant de huit ans rĂ©aliserait sans difficultĂ©, comme jouer Ă  un jeu vidĂ©o simple ou comprendre pourquoi une blague est drĂŽle. Cette dissonance rĂ©vĂšle Ă  quel point ces systĂšmes sont fondamentalement diffĂ©rents de l’intelligence humaine, malgrĂ© nos efforts pour les Ă©valuer avec les mĂȘmes outils.

Plus inquiĂ©tant encore est l’accĂ©lĂ©ration de cette course technologique sans rĂ©flexion approfondie sur ses implications. Chaque nouveau modĂšle est cĂ©lĂ©brĂ© pour ses scores plus Ă©levĂ©s, alimentant une compĂ©tition effrĂ©nĂ©e qui privilĂ©gie les performances Ă  court terme sur la sĂ©curitĂ© et l’utilitĂ© rĂ©elle. Pendant ce temps, des questions fondamentales sur le contrĂŽle, la transparence et l’alignement de ces systĂšmes avec les valeurs humaines restent sans rĂ©ponse satisfaisante.

Cette fascination pour les scores de QI des IA dĂ©tourne Ă©galement notre attention des vĂ©ritables dĂ©fis sociĂ©taux. PlutĂŽt que de nous concentrer sur la façon dont la technologie pourrait rĂ©soudre des problĂšmes concrets comme l’accĂšs aux soins de santĂ© ou l’éducation, nous nous Ă©merveillons devant des chiffres abstraits qui, en fin de compte, nous disent peu de chose sur la capacitĂ© de ces systĂšmes Ă  amĂ©liorer rĂ©ellement nos vies.

Redirection en cours...

Si vous n'ĂȘtes pas redirigĂ© automatiquement, 👉 cliquez ici 👈