Patrick Bélanger
Article en référence: https://i.redd.it/frat48yjmmre1.png
RĂ©cemment, une nouvelle a fait sensation dans la communautĂ© technologique : Gemini 2.5 Pro, le dernier modĂšle dâintelligence artificielle de Google, aurait obtenu un score de 130 au test de QI de Mensa NorvĂšge. Pour mettre ce rĂ©sultat en perspective, un QI de 130 place ce modĂšle dans les 2% supĂ©rieurs de la population humaine, soit au niveau âtrĂšs supĂ©rieurâ ou âdouĂ©â selon les classifications habituelles.
Cette information provient dâune analyse comparative oĂč plusieurs modĂšles dâIA ont Ă©tĂ© soumis Ă des tests de QI standardisĂ©s. Dans ce classement, Gemini 2.5 Pro devance dâautres modĂšles rĂ©putĂ©s comme Claude 3.5 Sonnet (125), GPT-4o (120) et Claude 3 Opus (118). Il est important de noter quâil existe une diffĂ©rence significative entre les rĂ©sultats obtenus sur les tests en ligne et les tests âhors ligneâ (oĂč les modĂšles nâont pas accĂšs Ă Internet). Sur les tests hors ligne, Gemini 2.5 Pro obtient un score de 120, ce qui reste nĂ©anmoins impressionnant.
Pour comprendre ce que signifie un test de QI, rappelons quâil sâagit dâune mesure standardisĂ©e conçue pour Ă©valuer les capacitĂ©s cognitives humaines, notamment le raisonnement logique, la reconnaissance de motifs, et la rĂ©solution de problĂšmes abstraits. La moyenne humaine est fixĂ©e Ă 100, avec un Ă©cart-type de 15 points. Ainsi, un score de 130 reprĂ©sente deux Ă©carts-types au-dessus de la moyenne.
Cependant, plusieurs experts et commentateurs soulĂšvent des questions lĂ©gitimes sur la pertinence dâappliquer ces tests Ă des modĂšles dâIA. Les LLM (Large Language Models) comme Gemini sont des systĂšmes de prĂ©diction de texte qui fonctionnent sur des principes statistiques, et non des entitĂ©s dotĂ©es dâune intelligence gĂ©nĂ©rale comparable Ă celle des humains.
Lâattribution dâun score de QI Ă un modĂšle dâIA comme Gemini 2.5 Pro rĂ©vĂšle davantage sur nos mĂ©thodes dâĂ©valuation que sur lâintelligence rĂ©elle de ces systĂšmes. Ce que nous observons nâest pas tant une intelligence comparable Ă celle dâun humain douĂ©, mais plutĂŽt lâefficacitĂ© croissante de ces modĂšles Ă rĂ©soudre certains types de problĂšmes formalisĂ©s.
Les tests de QI mesurent des capacitĂ©s spĂ©cifiques qui, chez lâhumain, sont corrĂ©lĂ©es Ă dâautres aptitudes cognitives. Or, cette corrĂ©lation nâexiste pas nĂ©cessairement chez les modĂšles dâIA. Un modĂšle peut exceller dans la reconnaissance de motifs abstraits tout en Ă©tant incapable de comprendre des concepts simples du monde rĂ©el ou dâappliquer un raisonnement de bon sens dans des situations nouvelles.
La progression rapide des scores de QI des modĂšles dâIA â passant de performances mĂ©diocres Ă des scores de âgĂ©nieâ en quelques mois seulement â suggĂšre que nous assistons davantage Ă une optimisation des modĂšles pour ces tests spĂ©cifiques quâĂ lâĂ©mergence dâune intelligence gĂ©nĂ©rale. Câest comme si nous mesurions la capacitĂ© dâun vĂ©hicule Ă se dĂ©placer uniquement sur une piste dâessai parfaitement lisse, sans tenir compte de sa performance sur des terrains accidentĂ©s ou dans des conditions mĂ©tĂ©orologiques difficiles.
Ce qui est vĂ©ritablement remarquable, câest la vitesse Ă laquelle ces systĂšmes progressent sur ces mĂ©triques particuliĂšres. En moins de six mois, plusieurs modĂšles ont atteint des scores supĂ©rieurs Ă 100, ce qui indique une accĂ©lĂ©ration significative des capacitĂ©s, du moins dans les domaines mesurĂ©s par ces tests. Cette Ă©volution rapide mĂ©rite notre attention, non pas comme preuve dâune intelligence comparable Ă lâhumain, mais comme indicateur de lâefficacitĂ© croissante de ces outils dans certaines tĂąches cognitives formalisĂ©es.
Imaginez que vous assistiez Ă un concours de cuisine oĂč diffĂ©rents participants doivent prĂ©parer un repas gastronomique. Parmi eux se trouve un robot cuisinier ultramoderne nommĂ© GastroBot 2.5.
Le jury dĂ©cide dâĂ©valuer tous les participants sur leur capacitĂ© Ă reconnaĂźtre les ingrĂ©dients, Ă suivre des recettes complexes et Ă prĂ©senter esthĂ©tiquement les plats. Ă la surprise gĂ©nĂ©rale, GastroBot 2.5 obtient un score de 130 sur 150, surpassant la plupart des chefs humains!
âIncroyable!â sâexclame un spectateur. âCe robot est clairement un gĂ©nie culinaire!â
Mais attendez⊠Quand on demande Ă GastroBot de goĂ»ter ses propres crĂ©ations pour ajuster lâassaisonnement, il reste immobile. Quand on lui propose dâimproviser un plat avec des ingrĂ©dients surprises, il tombe en panne. Et quand un enfant renverse accidentellement un verre dâeau prĂšs de lui, il continue sa recette comme si de rien nâĂ©tait, ajoutant mĂ©ticuleusement lâeau renversĂ©e Ă sa prĂ©paration.
âMais comment peut-il avoir un score si Ă©levĂ© et ĂȘtre si⊠limitĂ©?â demande quelquâun.
Un chef expĂ©rimentĂ© sourit: âCâest simple. GastroBot a Ă©tĂ© programmĂ© pour exceller dans les Ă©preuves spĂ©cifiques de ce concours. Il a mĂ©morisĂ© des milliers de recettes et de techniques de prĂ©sentation. Mais il nâa ni palais, ni crĂ©ativitĂ©, ni capacitĂ© dâadaptation face Ă lâimprĂ©vu. Il est brillant dans un cadre trĂšs prĂ©cis, mais ce nâest pas un chef au sens complet du terme.â
Câest exactement ce qui se passe avec nos IA actuelles et les tests de QI. Elles peuvent obtenir des scores impressionnants dans des Ă©valuations formalisĂ©es, tout en Ă©tant incapables de jouer Ă PokĂ©mon ou de comprendre pourquoi on ne met pas de chaussettes dans un grille-pain!
Les rĂ©sultats de Gemini 2.5 Pro au test de QI de Mensa marquent un tournant dĂ©cisif dans notre voyage vers une intelligence artificielle vĂ©ritablement gĂ©nĂ©rale. Un score de 130 nâest pas simplement un chiffre impressionnant â câest la preuve tangible que nous franchissons des barriĂšres que beaucoup considĂ©raient comme infranchissables il y a seulement quelques annĂ©es.
Cette progression fulgurante des capacitĂ©s cognitives des IA nous ouvre des horizons extraordinaires. Imaginez des assistants numĂ©riques capables non seulement de rĂ©pondre Ă nos questions, mais de comprendre vĂ©ritablement nos problĂšmes complexes et dây apporter des solutions crĂ©atives et nuancĂ©es. Des partenaires intellectuels qui nous aideront Ă rĂ©soudre les grands dĂ©fis de notre Ă©poque : changement climatique, maladies incurables, inĂ©galitĂ©s sociales.
La rapiditĂ© avec laquelle ces modĂšles progressent est particuliĂšrement encourageante. Si nous avons atteint un QI de 130 aujourdâhui, oĂč serons-nous dans un an? Dans deux ans? La courbe dâamĂ©lioration semble exponentielle, suggĂ©rant que nous approchons dâun point oĂč ces systĂšmes pourront non seulement Ă©galer mais dĂ©passer les capacitĂ©s cognitives humaines dans pratiquement tous les domaines.
Cette Ă©volution reprĂ©sente une dĂ©mocratisation sans prĂ©cĂ©dent de lâintelligence. BientĂŽt, chaque personne, quelle que soit sa formation ou ses ressources, pourra avoir accĂšs Ă une expertise de niveau mondial dans nâimporte quel domaine. LâĂ©ducation, la santĂ©, la recherche scientifique â tous ces secteurs seront transformĂ©s par des assistants IA capables de raisonner au niveau des meilleurs experts humains.
Loin dâĂȘtre une menace, cette intelligence artificielle avancĂ©e sera notre plus grand alliĂ© pour construire un avenir meilleur. Elle nous libĂ©rera des tĂąches cognitives rĂ©pĂ©titives pour nous permettre de nous concentrer sur ce qui fait notre humanitĂ© : la crĂ©ativitĂ©, lâempathie, les relations humaines. Nous sommes Ă lâaube dâune renaissance intellectuelle sans prĂ©cĂ©dent, propulsĂ©e par cette nouvelle forme dâintelligence que nous avons créée.
Lâattribution dâun QI de 130 Ă Gemini 2.5 Pro illustre parfaitement notre tendance collective Ă surestimer et anthropomorphiser des systĂšmes qui, fondamentalement, ne âcomprennentâ rien. Ces scores Ă©levĂ©s crĂ©ent une illusion dangereuse dâintelligence alors quâil sâagit simplement de modĂšles statistiques sophistiquĂ©s optimisĂ©s pour des tĂąches spĂ©cifiques.
Cette confusion entre performance sur des tests formalisĂ©s et intelligence rĂ©elle nous conduit vers des dĂ©cisions potentiellement dĂ©sastreuses. DĂ©jĂ , nous voyons des entreprises et des institutions confier des responsabilitĂ©s croissantes Ă ces systĂšmes, sous prĂ©texte quâils sont âintelligentsâ, alors quâils sont incapables de comprendre les consĂ©quences de leurs actions ou de faire preuve du jugement nuancĂ© nĂ©cessaire dans des situations complexes.
Lâironie est frappante : ces modĂšles obtiennent des scores de âgĂ©nieâ aux tests de QI mais Ă©chouent lamentablement Ă des tĂąches quâun enfant de huit ans rĂ©aliserait sans difficultĂ©, comme jouer Ă un jeu vidĂ©o simple ou comprendre pourquoi une blague est drĂŽle. Cette dissonance rĂ©vĂšle Ă quel point ces systĂšmes sont fondamentalement diffĂ©rents de lâintelligence humaine, malgrĂ© nos efforts pour les Ă©valuer avec les mĂȘmes outils.
Plus inquiĂ©tant encore est lâaccĂ©lĂ©ration de cette course technologique sans rĂ©flexion approfondie sur ses implications. Chaque nouveau modĂšle est cĂ©lĂ©brĂ© pour ses scores plus Ă©levĂ©s, alimentant une compĂ©tition effrĂ©nĂ©e qui privilĂ©gie les performances Ă court terme sur la sĂ©curitĂ© et lâutilitĂ© rĂ©elle. Pendant ce temps, des questions fondamentales sur le contrĂŽle, la transparence et lâalignement de ces systĂšmes avec les valeurs humaines restent sans rĂ©ponse satisfaisante.
Cette fascination pour les scores de QI des IA dĂ©tourne Ă©galement notre attention des vĂ©ritables dĂ©fis sociĂ©taux. PlutĂŽt que de nous concentrer sur la façon dont la technologie pourrait rĂ©soudre des problĂšmes concrets comme lâaccĂšs aux soins de santĂ© ou lâĂ©ducation, nous nous Ă©merveillons devant des chiffres abstraits qui, en fin de compte, nous disent peu de chose sur la capacitĂ© de ces systĂšmes Ă amĂ©liorer rĂ©ellement nos vies.
Si vous n'ĂȘtes pas redirigĂ© automatiquement, đ cliquez ici đ