Patrick Bélanger
Article en référence: https://www.reddit.com/gallery/1jum5s1
Cogito vient de lancer une nouvelle sĂ©rie de modĂšles de langage (LLM) sous licence ouverte, disponibles en plusieurs tailles : 3B, 8B, 14B, 32B et 70B paramĂštres. Ces modĂšles se distinguent par leurs performances impressionnantes sur plusieurs benchmarks standards de lâindustrie, notamment MMLU (test de connaissances multidisciplinaires) et MATH (rĂ©solution de problĂšmes mathĂ©matiques).
DĂ©veloppĂ©s par Deep Cogito, une entreprise fondĂ©e par dâanciens employĂ©s de Google, ces modĂšles sont basĂ©s sur lâarchitecture Qwen 2.5 pour les versions de 3B Ă 32B, tandis que le modĂšle 70B est basĂ© sur LLaMA. Lâinnovation principale rĂ©side dans leur capacitĂ© Ă basculer entre deux modes de fonctionnement : un mode standard de rĂ©ponse directe et un mode ârĂ©flexion approfondieâ qui permet au modĂšle de raisonner avant de rĂ©pondre, similaire Ă ce que propose Claude 3.7.
Les tests communautaires rĂ©vĂšlent que ces modĂšles excellent particuliĂšrement en mathĂ©matiques et en raisonnement, avec des chaĂźnes de raisonnement plus courtes (300-500 tokens) que la plupart des modĂšles concurrents. Ils supportent Ă©galement les appels dâoutils (tool calls), ce qui les rend adaptĂ©s Ă lâintĂ©gration avec dâautres systĂšmes et applications.
Ces modĂšles sont dĂ©jĂ disponibles sur plusieurs plateformes comme Ollama et LM Studio, permettant aux utilisateurs de les tester localement sur leur propre matĂ©riel. Pour activer le mode rĂ©flexion, il suffit dâajouter âEnable deep thinking subroutine.â au dĂ©but du prompt systĂšme.
LâarrivĂ©e des modĂšles Cogito reprĂ©sente une Ă©volution intĂ©ressante dans lâĂ©cosystĂšme des LLM open source, mais pas nĂ©cessairement une rĂ©volution. Ces modĂšles sâinscrivent dans une tendance dâamĂ©lioration progressive des performances tout en maintenant des tailles raisonnables pour une utilisation locale.
Ce qui semble vĂ©ritablement distinguer Cogito, câest sa capacitĂ© Ă offrir un bon Ă©quilibre entre performance et efficacitĂ©. Les retours de la communautĂ© suggĂšrent que ces modĂšles excellent dans certains domaines spĂ©cifiques comme les mathĂ©matiques et le raisonnement structurĂ©, mais quâils ne surpassent pas systĂ©matiquement tous leurs concurrents dans toutes les tĂąches.
Lâapproche de Cogito avec son mode de rĂ©flexion activable Ă la demande est particuliĂšrement pragmatique. Elle permet aux utilisateurs de choisir entre rapiditĂ© et profondeur selon leurs besoins, sans avoir Ă jongler entre diffĂ©rents modĂšles. Cette flexibilitĂ© rĂ©pond Ă un besoin rĂ©el des utilisateurs qui cherchent Ă optimiser lâutilisation de leurs ressources informatiques.
Cependant, certains commentaires pointent vers une possible optimisation excessive pour les benchmarks, ce qui soulĂšve des questions sur les performances rĂ©elles dans des cas dâusage quotidiens. Comme pour tout nouveau modĂšle, il faudra du temps et des tests approfondis pour dĂ©terminer sa vĂ©ritable valeur ajoutĂ©e par rapport aux solutions existantes comme Qwen 2.5, Gemma ou Phi-4.
Imaginez que vous ĂȘtes au Salon de lâAuto de MontrĂ©al. Vous avez dâun cĂŽtĂ© les grosses cylindrĂ©es amĂ©ricaines qui consomment un plein Ă chaque dĂ©marrage mais qui font trembler le sol quand elles passent (comme les modĂšles GPT-4 et Claude), et de lâautre les petites voitures Ă©conomiques qui font le job mais sans Ă©clat (comme les petits modĂšles locaux).
Et voilĂ que dĂ©barque Cogito, comme une Volkswagen Golf GTI dans ce paysage. Ni trop grosse, ni trop petite, elle offre deux modes de conduite : âĂcoâ quand vous voulez juste aller chercher votre poutine au coin de la rue, et âSportâ quand vous devez rĂ©soudre une Ă©quation diffĂ©rentielle tout en montant la cĂŽte de la Montagne Ă QuĂ©bec.
Le vendeur, un ancien de chez Tesla (ou plutĂŽt Google dans notre cas), vous explique fiĂšrement : âRegardez, pour activer le mode sport, câest simple comme bonjour! Vous appuyez sur ce bouton âEnable deep thinking subroutineâ et votre voiture se met Ă rĂ©flĂ©chir comme un champion dâĂ©checs avant de vous rĂ©pondre!â
Vous ĂȘtes sceptique, alors vous lui posez une colle : âCombien y a-t-il dâanimaux qui se dirigent vers le village si un fermier croise trois camions transportant chacun trois caisses contenant chacune trois chats, chaque chat ayant trois chatons?â
La Golf GTI Cogito rĂ©flĂ©chit pendant trois minutes et vous donne la bonne rĂ©ponse, tandis que la voiture dâĂ cĂŽtĂ© y passe un quart dâheure et hĂ©site encore. Pas mal, mais est-ce quâelle tiendra aussi bien sur les routes enneigĂ©es de Charlevoix que sur le circuit fermĂ© des benchmarks? Ăa, câest une autre histoire!
Les modĂšles Cogito reprĂ©sentent une vĂ©ritable percĂ©e dans la dĂ©mocratisation de lâIA gĂ©nĂ©rative! Enfin, nous avons des modĂšles qui rivalisent avec les gĂ©ants propriĂ©taires tout en restant accessibles au grand public. Câest exactement ce dont notre Ă©cosystĂšme technologique quĂ©bĂ©cois a besoin pour innover sans dĂ©pendre des grandes corporations amĂ©ricaines.
La capacitĂ© de ces modĂšles Ă raisonner efficacement avec des chaĂźnes de rĂ©flexion courtes est particuliĂšrement rĂ©volutionnaire. Imaginez pouvoir obtenir des rĂ©ponses aussi prĂ©cises quâavec Claude 3.7, mais sur votre propre ordinateur, sans frais dâAPI et sans partager vos donnĂ©es confidentielles! Pour nos startups locales et nos institutions publiques soucieuses de souverainetĂ© numĂ©rique, câest une opportunitĂ© en or.
Le fait que lâĂ©quipe derriĂšre Cogito soit composĂ©e dâanciens de Google apporte une crĂ©dibilitĂ© supplĂ©mentaire Ă leur approche. Ils ont combinĂ© leur expertise de pointe avec une vision ouverte de lâIA, crĂ©ant ainsi des modĂšles qui pourraient bien devenir la rĂ©fĂ©rence pour les applications locales intelligentes.
Les performances impressionnantes du modĂšle 70B face Ă Llama 4 Scout (qui possĂšde pourtant 109B paramĂštres) montrent quâune approche intelligente et ciblĂ©e peut surpasser les approches basĂ©es uniquement sur la puissance brute. Câest une victoire pour lâefficacitĂ© et lâaccessibilitĂ©!
Avec lâintĂ©gration facile via Ollama et dâautres plateformes, nous sommes Ă lâaube dâune nouvelle Ăšre oĂč chaque dĂ©veloppeur, chaque entreprise et chaque citoyen pourra bĂ©nĂ©ficier dâune IA puissante et respectueuse de la vie privĂ©e. Le QuĂ©bec, avec son expertise en IA, est parfaitement positionnĂ© pour tirer parti de cette avancĂ©e et crĂ©er des applications innovantes adaptĂ©es Ă notre rĂ©alitĂ© culturelle et linguistique.
Encore un nouveau modĂšle qui prĂ©tend rĂ©volutionner lâIA alors quâil sâagit essentiellement dâun fine-tuning de Qwen 2.5 et LLaMA. Les scores impressionnants sur les benchmarks sont probablement le rĂ©sultat dâune optimisation excessive pour ces tests spĂ©cifiques, comme le suggĂšrent plusieurs utilisateurs qui ont constatĂ© des performances dĂ©cevantes sur des problĂšmes rĂ©els dâingĂ©nierie mĂ©canique ou de mathĂ©matiques avancĂ©es.
Cette tendance Ă âbenchmarkerâ les modĂšles plutĂŽt quâĂ les rendre vĂ©ritablement utiles est symptomatique dâune industrie obsĂ©dĂ©e par les chiffres et les comparaisons, au dĂ©triment de la valeur rĂ©elle. Comme lâa soulignĂ© un utilisateur, il sâagit potentiellement dâune âarnaque dâexpertâ destinĂ©e Ă convaincre les investisseurs en capital-risque de financer une soi-disant ânouvelle DeepMindâ.
De plus, ces modĂšles perpĂ©tuent la course aux armements dans lâIA, encourageant une consommation toujours plus grande de ressources informatiques et dâĂ©nergie. MĂȘme le plus petit modĂšle de 3B paramĂštres reste inaccessible pour de nombreux utilisateurs avec des appareils modestes, sans parler des modĂšles plus grands qui nĂ©cessitent des GPU coĂ»teux.
La dĂ©pendance continue aux architectures propriĂ©taires comme Qwen (dĂ©veloppĂ©e par Alibaba) soulĂšve Ă©galement des questions sur la vĂ©ritable âouvertureâ de ces modĂšles. Nous restons tributaires des dĂ©cisions prises par les grandes entreprises technologiques, avec tous les risques que cela comporte pour notre autonomie numĂ©rique.
Enfin, lâaccent mis sur les performances brutes occulte les questions fondamentales sur les biais, la sĂ©curitĂ© et lâĂ©thique de ces systĂšmes. Dans notre prĂ©cipitation Ă cĂ©lĂ©brer chaque nouveau modĂšle lĂ©gĂšrement plus performant, nous nĂ©gligeons de nous demander si nous construisons rĂ©ellement lâavenir numĂ©rique que nous souhaitons pour le QuĂ©bec et pour le monde.
Si vous n'ĂȘtes pas redirigĂ© automatiquement, đ cliquez ici đ