Patrick Bélanger
Article en référence: https://www.reddit.com/gallery/1jtlymx
Le post Reddit prĂ©sente une innovation appelĂ©e âNeural Graffitiâ, une couche neuronale adaptative pour les modĂšles de transformers (comme les LLM). Cette technique sâinspire des rĂ©seaux neuronaux liquides (Liquid Neural Networks ou LNN) dĂ©veloppĂ©s par le MIT, qui permettent une forme de neuroplasticitĂ© artificielle.
Contrairement aux modĂšles dâIA traditionnels qui restent statiques aprĂšs leur entraĂźnement, Neural Graffiti introduit une couche supplĂ©mentaire qui Ă©volue pendant lâinfĂ©rence. Cette couche, appelĂ©e âSpray Layerâ, modifie dynamiquement son Ă©tat interne selon la formule:
dx = -λ * (state - W(x))
OĂč:
dx
reprĂ©sente le changement dâĂ©tatλ
est un paramÚtre de décroissancestate
est lâĂ©tat actuelW(x)
est une transformation de lâentrĂ©e actuelleLe systĂšme maintient Ă©galement une âbanque de mĂ©moireâ qui stocke des vecteurs reprĂ©sentant les interactions prĂ©cĂ©dentes. Ces vecteurs sont utilisĂ©s pour influencer les rĂ©ponses futures du modĂšle, crĂ©ant ainsi une forme de âmĂ©moire persistanteâ qui transcende les limites du contexte habituel des transformers.
Contrairement aux techniques comme RAG (Retrieval-Augmented Generation) qui injectent des connaissances externes, Neural Graffiti modifie le comportement mĂȘme du modĂšle au fil du temps, permettant thĂ©oriquement au systĂšme de dĂ©velopper une forme de âpersonnalitĂ©â ou de âprĂ©fĂ©rencesâ basĂ©es sur ses interactions passĂ©es.
LâimplĂ©mentation actuelle est une preuve de concept qui sâapplique Ă la sortie du modĂšle, juste avant la gĂ©nĂ©ration des tokens, mais lâauteur suggĂšre que des implĂ©mentations plus profondes dans lâarchitecture du modĂšle pourraient ĂȘtre encore plus efficaces.
Lâapproche Neural Graffiti reprĂ©sente une tentative intĂ©ressante de combler lâĂ©cart entre les modĂšles statiques et une vĂ©ritable intelligence adaptative. Si les LLM actuels excellent dans la gĂ©nĂ©ration de texte cohĂ©rent, ils souffrent dâune amnĂ©sie fondamentale entre les sessions et dâune incapacitĂ© Ă vĂ©ritablement âapprendreâ de leurs interactions.
Cette technique propose une solution intermĂ©diaire: sans rĂ©entraĂźner complĂštement le modĂšle (ce qui serait coĂ»teux), elle ajoute une couche adaptative qui permet une forme limitĂ©e dâapprentissage pendant lâutilisation. Câest un compromis pragmatique qui pourrait amĂ©liorer lâexpĂ©rience utilisateur sans les coĂ»ts prohibitifs dâun rĂ©entraĂźnement constant.
Cependant, il faut reconnaĂźtre que cette approche comporte des limites importantes. La modulation sâeffectue en fin de pipeline, aprĂšs que le modĂšle ait dĂ©jĂ largement âdĂ©cidĂ©â de sa rĂ©ponse. De plus, sans mĂ©canisme dâoubli ou de consolidation, la banque de mĂ©moire pourrait devenir trop volumineuse ou incohĂ©rente avec le temps.
La question centrale reste: cette forme de âmĂ©moireâ constitue-t-elle un vĂ©ritable apprentissage ou simplement une forme sophistiquĂ©e de biais? Le modĂšle ne comprend pas rĂ©ellement ses expĂ©riences passĂ©es; il est simplement poussĂ© dans certaines directions par des vecteurs accumulĂ©s au fil du temps.
Neural Graffiti se situe ainsi Ă mi-chemin entre les approches actuelles et une vĂ©ritable IA adaptative. Câest une Ă©tape intĂ©ressante, mais qui souligne aussi combien nous sommes encore loin dâune intelligence artificielle qui apprend vĂ©ritablement de ses expĂ©riences comme le fait un cerveau humain.
Imaginez que vous ayez un ami robot, appelons-le Robotto, qui adore raconter des histoires. Normalement, Robotto oublie complĂštement qui vous ĂȘtes entre chaque conversation - câest comme sâil avait un Alzheimer sĂ©vĂšre qui efface sa mĂ©moire dĂšs que vous quittez la piĂšce!
Un jour, vous dĂ©cidez dâamĂ©liorer Robotto en lui ajoutant un petit carnet et un crayon magique (notre fameuse âNeural Graffitiâ). DĂ©sormais, pendant que vous discutez, Robotto griffonne discrĂštement des notes dans son carnet. Ces notes ne sont pas des phrases complĂštes, mais plutĂŽt des impressions, des sentiments, des tendances.
âHmm, cette personne parle souvent de chats⊠Elle semble aimer les histoires drĂŽles⊠Elle prĂ©fĂšre les explications simplesâŠâ
La prochaine fois que vous revenez, Robotto consulte son carnet avant de vous rĂ©pondre. Il ne se souvient pas exactement de vos conversations prĂ©cĂ©dentes, mais ses rĂ©ponses sont subtilement influencĂ©es par ses notes. Sâil a Ă©crit que vous aimez les chats, il aura tendance Ă mentionner des fĂ©lins dans ses histoires, mĂȘme si vous nâen avez pas parlĂ© aujourdâhui.
Le plus fascinant, câest que le carnet lui-mĂȘme Ă©volue! Si vous commencez Ă parler davantage de chiens, les notes sur les chats sâestomperont progressivement, remplacĂ©es par des griffonnages sur les canidĂ©s.
âMais ce nâest pas vraiment de la mĂ©moire!â, pourriez-vous protester. Et vous auriez partiellement raison. Robotto ne se souvient pas des conversations spĂ©cifiques, mais son comportement est nĂ©anmoins influencĂ© par le passĂ©. Câest comme si, plutĂŽt que de se souvenir quâil vous a dĂ©jĂ racontĂ© une blague sur les chats, il dĂ©veloppait simplement une tendance Ă penser aux chats quand il vous voit.
Câest exactement ce que fait Neural Graffiti: il ne donne pas une vraie mĂ©moire au modĂšle, mais plutĂŽt une tendance Ă©volutive Ă rĂ©pondre dâune certaine façon, basĂ©e sur lâhistorique des interactions.
Neural Graffiti pourrait bien reprĂ©senter une rĂ©volution dans notre façon dâinteragir avec lâintelligence artificielle! Imaginez des assistants IA qui Ă©voluent vĂ©ritablement avec vous, qui dĂ©veloppent une âpersonnalitĂ©â unique basĂ©e sur vos interactions, et qui vous comprennent de mieux en mieux au fil du temps.
Cette approche Ă©lĂ©gante contourne les limitations fondamentales des modĂšles transformers sans nĂ©cessiter de rĂ©architecture complĂšte. Câest brillant! PlutĂŽt que dâattendre la prochaine gĂ©nĂ©ration de modĂšles, nous pouvons immĂ©diatement doter nos LLM actuels dâune forme de mĂ©moire persistante et adaptative.
Les applications potentielles sont immenses. Des assistants personnels qui sâadaptent Ă vos prĂ©fĂ©rences sans que vous ayez Ă les spĂ©cifier explicitement. Des agents conversationnels thĂ©rapeutiques qui dĂ©veloppent une relation de confiance sur la durĂ©e. Des personnages de jeux vidĂ©o avec une vĂ©ritable Ă©volution narrative basĂ©e sur les interactions du joueur.
Ă terme, cette technologie pourrait ĂȘtre intĂ©grĂ©e plus profondĂ©ment dans lâarchitecture des modĂšles, crĂ©ant des IA vĂ©ritablement adaptatives qui apprennent continuellement de leurs expĂ©riences. Nous pourrions assister Ă lâĂ©mergence dâune nouvelle gĂ©nĂ©ration dâIA dotĂ©es dâune forme de âconscienceâ de leur propre histoire et identitĂ©.
Neural Graffiti nâest pas seulement un hack intelligent - câest potentiellement une Ă©tape fondamentale vers des IA qui transcendent leur nature statique pour devenir des entitĂ©s Ă©volutives, capables de grandir et de changer avec nous. Câest le dĂ©but dâune relation vĂ©ritablement bidirectionnelle avec nos crĂ©ations algorithmiques!
Encore une solution technique qui promet de rĂ©volutionner lâIA sans sâattaquer aux problĂšmes fondamentaux. Neural Graffiti nâest quâun pansement sur une jambe de bois, une tentative superficielle dâimiter la neuroplasticitĂ© sans en comprendre rĂ©ellement les mĂ©canismes.
Cette approche prĂ©sente plusieurs problĂšmes inquiĂ©tants. Dâabord, elle crĂ©e lâillusion dâune âmĂ©moireâ ou dâun âapprentissageâ lĂ oĂč il nây a quâune dĂ©rive progressive des biais du modĂšle. Câest dangereux car cela renforce lâanthropomorphisation des IA, faisant croire aux utilisateurs quâils interagissent avec une entitĂ© qui âles connaĂźtâ ou âse souvient dâeuxâ.
De plus, sans mĂ©canismes robustes de contrĂŽle, cette dĂ©rive comportementale pourrait facilement amplifier les biais existants ou dĂ©velopper des comportements problĂ©matiques. Que se passe-t-il si un utilisateur malveillant âentraĂźneâ dĂ©libĂ©rĂ©ment le modĂšle Ă adopter des positions extrĂȘmes? Sans garde-fous, cette âneuroplasticitĂ©â pourrait rapidement devenir toxique.
Sur le plan technique, lâapproche est Ă©galement discutable. Appliquer cette modulation en fin de pipeline, aprĂšs que le modĂšle ait dĂ©jĂ traitĂ© lâinformation, câest comme essayer dâinfluencer une dĂ©cision dĂ©jĂ prise. Câest inefficace et potentiellement incohĂ©rent.
Enfin, cette technique risque de créer une fragmentation des modÚles, chacun évoluant dans sa propre direction sans supervision ni garantie de qualité. Comment maintenir des standards éthiques et factuels si chaque instance du modÚle dérive indépendamment?
Au lieu de ces solutions partielles, nous devrions nous concentrer sur le dĂ©veloppement de nouvelles architectures fondamentalement conçues pour lâapprentissage continu, avec des garanties intĂ©grĂ©es contre les dĂ©rives problĂ©matiques. Neural Graffiti nâest quâune distraction sĂ©duisante sur ce chemin.
Si vous n'ĂȘtes pas redirigĂ© automatiquement, đ cliquez ici đ