AMD innove avec l AI Max+ 395: 96Go de mémoire unifiée pour faire rouler des modèles d IA locale de 70B! Plus rapide qu une RTX 4090 et 87% plus économe. Une révolution pour l IA domestique? 🤖💭 #IALocale #AMD #CES2025 #Innovation

Article en référence: https://www.reddit.com/r/LocalLLaMA/comments/1hv7cia/22x_faster_at_tokenssec_vs_rtx_4090_24gb_using/

Récapitulatif factuel

AMD vient d’annoncer au CES 2025 une nouvelle puce nommée AI Max+ 395, intégrant jusqu’à 96 Go de mémoire unifiée. Cette architecture permet, selon AMD, d’exécuter des modèles de langage (LLM) de 70 milliards de paramètres 2,2 fois plus rapidement qu’une NVIDIA RTX 4090, tout en consommant 87% moins d’énergie.

La puce offre une bande passante mémoire de 250 Go/s, comparable à une RTX 4060. Pour comprendre l’importance de ces chiffres, la bande passante mémoire détermine la vitesse à laquelle les données peuvent être traitées - un facteur crucial pour l’exécution des LLMs.

L’innovation majeure réside dans l’architecture de mémoire unifiée, similaire à l’approche d’Apple, permettant d’accéder à la totalité de la mémoire sans avoir à jongler entre la VRAM (mémoire vidéo) et la RAM système.

Point de vue neutre

Cette annonce représente une évolution intéressante mais pas révolutionnaire dans le paysage de l’IA locale. La comparaison avec la RTX 4090 est techniquement vraie mais mérite d’être nuancée : la RTX 4090 ne peut pas charger entièrement un modèle de 70B dans ses 24 Go de VRAM, ce qui explique la différence de performance.

La vitesse de traitement attendue (environ 5-7 tokens par seconde) reste dans une gamme acceptable pour une utilisation personnelle, particulièrement pour des conversations textuelles. C’est suffisant pour suivre le rythme de lecture humain, mais pas optimal pour des applications nécessitant un traitement rapide.

Exemple

Imaginez une cuisine où vous préparez un repas complexe. La RTX 4090, c’est comme avoir un énorme plan de travail (24 Go de VRAM) mais devoir constamment aller chercher des ingrédients dans le garde-manger (RAM système). L’AI Max+ 395, c’est comme avoir une cuisine entièrement réaménagée où tout est à portée de main (96 Go de mémoire unifiée), même si vous travaillez un peu plus lentement.

C’est la différence entre un chef qui court partout dans sa cuisine et un chef qui a tout sous la main - peut-être plus lent dans ses gestes, mais plus efficace dans son organisation.

Point de vue optimiste

Cette innovation marque le début d’une nouvelle ère pour l’IA domestique! Avec un prix potentiel autour de 2-3000$, cette solution permettra enfin à monsieur et madame Tout-le-monde d’avoir leur propre assistant IA puissant à la maison, sans compromis sur la confidentialité.

L’approche d’AMD pourrait démocratiser l’accès aux grands modèles de langage, ouvrant la voie à une multitude d’applications pratiques : aide à la rédaction, support technique personnalisé, apprentissage assisté… Tout cela en consommant moins d’énergie et en étant plus accessible financièrement.

Point de vue pessimiste

Les chiffres annoncés par AMD semblent trop beaux pour être vrais. La bande passante mémoire de 250 Go/s reste un goulot d’étranglement significatif qui limitera sérieusement les performances réelles. De plus, la comparaison avec la RTX 4090 paraît délibérément trompeuse.

Les utilisateurs risquent d’être déçus en découvrant que les performances réelles sont bien inférieures aux attentes créées par le marketing. Pour les applications professionnelles sérieuses, il faudra toujours se tourner vers des solutions plus coûteuses avec des cartes graphiques dédiées et plus de VRAM.

Redirection en cours...

Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈