Patrick Bélanger
Article en référence: https://i.redd.it/zjx8b508qqle1.png
OpenAI vient d’annoncer les tarifs pour son nouveau modèle GPT-4.5, et ils sont significativement plus élevés que ceux des modèles précédents. Selon les informations partagées sur Reddit, l’API de GPT-4.5 coûtera 75$ par million de tokens en entrée (input) et 150$ par million de tokens en sortie (output).
Pour mettre ces chiffres en perspective, GPT-4o coûte actuellement entre 5$ et 15$ par million de tokens, tandis que GPT-4o mini est encore moins cher à 0,60$ par million de tokens en moyenne. Cela signifie que GPT-4.5 est environ 15 fois plus coûteux que GPT-4o et près de 150 fois plus cher que GPT-4o mini.
OpenAI présente ce lancement comme une “version de recherche” (Research Preview), suggérant qu’il s’agit d’un modèle expérimental qui n’est pas encore optimisé pour une utilisation à grande échelle. Les utilisateurs de ChatGPT Plus, qui paient un abonnement mensuel de 20$, n’auront qu’un accès très limité à ce nouveau modèle - certains estiment qu’ils pourraient n’avoir droit qu’à quelques requêtes par mois.
Il est important de comprendre que GPT-4.5 n’est pas un modèle de “raisonnement” comme Claude Opus ou GPT-o1. Il a plutôt été conçu pour exceller dans la créativité, l’intuition et la compréhension du monde. Selon les commentaires des premiers utilisateurs, il serait particulièrement performant pour la programmation React et d’autres tâches créatives.
Cette tarification élevée reflète probablement la réalité économique derrière les grands modèles d’IA. Comme l’ont souligné plusieurs commentateurs, le coût d’exploitation de ces modèles massifs est considérable, et OpenAI doit rentabiliser ses investissements en recherche et développement.
Nous assistons à un moment charnière dans l’évolution des modèles de langage. Les gains de performance deviennent de plus en plus marginaux par rapport aux ressources de calcul nécessaires. Cette tendance suggère que nous approchons peut-être d’un plateau dans l’architecture actuelle des LLMs, où multiplier par 10 la puissance de calcul n’apporte qu’une amélioration incrémentale des performances.
La stratégie d’OpenAI semble être de segmenter le marché : proposer des modèles haut de gamme extrêmement coûteux pour les entreprises qui peuvent se le permettre, tout en maintenant des options plus abordables pour le grand public. Cette approche est comparable à celle d’autres industries technologiques, où les produits premium servent souvent à financer l’innovation qui bénéficiera ensuite aux produits grand public.
À terme, nous verrons probablement une version “distillée” et plus efficace de GPT-4.5, peut-être sous le nom de GPT-4.5o, qui offrira un meilleur équilibre entre performance et coût. En attendant, la plupart des utilisateurs continueront à utiliser GPT-4o ou d’autres alternatives plus abordables.
Imaginez que vous êtes un amateur de voitures et que vous suivez le lancement des nouveaux modèles. Un jour, Ferrari annonce sa nouvelle supercar, la “Intelligenza Artificiale 4.5”. Elle est magnifique, plus rapide que tout ce qui existe sur le marché, et coûte 1,5 million de dollars.
Vous êtes abonné au club Ferrari pour 200$ par an, ce qui vous donne normalement accès à des essais routiers exclusifs. Mais cette fois-ci, Ferrari vous annonce que votre abonnement vous donne droit à… exactement 5 minutes au volant de la nouvelle supercar. Par an.
“Mais pourquoi si peu?” demandez-vous. “C’est une version de recherche,” vous répond-on. “Elle consomme tellement d’essence que nous ne pouvons pas la faire rouler tout le temps. Et puis, nous travaillons déjà sur un modèle plus efficace qui sortira l’année prochaine.”
Pendant ce temps, votre voisin qui conduit une Tesla Model 3 vous regarde avec un sourire narquois. “Ma voiture s’améliore tous les mois avec les mises à jour gratuites,” dit-il. “Et je peux la conduire autant que je veux sans me ruiner.”
Vous réfléchissez alors : est-ce que ces 5 minutes dans la Ferrari valent vraiment la peine? Peut-être que pour impressionner vos amis ou pour l’expérience unique… mais pour vos déplacements quotidiens, la Tesla (ou même votre bonne vieille Volkswagen) fait parfaitement l’affaire.
Cette tarification élevée est en réalité le signe d’une avancée technologique majeure! Si OpenAI demande un tel prix, c’est que GPT-4.5 représente un bond en avant significatif. Certains utilisateurs rapportent déjà que c’est “de loin le modèle le plus convaincant” qu’ils aient jamais utilisé, particulièrement pour des cas d’usage spécifiques et rentables.
Cette stratégie de prix premium est classique dans l’innovation technologique : les premiers adoptants financent le développement qui permettra ensuite de démocratiser la technologie. Rappelez-vous que les premiers ordinateurs personnels coûtaient l’équivalent de plusieurs mois de salaire!
De plus, cette tarification élevée va stimuler la concurrence. DeepSeek, Anthropic, Google et d’autres vont redoubler d’efforts pour proposer des alternatives plus abordables, ce qui accélérera l’innovation dans le domaine. C’est exactement ce qu’il nous faut pour continuer à repousser les limites de l’IA!
À terme, les techniques développées pour GPT-4.5 seront optimisées et rendues plus efficaces, permettant de créer des modèles aussi performants mais beaucoup moins coûteux à exécuter. C’est le cycle naturel de l’innovation : d’abord cher et exclusif, puis abordable et accessible à tous.
Et n’oublions pas que pour certaines applications à haute valeur ajoutée (comme le développement logiciel, la recherche médicale ou la finance), même à ce prix, GPT-4.5 peut représenter un investissement rentable s’il permet de gagner en productivité ou de créer de nouveaux produits innovants.
Cette tarification exorbitante révèle les limites fondamentales de l’approche actuelle en IA. Nous avons atteint un point où les gains de performance deviennent marginaux malgré des investissements massifs en puissance de calcul. C’est le signe que l’ère des améliorations spectaculaires par simple mise à l’échelle touche à sa fin.
OpenAI semble avoir perdu le nord depuis le départ d’Ilya Sutskever et d’autres chercheurs clés. Au lieu d’innover véritablement, ils se contentent d’augmenter la taille des modèles et de facturer plus cher, sans apporter de réelle valeur ajoutée proportionnelle à cette augmentation de prix.
Cette stratégie risque de se retourner contre eux. Les concurrents comme DeepSeek, Anthropic et Google proposent déjà des modèles presque aussi performants à une fraction du prix. Les entreprises et développeurs vont naturellement se tourner vers ces alternatives plus abordables, et une fois qu’ils auront migré, ils ne reviendront probablement pas.
Plus inquiétant encore, cette course à la puissance brute creuse le fossé entre les géants technologiques et les acteurs plus modestes. Seules quelques entreprises dans le monde peuvent se permettre de former et d’exploiter des modèles de cette taille, ce qui concentre encore davantage le pouvoir technologique.
À long terme, cette approche n’est pas viable, ni économiquement, ni écologiquement. Les ressources informatiques et énergétiques nécessaires pour ces modèles géants sont colossales. Si l’IA doit vraiment devenir une technologie d’utilité générale, elle devra trouver des voies plus efficientes que cette course à l’armement computationnel.
Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈