Patrick Bélanger
Article en référence: https://i.redd.it/htw4k9cwdvfe1.png
DeepSeek, une entreprise chinoise d’IA, a récemment lancé un modèle de langage qui rivalise avec ChatGPT, affirmant l’avoir développé pour seulement 6 millions de dollars. Cette annonce a provoqué une chute significative des actions technologiques américaines, effaçant près d’un billion de dollars de capitalisation boursière.
Palmer Luckey, fondateur d’Anduril (une entreprise de technologie militaire) et créateur d’Oculus, suggère que ces affirmations sont de la propagande chinoise. Il soutient que ces informations font partie d’une stratégie de désinformation visant à déstabiliser le marché technologique américain.
Le modèle DeepSeek utilise une architecture MoE (Mixture of Experts) avec 37 milliards de paramètres actifs, totalisant 670 milliards de paramètres. Cette approche permet une utilisation plus efficace des ressources comparée aux modèles traditionnels comme GPT-4.
La réalité se situe probablement entre les deux extrêmes. DeepSeek a certainement bénéficié des avancées open source et des recherches existantes, réduisant significativement ses coûts de développement. Le chiffre de 6 millions pourrait être exact pour la phase finale d’entraînement, mais ne reflète pas l’investissement global en R&D et infrastructure.
La réaction du marché semble disproportionnée, mais illustre la fragilité des valorisations actuelles dans le secteur de l’IA. Cette situation révèle aussi la tension croissante entre l’innovation ouverte et les intérêts commerciaux établis.
Imaginez une recette de grand-mère transmise de génération en génération. Une nouvelle pâtisserie ouvre et prétend avoir recréé le gâteau parfait en quelques semaines, alors que la famille y a consacré des décennies. Les pâtissiers établis crient au scandale, mais les clients ne s’intéressent qu’au goût et au prix.
La pâtisserie a-t-elle vraiment tout développé seule, ou a-t-elle profité des connaissances accumulées par d’autres? Le débat fait rage, pendant que les gourmands savourent leur gâteau moins cher.
Cette situation démontre la démocratisation rapide de l’IA. Si une entreprise peut développer un modèle performant pour une fraction du coût habituel, cela ouvre la voie à une innovation plus accessible et diversifiée. La compétition accrue poussera l’ensemble du secteur à devenir plus efficace et transparent.
L’open source et le partage des connaissances permettent d’accélérer le progrès global. Plutôt que de voir cela comme une menace, c’est une opportunité de repenser nos approches et de créer des solutions plus innovantes et accessibles.
Cette situation pourrait marquer le début d’une guerre technologique destructrice. Si les entreprises peuvent facilement copier et reproduire des années de recherche, cela pourrait décourager l’innovation fondamentale et les investissements à long terme.
La course effrénée vers des modèles toujours plus grands et moins chers pourrait aussi négliger des aspects cruciaux comme la sécurité et l’éthique. Les valorisations gonflées du secteur de l’IA risquent de créer une bulle dont l’éclatement aurait des conséquences dévastatrices sur l’économie mondiale.
Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈