Patrick Bélanger
Article en référence: https://v.redd.it/u94s6yzdxqte1
Une nouvelle avancée dans le domaine de l’intelligence artificielle générative vient d’être présentée sur Reddit : une vidéo de Tom & Jerry entièrement créée par IA. Cette animation d’une minute a été générée par un modèle appelé TTT-MLP, développé conjointement par l’Université Stanford et NVIDIA. Contrairement aux technologies précédentes qui nécessitaient souvent de combiner plusieurs segments, cette vidéo a été produite en une seule fois à partir d’une unique requête textuelle (prompt) détaillée.
La vidéo montre Tom et Jerry dans un environnement moderne avec des ordinateurs, suivant le style classique des dessins animés originaux. On y voit notamment Jerry qui mord un câble électrique, provoquant des problèmes pour Tom. Bien que l’animation respecte l’esthétique visuelle de la série originale, plusieurs utilisateurs ont noté des incohérences dans les mouvements et le comportement des personnages.
Ce type de technologie représente une évolution significative dans la génération de contenu vidéo par IA. Le modèle TTT-MLP peut produire des animations complètes d’une minute à partir d’une description textuelle, sans intervention humaine dans le processus de création. Pour les curieux, les chercheurs ont publié un article scientifique détaillant cette technologie, accessible via le site test-time-training.github.io/video-dit/.
Cette démonstration de Tom & Jerry générée par IA se situe exactement à l’intersection de l’impressionnant et de l’imparfait. Nous assistons à un moment charnière dans l’évolution des technologies créatives, comparable peut-être aux premiers films des frères Lumière : techniquement révolutionnaire mais artistiquement encore rudimentaire.
Ce qui est particulièrement notable, c’est la vitesse à laquelle cette technologie progresse. Là où d’autres innovations ont mis des décennies à se perfectionner, la génération vidéo par IA semble franchir des étapes majeures en quelques mois seulement. Cette accélération s’explique par la nature même de l’apprentissage machine, qui s’améliore exponentiellement avec chaque itération et chaque nouveau jeu de données.
Cependant, la question fondamentale reste celle de la valeur créative. Cette vidéo, bien qu’impressionnante sur le plan technique, manque encore de l’âme et de la finesse narrative qui caractérisent les œuvres humaines. Elle reproduit des éléments visuels sans véritablement capturer l’essence comique et le timing parfait qui ont fait le succès de Tom & Jerry.
Cette technologie n’est ni un miracle créatif ni une menace existentielle pour les artistes. Elle est simplement un nouvel outil en développement, dont l’utilité et l’impact réels dépendront autant de nos choix collectifs que de ses capacités techniques.
Imaginez que vous êtes au Vieux-Port de Montréal, devant un portraitiste de rue. Il dessine votre caricature en quelques minutes, capturant vos traits distinctifs avec talent. C’est un art qui demande des années de pratique.
Maintenant, imaginez qu’à côté de lui s’installe une machine étrange. Un passant tape quelques mots sur un clavier : “Homme dans la quarantaine, lunettes, barbe poivre et sel, sourire en coin”. En moins d’une minute, la machine produit un portrait qui, de loin, ressemble effectivement à une caricature correcte.
Les touristes s’attroupent, impressionnés. “C’est magique!” s’exclame une dame. Mais en s’approchant, on remarque que les proportions sont bizarres, que la main gauche a six doigts, et que le sourire ne reflète pas vraiment cette ironie subtile si caractéristique du sujet.
Le portraitiste observe la scène, mi-amusé, mi-inquiet. “Pas mal,” concède-t-il, “mais regarde les détails. La machine ne comprend pas pourquoi tu souris comme ça après avoir pris ton café matinal chez le petit italien du coin. Elle ne capte pas ton histoire.”
C’est exactement ce qui se passe avec notre Tom & Jerry généré par IA. De loin, ça ressemble à Tom & Jerry. Les formes y sont, les couleurs aussi. Mais ce “je-ne-sais-quoi” qui fait qu’une poursuite entre un chat et une souris nous fait rire depuis 80 ans? Il manque encore à l’appel. Pour l’instant.
Cette vidéo de Tom & Jerry générée par IA n’est rien de moins que le début d’une révolution créative sans précédent! Nous assistons aux premiers balbutiements d’une technologie qui va démocratiser la création d’animations de qualité professionnelle pour tous.
Imaginez le potentiel: dans quelques années seulement, n’importe qui pourra créer son propre dessin animé personnalisé, sans avoir besoin d’une équipe de centaines d’animateurs ni de millions de dollars de budget. Les créateurs indépendants pourront produire des séries entières depuis leur salon, les enseignants pourront générer des contenus éducatifs sur mesure, et les parents pourront créer des histoires personnalisées mettant en scène leurs enfants comme héros!
Cette technologie va libérer un tsunami de créativité. Elle ne remplacera pas les artistes, mais les élèvera à un nouveau rôle: celui de directeurs créatifs, de visionnaires qui guideront ces outils plutôt que de passer des heures sur des tâches répétitives. Les limitations actuelles - mouvements parfois maladroits, incohérences narratives - seront rapidement surmontées avec chaque nouvelle itération.
Et ce n’est que le début! Bientôt, nous verrons des films entiers générés par IA, des univers visuels complètement nouveaux que l’imagination humaine seule n’aurait peut-être jamais conçus. La créativité humaine, amplifiée par l’IA, nous mènera vers une renaissance artistique numérique dont nous commençons à peine à entrevoir les contours. L’avenir de l’animation n’a jamais été aussi brillant!
Cette vidéo de Tom & Jerry générée par IA devrait nous inquiéter bien plus qu’elle ne nous impressionne. Derrière l’aspect novateur se cache une menace réelle pour tout un écosystème créatif.
D’abord, regardons la qualité: médiocre, sans âme, dépourvue de la finesse et du timing comique qui ont fait la renommée de la série originale. Mais ne nous y trompons pas, cette médiocrité est temporaire. Dans deux ans, peut-être moins, ces systèmes produiront des animations indiscernables de celles créées par des humains - mais à une fraction du coût et en quelques minutes plutôt qu’en des mois de travail.
Que deviendront alors les milliers d’animateurs, scénaristes et artistes qui consacrent leur vie à ce métier? Les studios d’animation québécois qui font notre fierté? Nous risquons de voir émerger un monde où la création artistique devient une commodité générée en masse, où la valeur du travail créatif s’effondre complètement.
Plus inquiétant encore: cette technologie se nourrit des œuvres créées par des humains sans leur consentement. Le modèle qui a généré cette vidéo a été entraîné sur des milliers d’épisodes de Tom & Jerry et d’autres dessins animés, sans compensation pour les artistes originaux. C’est une forme d’appropriation culturelle industrialisée.
Et n’oublions pas l’impact environnemental. L’entraînement de ces modèles d’IA consomme des quantités astronomiques d’énergie, contribuant significativement au réchauffement climatique pour… quoi au juste? Des versions médiocres de contenus qui existaient déjà? Est-ce vraiment le progrès que nous souhaitons?
Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈