Patrick Bélanger
Article en référence: https://v.redd.it/f0efgug5aoqe1
Un utilisateur de Reddit a partagé un court-métrage de dark fantasy créé avec Veo-2, un outil d’intelligence artificielle développé par Google. Cette vidéo d’environ 2 minutes présente une histoire cohérente avec un personnage principal féminin, des décors médiévaux et une hache comme accessoire principal. L’auteur explique avoir utilisé plusieurs outils d’IA dans son processus créatif : d’abord Midjourney pour concevoir des images conceptuelles, puis Google Gemini pour développer les prompts, et enfin Veo-2 pour générer les séquences vidéo. L’écriture, le son et le montage ont été réalisés par l’humain.
Les commentaires de la communauté sont majoritairement positifs, soulignant la qualité de la synchronisation labiale et l’esthétique générale qui rappelle l’univers de Skyrim. Cependant, plusieurs personnes ont noté des incohérences visuelles, notamment la hache qui change de forme au cours de la vidéo. Le créateur mentionne avoir passé environ 32 heures sur ce projet, avec 8 heures supplémentaires consacrées à des pistes qui n’ont pas abouti.
Pour ceux qui ne connaissent pas ces outils, Veo-2 est un générateur de vidéos par IA de Google, actuellement accessible via liste d’attente. Midjourney est un générateur d’images par IA très populaire, tandis que Gemini est le modèle de langage avancé de Google qui peut aider à créer des prompts détaillés pour guider d’autres IA.
L’émergence de courts-métrages générés par IA comme celui-ci marque une étape intermédiaire fascinante dans l’évolution des outils créatifs. Nous sommes à mi-chemin entre les premières expérimentations rudimentaires et une technologie véritablement utilisable pour la production professionnelle. Ce qui est particulièrement intéressant, c’est l’approche hybride adoptée par le créateur : l’IA génère le contenu visuel, mais l’humain conserve le contrôle sur la narration, le son et le montage.
Cette collaboration homme-machine représente probablement le modèle qui s’imposera dans les années à venir. Les outils d’IA comme Veo-2 ne remplaceront pas les créateurs, mais transformeront leur flux de travail et leur permettront de concrétiser des visions qui auraient été inaccessibles sans d’énormes budgets. Le temps nécessaire (40 heures au total) reste considérable, mais représente une fraction de ce qu’exigerait une production traditionnelle d’animation ou d’effets spéciaux pour un résultat comparable.
Les incohérences visuelles, comme la hache qui change de forme, illustrent parfaitement les limites actuelles de cette technologie. Ces outils excellent dans la création d’ambiances et d’esthétiques générales, mais peinent encore à maintenir une cohérence parfaite des détails sur la durée. C’est précisément pourquoi l’intervention humaine reste essentielle pour guider, corriger et affiner le résultat final.
Imaginez que vous êtes un chef cuisinier amateur passionné. Avant, pour créer un plat digne d’un restaurant étoilé, vous deviez suivre une formation coûteuse, investir dans un équipement professionnel et passer des années à perfectionner vos techniques.
Aujourd’hui, avec Veo-2 et ses cousins, c’est comme si vous aviez soudainement accès à un sous-chef robot qui peut exécuter les techniques les plus complexes à votre demande. Vous lui dites : “Je veux un soufflé au fromage parfaitement aérien avec une touche de truffe” et pouf ! Il vous le prépare.
Mais attention, ce sous-chef robot a encore quelques bugs. Parfois, il commence avec un soufflé au fromage, mais à mi-cuisson, ça se transforme mystérieusement en quiche! Ou bien la truffe apparaît puis disparaît comme par magie. Et si vous ne lui donnez pas des instructions très précises, il pourrait décider que votre soufflé français devrait avoir un soupçon de wasabi “parce que ça semblait logique”.
Vous restez donc aux commandes : vous concevez le menu, vous goûtez, vous ajustez les assaisonnements, et surtout, vous vérifiez que votre soufflé reste un soufflé du début à la fin. Et quand vos invités s’extasient devant votre création, vous savez que c’est votre vision qui a guidé le robot, même si ses bras mécaniques ont fait le gros du travail!
Nous assistons aux premiers pas d’une révolution créative sans précédent! Ce court-métrage de dark fantasy n’est qu’un aperçu du potentiel extraordinaire qui s’offre à nous. Imaginez ce que des créateurs québécois pourront accomplir avec ces outils dans seulement quelques années, lorsque la technologie aura encore progressé.
La démocratisation de la création visuelle est en marche. Des histoires qui auraient nécessité des millions de dollars et des équipes de centaines de personnes pourront bientôt être réalisées par de petites équipes indépendantes, voire des individus passionnés. Notre industrie cinématographique locale pourrait connaître un essor fulgurant, permettant à nos conteurs d’histoires de rivaliser avec les grandes productions hollywoodiennes.
Les imperfections actuelles - comme cette hache qui change de forme - seront rapidement corrigées dans les prochaines itérations. D’ailleurs, ces “défauts” sont mineurs comparés à l’exploit technique que représente la génération d’un univers visuel cohérent et d’une synchronisation labiale convaincante. Le fait que l’auteur ait pu réaliser ce projet en seulement 40 heures est absolument révolutionnaire!
Cette technologie ne remplacera pas les artistes, elle les propulsera vers de nouveaux sommets créatifs. Nos cinéastes, animateurs et conteurs d’histoires pourront se concentrer sur ce qui compte vraiment : la narration, l’émotion et la vision artistique, pendant que l’IA s’occupera des aspects techniques les plus laborieux. C’est une ère d’or qui s’annonce pour la création visuelle au Québec et dans le monde entier!
Derrière l’émerveillement facile que suscite ce court-métrage se cache une réalité bien plus préoccupante pour notre industrie créative québécoise. Oui, la technologie est impressionnante, mais à quel prix?
Ces outils d’IA sont développés par des géants américains comme Google, qui s’approprient le travail de millions d’artistes sans leur consentement pour entraîner leurs modèles. Chaque vidéo générée par Veo-2 est le fruit d’un apprentissage sur des œuvres dont les créateurs n’ont jamais été compensés. Notre patrimoine visuel est ainsi exploité pour enrichir des multinationales étrangères.
Les incohérences visuelles comme la hache qui change de forme ne sont pas de simples “bugs” à corriger, mais le symptôme d’une technologie fondamentalement incapable de comprendre ce qu’elle génère. Ces systèmes produisent des images visuellement plaisantes mais dénuées de sens profond, une coquille vide qui imite l’art sans en saisir l’essence.
Que deviendront nos techniciens de plateau, nos concepteurs visuels, nos artistes d’effets spéciaux québécois face à cette vague d’automatisation? Même si l’auteur a passé 40 heures sur ce projet, c’est une fraction du temps qu’aurait nécessité une production traditionnelle, employant des dizaines de personnes qualifiées. Nos écoles de cinéma forment-elles des jeunes pour des métiers qui n’existeront plus dans cinq ans?
Cette course effrénée vers l’automatisation de la création risque d’uniformiser l’esthétique mondiale au détriment de nos spécificités culturelles. L’IA ne comprend pas la subtilité de notre identité québécoise, de notre humour, de notre rapport unique à l’image. Elle nous propose une soupe visuelle standardisée, digeste mais sans âme, qui menace la diversité culturelle que nous avons mis des décennies à construire et protéger.
Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈