Patrick Bélanger
Article en référence: https://v.redd.it/e9xdcp5xoh4e1
Article Reddit: First demo from World Labs - $230m Startup Led by Fei Fei Li. Step inside images and interact with them! https://www.reddit.com/r/singularity/comments/1h53vje/first_demo_from_world_labs_230m_startup_led_by/
World Labs, une startup dirigée par Fei Fei Li ayant levé 230 millions de dollars, vient de dévoiler sa première démonstration technologique. Cette technologie permet de “pénétrer” dans des images 2D pour les explorer en 3D. Le système utilise une combinaison de cartes de profondeur (qui déterminent la distance des objets dans une scène) et de méthodes de projection pour créer une illusion de profondeur.
Concrètement, l’utilisateur peut se déplacer légèrement (environ 3 pas) dans l’environnement généré, observant la scène sous différents angles. La technologie s’appuie sur les “gaussian splats”, une technique de rendu 3D qui utilise des points dans l’espace pour représenter des surfaces, plutôt que des polygones traditionnels.
Cette démonstration s’inscrit dans un contexte plus large de recherche sur l’intelligence spatiale visuelle, visant à permettre aux systèmes d’IA de mieux comprendre et interagir avec l’espace tridimensionnel.
Cette technologie représente une étape intéressante mais préliminaire dans l’évolution des interfaces homme-machine. Bien qu’impressionnante pour le grand public, elle présente actuellement des limitations significatives en termes de liberté de mouvement et de fidélité visuelle.
La vraie valeur de cette innovation réside peut-être moins dans son application immédiate que dans ce qu’elle suggère pour l’avenir. Elle démontre une progression dans notre capacité à transformer des images 2D en expériences plus immersives, même si nous sommes encore loin d’une véritable navigation 3D fluide.
Cette technologie pourrait trouver sa place dans des applications spécifiques comme la visualisation architecturale ou la prévisualisation rapide d’environnements, tout en reconnaissant qu’elle ne remplacera pas les méthodes traditionnelles de création 3D dans l’immédiat.
C’est une révolution en devenir! Cette technologie pourrait transformer radicalement notre façon d’interagir avec les contenus visuels. Imaginez pouvoir “entrer” dans n’importe quelle photo de votre collection, explorer des lieux historiques comme si vous y étiez, ou visualiser instantanément des concepts architecturaux en 3D.
Pour l’éducation et la formation, les possibilités sont infinies. Les étudiants pourraient explorer des reconstitutions historiques, les médecins visualiser des cas cliniques en 3D, et les architectes présenter leurs projets de manière immersive en quelques clics.
Cette technologie n’est que la première étape vers un futur où la frontière entre le réel et le virtuel s’estompera, ouvrant la voie à des expériences toujours plus riches et immersives.
Cette démonstration illustre parfaitement la tendance actuelle à survaloriser des technologies encore immatures. Avec 230 millions de dollars d’investissement, on aurait pu s’attendre à des résultats plus substantiels qu’une simple amélioration des techniques de projection 3D existantes.
Les limitations actuelles (mouvements très restreints, artefacts visuels) suggèrent que nous sommes encore très loin d’applications pratiques viables. Il y a un risque réel que cette technologie rejoigne la longue liste des “solutions en recherche d’un problème”, consommant des ressources considérables sans apporter de valeur réelle.
De plus, cette course à l’investissement dans des technologies immersives pourrait détourner l’attention et les ressources de défis plus urgents en IA, comme la sécurité et l’éthique.
Si vous n'êtes pas redirigé automatiquement, 👉 cliquez ici 👈