PANews a annoncé le 3 décembre que World Labs, la société d’intelligence spatiale fondée par le professeur de l’université Stanford Fei-Fei Li, a développé un système d’intelligence artificielle piège AI qui peut générer un monde 3D complet à partir d’une seule image d’entrée et résoudre les problèmes de manque de contrôle et de cohérence des modèles d’IA générative existants. Ce système non seulement peut estimer la forme géométrique 3D, mais peut également combler les parties non vues de la scène, générer du nouveau contenu et permettre aux utilisateurs d’explorer librement la scène 3D de manière ludique.
Les scènes 3D générées prennent en charge un rendu en temps réel dans le navigateur, permettant de simuler des effets de caméra 3D tels que la profondeur de champ peu profonde et le zoom avant arrière. Comparé au modèle de génération basé sur la prédiction des pixels, ce système suit les règles géométriques 3D, les scènes sont cohérentes et prennent en charge l’interaction dynamique, comme la modification de l’éclairage, de l’apparence et l’insertion de nouveaux objets.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
World Labs lance un système d'IA pour créer des mondes en 3D à partir d'une seule image et prend en charge l'interaction en temps réel
PANews a annoncé le 3 décembre que World Labs, la société d’intelligence spatiale fondée par le professeur de l’université Stanford Fei-Fei Li, a développé un système d’intelligence artificielle piège AI qui peut générer un monde 3D complet à partir d’une seule image d’entrée et résoudre les problèmes de manque de contrôle et de cohérence des modèles d’IA générative existants. Ce système non seulement peut estimer la forme géométrique 3D, mais peut également combler les parties non vues de la scène, générer du nouveau contenu et permettre aux utilisateurs d’explorer librement la scène 3D de manière ludique. Les scènes 3D générées prennent en charge un rendu en temps réel dans le navigateur, permettant de simuler des effets de caméra 3D tels que la profondeur de champ peu profonde et le zoom avant arrière. Comparé au modèle de génération basé sur la prédiction des pixels, ce système suit les règles géométriques 3D, les scènes sont cohérentes et prennent en charge l’interaction dynamique, comme la modification de l’éclairage, de l’apparence et l’insertion de nouveaux objets.