Notícias PANews em 3 de dezembro, a empresa de inteligência espacial World Labs fundada pelo professor da Universidade de Stanford, Fei-Fei Li, anunciou o desenvolvimento de um sistema de IA armadilha, que pode gerar um mundo 3D completo a partir de uma única imagem de entrada e resolver o problema de falta de controle e consistência nos modelos de IA gerativos existentes. Este sistema não só pode estimar formas geométricas 3D, mas também preencher partes não vistas na cena, gerar novo conteúdo, permitindo aos usuários explorar livremente a cena 3D de forma semelhante a um jogo.
As cenas 3D geradas suportam renderização em tempo real no navegador, permitindo a simulação de efeitos de câmera 3D, como profundidade de campo rasa e zoom de rastreamento. Em comparação com modelos de geração com previsão de pixels, esse sistema segue as regras geométricas 3D, mantendo a consistência e suportando interações dinâmicas, como a alteração de luz, aparência e inserção de novos objetos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A World Labs lançou um sistema de IA que gera um mundo em 3D a partir de uma única imagem e oferece suporte à interação em tempo real.
Notícias PANews em 3 de dezembro, a empresa de inteligência espacial World Labs fundada pelo professor da Universidade de Stanford, Fei-Fei Li, anunciou o desenvolvimento de um sistema de IA armadilha, que pode gerar um mundo 3D completo a partir de uma única imagem de entrada e resolver o problema de falta de controle e consistência nos modelos de IA gerativos existentes. Este sistema não só pode estimar formas geométricas 3D, mas também preencher partes não vistas na cena, gerar novo conteúdo, permitindo aos usuários explorar livremente a cena 3D de forma semelhante a um jogo. As cenas 3D geradas suportam renderização em tempo real no navegador, permitindo a simulação de efeitos de câmera 3D, como profundidade de campo rasa e zoom de rastreamento. Em comparação com modelos de geração com previsão de pixels, esse sistema segue as regras geométricas 3D, mantendo a consistência e suportando interações dinâmicas, como a alteração de luz, aparência e inserção de novos objetos.