PANews ngày 3 tháng 12, World Labs, công ty trí thông minh không gian do giáo sư trường đại học Stanford Li Feifei thành lập, đã thông báo phát triển một hệ thống AI nhái bẫy, có thể tạo ra một thế giới 3D hoàn chỉnh từ một hình ảnh đầu vào và giải quyết vấn đề thiếu tính điều khiển và nhất quán của các mô hình AI tạo ra hiện tại. Hệ thống này không chỉ có thể ước tính hình dạng hình học 3D, mà còn có thể điền vào các phần không được nhìn thấy trong cảnh quan trọng, tạo ra nội dung mới, cho phép người dùng khám phá cảnh quan 3D theo cách giống trò chơi.
Cảnh 3D được tạo ra hỗ trợ hiển thị thời gian thực trong trình duyệt, cho phép mô phỏng hiệu ứng máy ảnh 3D (như độ sâu trường và tiêu điểm điều chỉnh). So với mô hình sinh ra dự đoán pixel, hệ thống này tuân thủ các quy tắc hình học 3D, cảnh có tính nhất quán và hỗ trợ tương tác động, chẳng hạn như thay đổi ánh sáng, diện mạo và chèn đối tượng mới.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
World Labs giới thiệu hệ thống trí tuệ nhân tạo tạo ra thế giới 3D từ một bức ảnh đơn, hỗ trợ tương tác trực tiếp.
PANews ngày 3 tháng 12, World Labs, công ty trí thông minh không gian do giáo sư trường đại học Stanford Li Feifei thành lập, đã thông báo phát triển một hệ thống AI nhái bẫy, có thể tạo ra một thế giới 3D hoàn chỉnh từ một hình ảnh đầu vào và giải quyết vấn đề thiếu tính điều khiển và nhất quán của các mô hình AI tạo ra hiện tại. Hệ thống này không chỉ có thể ước tính hình dạng hình học 3D, mà còn có thể điền vào các phần không được nhìn thấy trong cảnh quan trọng, tạo ra nội dung mới, cho phép người dùng khám phá cảnh quan 3D theo cách giống trò chơi. Cảnh 3D được tạo ra hỗ trợ hiển thị thời gian thực trong trình duyệt, cho phép mô phỏng hiệu ứng máy ảnh 3D (như độ sâu trường và tiêu điểm điều chỉnh). So với mô hình sinh ra dự đoán pixel, hệ thống này tuân thủ các quy tắc hình học 3D, cảnh có tính nhất quán và hỗ trợ tương tác động, chẳng hạn như thay đổi ánh sáng, diện mạo và chèn đối tượng mới.