Đăng nhập/ Đăng ký

Sự ra mắt trí tuệ không gian của Li Feifei: AI tạo ra thế giới 3D từ một hình ảnh duy nhất

JinseFinance

2024/12/03 09:42

Theo dõi

Nguồn: Qubits

Vừa rồi, dự án trí tuệ không gian đầu tiên của Li Feifei bất ngờ được phát hành:

Một thế giới trò chơi 3D có thể được tạo ra chỉ bằng một hệ thống AI hình ảnh!

Vấn đề là thế giới 3D được tạo ralà tình dục tương tác.

Bạn có thể tự do di chuyển máy ảnh để khám phá thế giới 3D này giống như chơi trò chơi. Các thao tác như độ sâu trường ảnh nông và thu phóng Hitchcock đều có sẵn.

Nhập ảnh bất kỳ:

Ngoại trừ chính bức ảnh này, mọi thứ trong thế giới 3D có thể khám phá đều được tạo ra bởi AI:

< hình ảnh src="https://img.jinse.cn/7328634_image3.png">

Những cảnh này được hiển thị trong thời gian thực trong trình duyệt, với các hiệu ứng camera có thể điều khiển và có thể điều chỉnh độ sâu trường mô phỏng (DoF).

Bạn thậm chí có thể thay đổi màu sắc của các vật thể và tự động điều chỉnh ánh sáng nền và bóng trong cảnh Chèn các đối tượng khác.

Ngoài ra, hầu hết các mô hình tổng quát trước đây đều dự đoán pixel, trong khi hệ thống AI này trực tiếp dự đoán cảnh 3D .

Vì vậy, khung cảnh không thay đổi khi bạn nhìn đi nhìn lại vàtuân theo các quy tắc vật lý hình học 3D cơ bản.

Cư dân mạng phát cuồng với phần bình luận cho rằng "Không thể tin được" từ trực tiếp chạm vào màn hình.

Có rất nhiều người nổi tiếng như người sáng lập Shopify Tobi Lutke:

Nhiều cư dân mạng tin rằng điều này trực tiếp mở ra một thế giới mới cho VR.
Quan chức này tuyên bố rằng "đây chỉ là một mô hình thu nhỏ của tương lai của 3D nguyên bản AI được tạo ra" :
Chúng tôi đang nỗ lực để đưa công nghệ này đến tay người dùng càng sớm càng tốt!
Bản thân Lý Phi Phi cũng chia sẻ ngay kết quả này và nói:
Cho dù bạn đưa ra giả thuyết về ý tưởng này như thế nào, thật khó để diễn tả bằng lời trải nghiệm tương tác với cảnh 3D được tạo ra thông qua một bức ảnh hoặc một câu. Tôi hy vọng tất cả các bạn thích nó.
Ứng dụng danh sách chờ hiện đang mở và một số người tạo nội dung đã sử dụng nó rồi.
Sự ghen tị chảy xuống từ khóe mắt anh.
Bài đăng trên blog chính thức cho biết rằng hôm nay, các phòng thí nghiệm Thế giới đã tiến một bước tới không gian thông minh. Bước một:
Xuất bản hệ thống AI tạo ra thế giới 3D từ một hình ảnh duy nhất.
Ngoài hình ảnh đầu vào, tất cả đều được tạo ra.
Và nhập bất kỳ hình ảnh nào.
Và đó là một thế giới 3D tương tác - người dùng có thể điều khiển các góc nhìn lên, xuống, trái và phải thông qua các phím W/A/S/D hoặc kéo màn hình bằng chuột để duyệt thế giới được tạo ra này.
Bài đăng trên blog chính thức có nhiều bản demo có thể dùng thử.
Tôi thực sự khuyên mọi người nên thử lần này Trải nghiệm bắt đầu rất khác so với việc xem video hoặc hình ảnh hoạt hình.
(Theo quy ước, thông tin tàu hỏa được đặt ở cuối bài viết)
p>
Được rồi, câu hỏi đặt ra là, có chi tiết nào khác đáng khám phá trong thế giới 3D do hệ thống AI này tạo ra không?
Hiệu ứng máy ảnh
World Labs cho biết khi được tạo ra, thế giới 3D sẽ được hiển thị theo thời gian thực trên trình duyệt, mang đến cho mọi người cảm giác như đang xem một Giống như một máy ảnh ảo.
Hơn nữa, người dùng có thể điều khiển chính xác chiếc camera này.
Cái gọi là "điều khiển độ chính xác" có hai cách để thực hiện
Một là mô phỏng hiệu ứng độ sâu trường ảnh, tức là nó có thể chỉ lấy nét rõ ràng ở một khoảng cách nhất định với máy ảnh.
Thứ hai, nó có thể mô phỏng thu phóng trượt (Dolly Zoom ), đây là kỹ thuật quay phim phóng to Hitchcock rất cổ điển.
Đặc điểm của nó là "kích thước của chủ thể trong ống kính không thay đổi, trong khi kích thước của hậu cảnh thay đổi".
Khi đi du lịch đến Tây Tạng và Tân Cương, nhiều người bạn du lịch hy vọng sử dụng Hitchcock zoom để quay video có tác động thị giác mạnh mẽ.
Trong màn hình của World Labs, hiệu ứng như sau (nhưng trong lối chơi này, không có cách nào để kiểm soát góc nhìn):
Hiệu ứng 3D
Thế giới Labs cho biết không giống như hầu hết các mô hình tổng hợp dự đoán pixel, AI của chúng tôi dự đoán cảnh 3D.
Bài đăng trên blog chính thức liệt kê ba lợi ích:
Đầu tiên, thực tế lâu dài.
Một khi thế giới được tạo ra, nó sẽ tồn tại mãi mãi.
Cảnh từ góc nhìn ban đầu sẽ không thay đổi chỉ vì bạn nhìn nó từ một góc nhìn khác.
Thứ hai, kiểm soát thời gian thực.
Sau khi cảnh được tạo, người dùng có thể di chuyển xung quanh thế giới 3D trong thời gian thực thông qua điều khiển bằng bàn phím hoặc chuột.
Bạn thậm chí có thể quan sát cẩn thận từng chi tiết của một bông hoa, hoặc bí mật quan sát ở đâu đó, chú ý đến mọi chuyển động trên thế giới từ góc nhìn của Chúa.
Thứ ba, tuân theo đúng các quy tắc hình học.
Thế giới do hệ thống AI này tạo ra tuân thủ các quy tắc cơ bản của vật lý thiết lập 3D.
Mặc dù một số video do AI tạo ra có hiệu ứng rất giống như mơ nhưng chúng không có chiều sâu thực tế mà chúng ta có (doge).
Bài đăng trên blog chính thức cũng viết rằng cách dễ nhất để tạo cảnh 3D trực quan là vẽ bản đồ độ sâu.
Màu sắc của từng pixel trong ảnh được xác định bởi khoảng cách của nó với máy ảnh.
Tất nhiên, người dùng có thể sử dụng cấu trúc cảnh 3D để xây dựng tương tác Hiệu ứng -
Bạn có thể tương tác với cảnh chỉ bằng một cú nhấp chuột, bao gồm nhưng không giới hạn ở việc đột ngột chiếu đèn chiếu vào cảnh.
Hiệu ứng hoạt hình?
Điều đó cũng thật dễ dàng.
Bước vào thế giới hội họa
Nhóm cũng có một số niềm vui khi trải nghiệm một số tác phẩm nghệ thuật cổ điển theo một “cách mới”.
Hoàn toàn mới, không chỉ ở chế độ tương tác mà còn ở chỗ chỉ cần nhập ảnh, bạn có thể hoàn thành những phần không có trong ảnh gốc.
Sau đó, nó trở thành thế giới 3D.
Đây là "Quán cà phê ngoài trời vào ban đêm" của Van Gogh:

Đây là "Nightcrawler" của Edward Hopper:
Quy trình làm việc sáng tạo
Nhóm cho biết rằng thế giới 3Dcó thể được kết hợp rất tự nhiên với các công cụ AI khác.
Điều này cho phép người sáng tạo trải nghiệm trải nghiệm quy trình làm việc mới bằng cách sử dụng các công cụ mà họ đã quen thuộc.
Ví dụ:
Trước tiên, bạn có thể sử dụng mô hình sơ đồ Vincent để chuyển từ thế giới văn bản sang thế giới hình ảnh.
Vì các mô hình khác nhau có đặc điểm phong cách riêng nên thế giới 3D có thể di chuyển và kế thừa những phong cách này.
Trong cùng một lời nhắc, hãy nhập các hình ảnh được tạo bởi các mô hình sơ đồ Vincent có các kiểu khác nhau để tạo ra các thế giới 3D khác nhau:
Một phòng ngủ dành cho thanh thiếu niên theo phong cách hoạt hình, rực rỡ với chiếc chăn đầy màu sắc trên giường, máy tính bừa bộn trên bàn, áp phích trên tường và dụng cụ thể thao rải rác xung quanh. Một cây đàn guitar tựa vào tường, ở giữa là một tấm thảm có hoa văn ấm cúng. Ánh sáng từ cửa sổ mang lại cảm giác ấm áp và trẻ trung cho căn phòng.
Phòng thí nghiệm thế giới và trí thông minh không gian
“Phòng thí nghiệm thế giới "Công ty được thành lập vào tháng 4 năm nay bởi Li Feifei, giáo sư tại Đại học Stanford và là mẹ đỡ đầu của AI.
Đây cũng là lần đầu tiên cô tiếp xúc với việc khởi nghiệp.
Định hướng kinh doanh của cô là một khái niệm mới - Trí tuệ không gian, đó là:
Trực quan hóa dẫn đến cái nhìn sâu sắc; nhìn thấy dẫn đến hiểu biết; hiểu biết dẫn đến hành động.
Theo quan điểm của Li Feifei, đây là “câu đố then chốt để giải quyết vấn đề trí tuệ nhân tạo”.
Chỉ trong 3 tháng, công ty đã vượt mức 10 Với mức định giá 100 triệu USD, nó đã trở thành một con kỳ lân mới.
Thông tin công khai cho thấy a16z, NEA và Radical Ventures là những nhà đầu tư hàng đầu và Adobe, AMD, Databricks và NVIDIA của Huang cũng nằm trong số các nhà đầu tư.
Trong số các nhà đầu tư cá nhân cũng có những tên tuổi lớn: Karpathy, Jeff Dean, Hinton...
Vào tháng 5 năm nay, Li Feifei đã có bài phát biểu TED dài 15 phút trước công chúng.
Cô phát biểu hùng hồn và chia sẻ nhiều suy nghĩ hơn về trí thông minh không gian. Những điểm chính bao gồm:
Khả năng thị giác được cho là nguyên nhân gây ra. Vụ nổ kỷ Cambri—thời kỳ mà các loài động vật bước vào hồ sơ hóa thạch với số lượng lớn. Ban đầu là một trải nghiệm thụ động, chỉ đơn giản là định vị để đón ánh sáng, nhanh chóng trở nên tích cực hơn và hệ thống thần kinh bắt đầu phát triển...những thay đổi này đã tạo ra trí thông minh.
Tôi đã nói nhiều năm rằng chụp ảnh và hiểu biết không giống nhau. Hôm nay tôi xin nói thêm một điểm nữa: Chỉ nhìn thôi chưa đủ. Hãy xem, nó dành cho hành động và học tập.
Nếu muốn AI vượt xa khả năng hiện tại, chúng ta không chỉ muốn AI có thể nhìn và nói chuyện mà chúng ta cũng muốn AI có thể hành động . Cột mốc quan trọng mới nhất trong trí tuệ không gian là dạy máy tính nhìn, học và hành động cũng như học cách nhìn và hành động tốt hơn.
Với sự tiến bộ nhanh chóng của trí tuệ không gian, một kỷ nguyên mới đang mở ra trước mắt chúng ta trong chu kỳ đạo đức này. Chu trình này đang thúc đẩy quá trình học tập của robot, một thành phần quan trọng của bất kỳ hệ thống trí tuệ hiện thân nào cần hiểu và tương tác với thế giới 3D.
Khách hàng mục tiêu của công ty được cho là bao gồm các nhà phát triển trò chơi điện tử và hãng phim. Ngoài các cảnh tương tác, World Labs có kế hoạch phát triển các công cụ hữu ích cho các chuyên gia như nghệ sĩ, nhà thiết kế, nhà phát triển, nhà làm phim và kỹ sư.
Giờ đây với việc phát hành dự án trí tuệ không gian đầu tiên, những gì họ muốn làm đã dần trở nên cụ thể hơn.
Nhưng World Labs nói rằng những gì hiện được phát hành chỉ là "bản xem trước sớm":
Chúng tôi đang làm việc khó cải thiện quy mô và tính hiện thực của các thế giới được tạo ra cũng như thử nghiệm những cách mới để người dùng tương tác với chúng.
Liên kết tham khảo:
[1]https://www.worldlabs.ai/blog
[2]https://mp.weixin.qq.com/s/3MWUv3Qs7l-Eg9A9_3SnOA?token=965382502&lang=zh_CN
[3]https://x.com/theworldlabs/status/1863617989549109328

Preview

Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG

Thêm bình luận

Đăng nhậpđể lại nhận xét tuyệt vời của bạn…

0 Bình luận

Sớm nhất

Tải thêm bình luận

Thêm tin tức về or so 文末

Thg 07 09
2024 sees nearly $1.4 billion in crypto thefts so far
Tăng giá
Bearish
Thg 07 04
The spot Solana ETF: Will US presidential election make or break it?
Tăng giá
Bearish
Thg 07 04
The spot Solana ETF: Will US presidential election make or break it?
Tăng giá
Bearish
Thg 07 02
To a BRICS CBDC or not a BRICS CBDC; replacing the petrodollar, that is the question
Tăng giá
Bearish
Thg 06 20
Dự kiến khối lượng giao dịch quyền chọn sẽ tăng khi đến gần cuối quý
Tăng giá
Bearish
Thg 03 14
Moon or doom: Why do so many crypto startups fail?
Tăng giá
Bearish
Thg 10 12
SOS tăng nhẹ, mức cao nhất tăng gần gấp đôi
Tăng giá
Bearish
Thg 04 03
SEB và Crédit Agricole ra mắt nền tảng trái phiếu blockchain so|bond
Tăng giá
Bearish
Thg 03 29
Nền tảng xã hội Web3 SO-COL hoàn thành khoản tài trợ 4,5 triệu đô la
Tăng giá4
Bearish
Thg 11 30
Dữ liệu: Các kho tiền ApeCoin đã bán được gần 20.000 APE trong khoảng một tháng qua
Tăng giá
Bearish

Hơn

Thêm tin tức về or so 文末

Hơn

Sự ra mắt trí tuệ không gian của Li Feifei: AI tạo ra thế giới 3D từ một hình ảnh duy nhất

Phòng thí nghiệm thế giới và trí thông minh không gian

Thêm tin tức về or so 文末

Thêm tin tức về or so 文末

Chu kỳ này không bình thường: một chu kỳ không điển hình hoặc thị trường giá lên vẫn chưa bắt đầu

Dữ liệu vĩ mô và nghiên cứu dữ liệu trên chuỗi: suy thoái hoặc đỉnh và giảm

TikTok và Bytedance kiện Chính phủ Hoa Kỳ, yêu cầu lật ngược luật 'Cấm hoặc thoái vốn'

Cấp tiến hay ổn định? Một bài viết đề cập đến những tranh cãi xung quanh việc nâng cấp BRC-20

Bitcoin sẽ tăng hay giảm vào năm 2024?

CZ cho biết chỉ có khoảng 50 hồ sơ trong số 7.000 nhân viên Binance trên LinkedIn là có thật

DOGE lên mặt trăng, hay không sớm?

Terra Classic (LUNC) vs. Mặt trăng 2.0 (TRĂNG)

Thế giới mã hóa dưới nền kinh tế chú ý: từ SOS đến BAYC, Dogecoin

Nền tảng giao dịch NFT: Thị trường Đại dương xanh hoặc Đại dương đỏ