Nguồn: Empower Labs
Gần đây, robot đã đạt được bao nhiêu tiến bộ?
Gần đây, nghiên cứu về robot thông minh đã phát triển mạnh mẽ, với những thử nghiệm mới lần lượt xuất hiện.
Tesla đã ra mắt Optimus thế hệ thứ hai vào giữa tháng 12. Robot này không phải là sản phẩm công nghiệp mà là nguyên mẫu thuần túy nhưng được hoàn thiện rất tốt. Trong các cuộc trình diễn, Optimus có hình dạng phi hành gia đã thể hiện khả năng thể thao tinh tế của mình. Musk cho biết lý do nó được thiết kế có kích thước và hình dáng giống con người là để thay thế liền mạch sức lao động của con người và thực hiện bất cứ điều gì con người không muốn làm.
Robot của Tesla có một phong cách công nghiệp khoa học viễn tưởng mạnh mẽ và có vẻ tốn kém để xây dựng. Có lẽ chính hình ảnh này đã mang lại cho nó kỳ vọng rằng "mọi thứ đều được coi là đương nhiên". Trên thực tế, Tesla không đưa ra nhiều kịch bản ứng dụng của nó nên mọi người dường như chỉ "ồ" về nó. Tuy nhiên, hai robot lần lượt được công bố vào tháng 1 đã khiến nhiều người bày tỏ sự chân thành "Huh?"
Người đầu tiên xuất hiện là dự án Stanford Mobile Aloha được công bố bởi nhóm nghiên cứu trường đại học. Lý do khiến dự án này thu hút được sự quan tâm rộng rãi có thể là do các kịch bản mà nó tìm thấy cho robot thực tế hơn: nấu ăn, chơi với mèo và giặt giũ. Trên thực tế, điểm đổi mới chính của dự án này là nó sử dụng phần cứng giá rẻ (hơn 30.000 đô la Mỹ, vẫn rất đắt khi sử dụng tại nhà) để tạo ra một robot hai tay di động tự động (mặc dù nó trông không giống một robot di động). con người) Và nó có thể học các kỹ năng của con người. Quá trình học tập này có vẻ hơi thứ yếu. Lấy nấu ăn làm ví dụ, bạn phải vận hành nó để nấu một lần, sau đó nó sẽ ghi nhớ các hành động chung. Lúc này, nó không thể giữ vững chiếc nồi ngay lập tức, nhưng điều tuyệt vời là nó sẽ thực hiện hàng chục bài huấn luyện độc lập thông qua camera trên cánh tay trước khi có thể thực sự giữ vững chiếc nồi.
Tiếp theo, Hình công ty đã phát hành một đoạn video về robot hình người Hình 01 đang pha cà phê. Robot này nghe được lệnh bằng giọng nói của con người "Pha cho tôi một tách cà phê" và có thể khéo léo sử dụng máy pha cà phê dạng viên nang để pha một tách cà phê. Hình gọi thành tích này là “khoảnh khắc ChatGPT của robot hình người”, không phải vì nó sử dụng mô hình ngôn ngữ lớn để hiểu lệnh thoại của con người mà vì kỹ năng pha cà phê được học đơn giản bằng cách quan sát chuyển động của con người. Hình 01 thiết lập sự hiểu biết về hành vi của nhiệm vụ bằng cách quan sát trực quan hành vi của con người sử dụng máy pha cà phê, sau đó thành thạo kỹ năng này thông qua nhiều lần đào tạo độc lập và sửa lỗi. Điều này cho thấy triển vọng rộng lớn của robot hình người đa năng được điều khiển bằng AI.
Bill Gates’ Một robot trong mọi nhà< /h2>
Trong số đầu tiên của tạp chí "Scientific American" năm 2007, có một bài viết có chữ ký của Bill Gates. Tôi nhớ đó là tiêu đề trang bìa. . Tiêu đề của bài viết là “Một robot trong mọi nhà”.
Trong bài viết, Bill Gates bày tỏ sự phấn khích vô cùng trước những cơ hội trong ngành công nghiệp robot, bởi nó rất giống với thời điểm ông thành lập Microsoft 30 năm trước: những công nghệ đột phá đã xuất hiện trong ngành, nhưng những cỗ máy kinh doanh cấp chuyên nghiệp vẫn độc quyền trong tay một số ít người. các công ty lớn. . Mặc dù các công ty khởi nghiệp và những người đam mê công nghệ vẫn tiếp tục tạo ra một số điều thú vị nhưng chúng lại bị phân mảnh đến mức không có tiêu chuẩn và công cụ phát triển chung. Vì vậy, Bill Gates đã mạnh dạn dự đoán: Chỉ cần giải quyết được vấn đề này, chắc chắn robot sẽ xâm nhập vào hàng nghìn hộ gia đình.
Vì vậy, Microsoft đã quyết tâm đầu tư vào việc thúc đẩy vấn đề này vào thời điểm đó, thành lập bộ phận Robotics và ra mắt Microsoft Robotics Studio, chuẩn bị lặp lại thành công mà Microsoft đã thành công. đã đạt được thành công trong kỷ nguyên PC.
Trong bài viết, Bill Gates đã trích dẫn Thử thách xuyên quốc gia kinh điển của DARPA 2004. Vâng, chính DARPA huyền thoại đã phát minh ra Internet. Mục tiêu tài trợ cho cuộc thi này là cho phép một phương tiện dẫn đường hoàn toàn tự động có thể vượt qua hơn 140 dặm sa mạc Mojave. Trong năm đầu tiên của cuộc thi, các đối thủ xuất sắc nhất chỉ cố gắng đi hết 7 dặm, đến năm thứ hai, 5 chiếc xe đã hoàn thành xuất sắc cuộc thi và chỉ đơn giản là chạy hết chặng đường về đích. Sự cạnh tranh này phản ánh rất nhiều về tốc độ phát triển của công nghệ robot. Đây cũng là nơi mà sự tự tin của Bill Gates nằm.
Những nỗ lực của Microsoft vào thời điểm đó chỉ ở cấp độ công cụ phát triển. Khả năng của cảm biến, động cơ, cơ cấu servo và phần cứng khác đang được cải thiện nhanh chóng và giá của chúng đang giảm.Tuy nhiên, ở cấp độ phát triển, bạn phải viết một chương trình dành riêng cho từng phần cứng để điều khiển nó. Hơn nữa, làm thế nào để cho phép bộ xử lý yếu vào thời điểm đó xử lý dữ liệu từ nhiều cảm biến trong thời gian thực cũng là một thách thức lớn. Giải pháp của Microsoft là thiết lập các tiêu chuẩn cho trình điều khiển và cung cấp khả năng đa luồng. Microsoft thậm chí còn tung ra .NET Micro Framework. Những sinh viên hiểu công nghệ .NET sẽ có thể tưởng tượng rằng việc đưa một kẻ giết người lớn như vậy vào các công cụ phát triển robot chỉ đơn giản là một đòn giảm kích thước. Các nhà phát triển robot thậm chí không cần phải lo lắng về việc lập lịch trình bộ nhớ và luồng mà chỉ cần viết logic trực tiếp.
Nhưng hóa ra sự thật là chúng ta đã biết rằng những nỗ lực của Microsoft trong lĩnh vực robot đã không thành công và toàn bộ bộ phận Robotics đã bị giải tán hoàn toàn trong một cuộc tái tổ chức vào năm 2014. Theo quan sát không liên tục của tác giả, tôi cảm thấy rằng nguyên nhân chính có thể là do chi phí và tính ứng dụng. Suy cho cùng, cho đến ngày nay, để có một cánh tay robot ở nhà tốn rất nhiều tiền và chúng ta không biết phải làm gì với nó.
Khoảnh khắc ChatGPT dành cho robot?
Kéo dòng thời gian về hiện tại, dù là Mobile Aloha hay Hình 01, họ đều thể hiện khả năng như vậy: thông qua các cảm biến ( cho dù đó là camera hay thao tác khớp từ xa) để học một hành động và thực sự làm chủ hành động này thông qua phản hồi đào tạo tự động. Không chỉ vậy, tập hợp hành động này còn có thể được hình thành thành một kỹ năng mà sau đó có thể được sử dụng thông qua cuộc trò chuyện tự nhiên. Những kỹ năng như vậy có thể được sao chép sang các robot tương tự bất cứ lúc nào mà không cần lập trình.
Có vẻ như khả năng của robot đã thực sự đạt đến một tầm cao mới. Điều này cũng khiến nhiều người đồng thanh thốt lên: "Phải chăng robot cũng đã đến thời điểm lật đổ như ChatGPT?"
So với Bill hơn chục năm trước Khi Gates đưa ra dự đoán của mình, robot ngày nay đã có nhiều bước tiến mới:
1. Linh hoạt hơn. Trong con mắt của Bill Gates, robot có thể có hình dạng bất kỳ, miễn là chúng có thể hoàn thành một nhiệm vụ nhất định. Khi chính tác giả lẻn vào nhóm Robotics để họp, anh ta chỉ có thể chạy và bò khi nhìn thấy màn trình diễn của họ. Nhưng giờ đây, robot đã có thể có các kỹ năng trong các công việc gia đình và những kỹ năng này có thể được sao chép và phổ biến. Hơn nữa, bản thân thiết kế của robot có xu hướng giống con người hơn và nó cũng được thiết kế để thực hiện nhiều nhiệm vụ chung khác nhau thay mặt con người.
2. Tương tác tự nhiên. Với sự hỗ trợ của LLM đa phương thức, công nghệ robot hiện tại có thể hiểu lệnh thoại của con người và học hỏi từ đầu vào như camera, đây là một tiến bộ vượt bậc trong lĩnh vực học máy và giảm đáng kể khó khăn trong việc phát triển và sử dụng.
3. Chi phí còn giảm hơn nữa. Mặc dù chi phí phần cứng được công bố của Mobile Aloha vẫn là hơn 30.000 đô la Mỹ, nhưng chi phí này đã bao gồm cả đế di động. Nếu chỉ tính cánh tay robot thì có vẻ như nó khó có thể coi là một thiết bị gia dụng cao cấp. Đế di động có thể là một trong những chủ đề nóng tiếp theo, chẳng hạn như logic của một số khoản đầu tư gần đây vào Tesla là "Đừng coi nó như một chiếc ô tô điện mà hãy coi nó như một đế di động phổ thông thế hệ tiếp theo".
Jim Fan là một trong những KOL lớn nhất trong lĩnh vực này. Anh ấy là nhà khoa học cấp cao tại Nvidia và là thực tập sinh đầu tiên tại OpenAI. Trong một tweet gần đây, anh ấy giải thích lý do tại sao anh ấy tin rằng robot sẽ là chủ đề nóng nhất vào năm 2024.
Nhưng ngay cả ở đây Trong Sau một dòng tweet đầy nhiệt huyết, Jim tin rằng "robot AI vật lý phổ quát" vẫn còn khoảng ba năm nữa mới xuất hiện.
Về vấn đề này, tác giả lạc quan một cách thận trọng. Sự lạc quan đến từ việc chứng kiến những tiến bộ vượt bậc như vậy và sự thận trọng đến từ những bài học kinh nghiệm của Microsoft.
Nhưng có một điều chắc chắn là nó thực sự rất thú vị.