Robot theo mô hình AI mới của Google có thể gấp origami

Khoa học - công nghệ - Ngày đăng : 08:43, 13/03/2025

Google DeepMind vừa công bố hai mô hình AI tiên tiến dành cho robot, Gemini Robotics và Gemini Robotics-ER, đánh dấu một bước tiến lớn trong nỗ lực tạo ra những cỗ máy có thể hoạt động linh hoạt và thông minh hơn trong môi trường thực tế.
Khoa học - công nghệ

Robot theo mô hình AI mới của Google có thể gấp origami

Hoàng Vũ 13/03/2025 08:43

Google DeepMind vừa công bố hai mô hình AI tiên tiến dành cho robot, Gemini Robotics và Gemini Robotics-ER, đánh dấu một bước tiến lớn trong nỗ lực tạo ra những cỗ máy có thể hoạt động linh hoạt và thông minh hơn trong môi trường thực tế.

Theo FT, Google gọi đây là một "bước nhảy vọt" trong quá trình phát triển robot đa năng, giúp chúng thực sự hữu ích trong đời sống hằng ngày.

Thích nghi với thế giới thực

Robot thông minh đã được nghiên cứu và phát triển trong nhiều thập niên, nhưng một trong những thách thức lớn nhất là khả năng hoạt động linh hoạt trong môi trường phức tạp. Phần lớn robot trước đây được lập trình cứng nhắc, chỉ có thể thực hiện các nhiệm vụ đơn giản trong điều kiện được kiểm soát chặt chẽ.

Google DeepMind đã giải quyết vấn đề này bằng Gemini Robotics, tích hợp mô hình AI mạnh mẽ giúp robot tự học, thích nghi với hoàn cảnh mới và thực hiện các nhiệm vụ phức tạp. Đặc biệt, việc ứng dụng mô hình ngôn ngữ Gemini 2.0 giúp robot không chỉ hiểu ngôn ngữ mà còn suy luận và điều chỉnh hành vi theo ngữ cảnh.

Hệ thống này mang lại ba cải tiến quan trọng gồm việc robot có thể thích nghi với hoàn cảnh mà không cần lập trình trước, phản ứng nhanh với hướng dẫn bằng lời nói và thao tác vật thể chính xác hơn. Những tiến bộ này giúp khắc phục hạn chế lớn của robot hiện nay, vốn chỉ hoạt động hiệu quả trong phòng thí nghiệm nhưng gặp khó khăn khi vận hành thực tế.

Theo Google, robot được huấn luyện bằng hệ thống mới có thể thực hiện nhiều hành động phức tạp, như gấp origami, sắp xếp bàn làm việc theo hướng dẫn bằng lời nói, quấn dây tai nghe, ném bóng rổ vào rổ... Những tác vụ này đòi hỏi sự phối hợp chặt chẽ giữa nhận thức thị giác, điều khiển vận động và suy luận.

deepmind-google.png
Google DeepMind đã công bố các mô hình trí tuệ nhân tạo mới cho robot - Ảnh: DeepMind

Một bước đột phá của Gemini Robotics là khả năng lập kế hoạch và suy luận như con người. Khi được yêu cầu cầm một cốc cà phê, robot có thể tự tính toán cách tiếp cận tối ưu và chọn phương thức cầm nắm phù hợp để tránh làm đổ nước.

Giáo sư Ken Goldberg từ Đại học California (Mỹ) đánh giá đây là bước tiến quan trọng trong lĩnh vực robot. Ông nhấn mạnh rằng Google DeepMind đã tận dụng dữ liệu và điện toán quy mô lớn để giúp robot hoạt động hiệu quả hơn trong thế giới thực.

Ngoài ra, việc Gemini Robotics vận hành trên nền tảng đám mây giúp AI truy cập các mô hình ngôn ngữ lớn, mở ra tiềm năng xử lý những nhiệm vụ phức tạp mà trước đây robot chưa thể thực hiện. Không dừng lại ở đó, Google DeepMind còn hợp tác với Apptronik, một công ty khởi nghiệp chuyên về robot hình người, để ứng dụng công nghệ này vào thế hệ robot mới.

Sự cạnh tranh khốc liệt trong cuộc đua AI robot

Sự ra đời của Gemini Robotics diễn ra trong bối cảnh các công ty công nghệ đang cạnh tranh quyết liệt trong lĩnh vực AI cho robot. Tesla, OpenAI và nhiều công ty khởi nghiệp khác đang đầu tư mạnh vào nghiên cứu và phát triển các hệ thống AI có khả năng vận hành robot tự động.

CEO Nvidia Jensen Huang từng khẳng định AI điều khiển robot ở quy mô lớn có thể mở ra một thị trường trị giá hàng nghìn tỉ USD, thậm chí trở thành "ngành công nghệ lớn nhất thế giới từng chứng kiến".

Không chỉ giới hạn trong công nghiệp, robot AI còn thu hút sự quan tâm từ các lĩnh vực y tế, dịch vụ, hậu cần và sản xuất, nơi các doanh nghiệp kỳ vọng công nghệ này sẽ tối ưu hóa quy trình và tăng năng suất. Dù Gemini Robotics mở ra tiềm năng lớn, nhiều thách thức vẫn còn tồn tại trước khi robot có thể trở thành một phần thiết yếu trong đời sống.

Russ Tedrake, giáo sư tại MIT và phó chủ tịch nghiên cứu robot tại Toyota Research Institute nhận định: "Gemini Robotics là một bước tiến quan trọng, nhưng còn nhiều vấn đề cần giải quyết trước khi robot thực sự có thể hoạt động rộng rãi".

Trong khi đó, Nvidia và nhiều công ty khác đang phát triển nền tảng AI có khả năng học hỏi và cải thiện hiệu suất liên tục, giúp rút ngắn khoảng cách giữa robot và con người.

AI robot không chỉ nâng cao năng suất mà còn mở ra những cơ hội kinh tế và công nghệ mới, với tiềm năng thay đổi ngành sản xuất, y tế, logistics và nghiên cứu khoa học. Tuy nhiên, để đạt được điều đó, các nhà nghiên cứu vẫn phải giải quyết ba thách thức lớn: đảm bảo robot vận hành an toàn và không gây nguy hiểm cho con người, cải thiện khả năng tương tác xã hội để robot hiểu và phản ứng tự nhiên hơn, đồng thời giảm chi phí sản xuất để tăng khả năng triển khai trên diện rộng.

Sự ra mắt của Gemini Robotics đánh dấu bước tiến quan trọng trong cuộc đua phát triển robot thông minh, đa năng. Dù còn nhiều trở ngại, những tiến bộ gần đây cho thấy viễn cảnh robot trở thành một phần quan trọng trong đời sống không còn quá xa. Google DeepMind và các đối thủ của họ đang đẩy mạnh nghiên cứu để biến điều đó thành hiện thực.

Hoàng Vũ