Công ty khởi nghiệp trí tuệ nhân tạo xAI của Elon Musk vừa giới thiệu mô hình Grok-3 được cập nhật và trình diễn phiên bản chatbot mà tỷ phú này tuyên bố là “AI thông minh nhất trên Trái đất”.
Nhịp đập khoa học

Elon Musk: Grok-3 vượt Google Gemini, DeepSeek-V3 và GPT-4o trong các bài kiểm tra

Sơn Vân 18/02/2025 14:11

Công ty khởi nghiệp trí tuệ nhân tạo xAI của Elon Musk vừa giới thiệu mô hình Grok-3 được cập nhật và trình diễn phiên bản chatbot mà tỷ phú này tuyên bố là “AI thông minh nhất trên Trái đất”.

Theo xAI, hiệu suất mô hình Grok-3 vượt Google Gemini, V3 của DeepSeek, Claude 3.5 của Anthropic và GPT-4o của OpenAI trong các bài kiểm tra về toán học, khoa học và lập trình.

elon-musk-grok-3-vuot-google-gemini-deepseek-v3-va-gpt-4o-trong-cac-bai-kiem-tra.jpg
Kết quả kiểm tra hiệu suất của Grok-3 so với Google Gemini, DeepSeek-V3, Claude 3.5 của Anthropic và GPT-4o của OpenAI

Thông tin này được công bố qua một buổi livestream mới đây. Elon Musk cho biết trong một bài thuyết trình cùng ba kỹ sư xAI rằng Grok-3 có sức mạnh tính toán “gấp hơn 10 lần” so với phiên bản cũ và đã hoàn thành quá trình huấn luyện sơ bộ vào đầu tháng 1.

“Chúng tôi liên tục cải tiến mô hình mỗi ngày, và chỉ trong vòng 24 giờ, bạn sẽ thấy sự cải thiện”, tỷ phú giàu nhất thế giới nói.

Elon Musk cho biết xAI đã sử dụng một kỹ thuật mới nhằm giảm thời gian huấn luyện nhưng vẫn đạt được mô hình AI hiệu suất cao. Khác với DeepSeek-R1, Grok-3 sẽ không hiển thị suy luận trong quá trình giải quyết truy vấn của người dùng. Elon Musk nói rằng biện pháp này nhằm ngăn các công ty khác sao chép mô hình của xAI.

elon-musk-grok-3-vuot-google-gemini-deepseek-v3-va-gpt-4o-trong-cac-bai-kiem-tra1.jpg
Elon Musk và ba kỹ sư xAI trong buổi livestream giới thiệu Grok-3

Trước đó, hôm 13.2, Elon Musk phát biểu trong một cuộc gọi video tại Hội nghị Thượng đỉnh các Chính phủ Thế giới ở Dubai (UAE): “Grok 3 có khả năng suy luận rất mạnh mẽ. Trong các thử nghiệm mà chúng tôi thực hiện cho đến nay, Grok 3 đang vượt trội hơn bất kỳ thứ gì đã được phát hành mà chúng tôi biết. Đó là một dấu hiệu tốt".

Ngoài ra, xAI còn giới thiệu DeepSearch, công cụ tìm kiếm thông minh mới.

DeepSearch là chatbot suy luận, thể hiện quá trình hiểu một truy vấn và cách lập kế hoạch để phản hồi. Theo xAI, DeepSearch có các tùy chọn hỗ trợ nghiên cứu, động não và phân tích dữ liệu.

Nhóm kỹ sư xAI cho biết: "Đây thực sự là tính năng giúp tiết kiệm thời gian. Những thứ trước đây mất nửa hay thậm chí 1 tiếng để nghiên cứu trên web, mạng xã hội thì bây giờ chỉ cần nhờ AI đi tìm, chỉ mất khoảng 10 phút. Đó là khả năng của DeepSearch và thực sự nó làm việc đó tốt hơn bạn".

Grok-3 hiện được triển khai ngay lập tức cho người đăng ký gói Premium+ trên mạng xã hội X. Công ty cũng ra mắt gói đăng ký mới có tên SuperGrok dành cho ứng dụng di động Grok và trang web Grok.com.

Grok-3 sẽ làm gia tăng sự cạnh tranh giữa xAI với OpenAI. Năm 2023, Elon Musk thành lập xAI để cạnh tranh với OpenAI, công ty mà ông đồng sáng lập năm 2015 nhưng sau đó rời đi năm 2018 do bất đồng quan điểm. Thời gian qua, Elon Musk công khai chỉ trích OpenAI vì kế hoạch tái cấu trúc thành doanh nghiệp vì lợi nhuận.

Tỷ phú này đã đệ đơn kiện OpenAI hai lần với cáo buộc đi chệch khỏi các nguyên tắc đề ra lúc sáng lập và đề nghị mua lại bộ phận phi lợi nhuận kiểm soát OpenAI với giá 97,4 tỉ USD, nhưng bị từ chối vào tuần trước.

OpenAI cho biết Elon Musk đã tự mâu thuẫn khi đưa ra "đề nghị không phù hợp nhằm phá hoại đối thủ cạnh tranh". Các tài liệu pháp lý của Elon Musk khẳng định rằng tài sản OpenAI phải thuộc về một quỹ từ thiện và không được chuyển nhượng để tư lợi. Điều này trái ngược với đề xuất mua lại của Elon Musk, vốn tìm cách chuyển tất cả tài sản OpenAI sang cho Giám đốc điều hành Tesla và các nhà đầu tư tư nhân khác, OpenAI cho biết.

OpenAI và xAI đang huy động vốn với tốc độ chóng mặt, đẩy mức định giá lên cao. Theo trang Bloomberg, tuần trước xAI đã đàm phán để huy động khoảng 10 tỉ USD trong một vòng gọi vốn mới, giúp công ty đạt mức định giá khoảng 75 tỉ USD. Theo dữ liệu của nền tảng PitchBook, xAI trước đó được định giá khoảng 51 tỉ USD.

Dell đang trong giai đoạn đàm phán nâng cao để ký kết thỏa thuận trị giá hơn 5 tỉ USD nhằm cung cấp máy chủ tối ưu hóa AI cho xAI.

OpenAI đang đàm phán để huy động tới 40 tỉ USD trong một vòng gọi vốn có thể đưa mức định giá của công ty lên đến 300 tỉ USD.

Vào tháng 1, OpenAI, SoftBank Group, Oracle và MGX (được hậu thuẫn bởi UAE) cùng công bố chương trình triển khai 100 tỉ USD, với mục tiêu cuối cùng là chi 500 tỉ USD để xây dựng trung tâm dữ liệu và cơ sở hạ tầng AI tại Mỹ.

Tuy nhiên, OpenAI và xAI đang đối mặt sự cạnh tranh gay gắt của các công ty Trung Quốc trong lĩnh vực AI. Tháng trước, công ty khởi nghiệp DeepSeek đã phát hành mô hình AI mã nguồn mở mới có tên R1, đạt hoặc vượt qua các đối thủ hàng đầu của Mỹ trong hàng loạt bài kiểm tra tiêu chuẩn ngành.

DeepSeek tuyên bố đã phát triển mô hình này với chi phí chỉ bằng một phần nhỏ so với các công ty Mỹ.

DeepSearch cạnh tranh với Deep Research

Cách đây hai tuần, OpenAI giới thiệu tác tử AI mới có tên Deep Research, tương tự DeepSearch của xAI.

Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.

Deep Research có khả năng tự tìm kiếm thông tin trực tuyến và thực hiện các nhiệm vụ nghiên cứu phức tạp, nhiều bước thay mặt cho người dùng.

Sam Altman, Giám đốc điều hành OpenAI, đã xác nhận cách đây vài ngày rằng công ty sẽ cung cấp hai truy vấn Deep Research cho người dùng miễn phí mỗi tháng. Với những người dùng ChatGPT Plus (trả phí 20 USD/tháng), họ sẽ nhận được 10 lượt truy vấn Deep Research mỗi tháng. Người dùng gói ChatGPT Pro của OpenAI (giá 200 USD/tháng) sẽ có 100 truy vấn Deep Research mỗi tháng.

Khi trò chuyện trên podcast The Times Tech gần đây, Sam Altman đã thảo luận Deep Research của OpenAI.

Deep Research được tối ưu hóa cho duyệt web và phân tích dữ liệu, có khả năng thực hiện nghiên cứu nhiều bước trên internet cho các nhiệm vụ phức tạp mà theo OpenAI, "hoàn thành trong vài chục phút những gì con người phải mất nhiều giờ".

Bạn chỉ cần cung cấp một yêu cầu là Deep Research sẽ "tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một báo cáo toàn diện ở cấp độ của nhà phân tích nghiên cứu".

Deep Research phục vụ cho các chuyên gia trong lĩnh vực tài chính, khoa học, chính sách và kỹ thuật, cung cấp những thông tin chi tiết đáng tin cậy và toàn diện. Tính năng này cũng hữu ích với những người mua sắm đang tìm kiếm các đề xuất được cá nhân hóa về giao dịch mua đòi hỏi phải nghiên cứu cẩn thận, chẳng hạn ô tô, đồ gia dụng và đồ nội thất.

Kết quả gồm các trích dẫn và tóm tắt rõ ràng, giúp dễ dàng xác minh. Về cơ bản, Deep Research giúp tinh giản quá trình nghiên cứu tốn thời gian, cung cấp thông tin chuyên sâu hiệu quả chỉ từ một truy vấn.

Trong loạt bài đăng trên mạng xã hội X, Sam Altman đã mô tả Deep Research là "giống một siêu năng lực, hoạt động như nhóm chuyên gia sẵn sàng hỗ trợ bạn".

Sam Altman cho biết Deep Research có thể "sử dụng internet, thực hiện nghiên cứu, lập luận phức tạp và trả về cho bạn một báo cáo", xử lý các nhiệm vụ "mất nhiều giờ/ngày và tốn hàng trăm USD".

Dù rất tốn nhiều tài nguyên tính toán và hoạt động còn chậm, ông tuyên bố "Deep Research là hệ thống AI đầu tiên có thể thực hiện nhiều nhiệm vụ phức tạp, có giá trị như vậy".

Deep Research mất từ ​​5 đến 30 phút để hoàn thành công việc và bạn sẽ nhận được thông báo khi nghiên cứu xong. Kết quả cuối cùng là một báo cáo được gửi qua ChatGPT.

Hiện báo cáo chỉ có văn bản nhưng OpenAI cho biết trong những tuần tới, họ sẽ thêm hình ảnh nhúng, biểu đồ dữ liệu và các kết quả phân tích khác để tăng thêm độ rõ ràng và ngữ cảnh.

Deep Research sẽ có trên ứng dụng dành cho thiết bị di động và PC vào cuối tháng 2. Tính năng này cũng sẽ sớm khả dụng với khách hàng Plus, Team và Enterprise trước khi đến với gói miễn phí của OpenAI.

Sam Altman kêu gọi mọi người "hãy thử nghiệm Deep Research với công việc khó khăn nhất mà bạn phải giải quyết bằng cách sử dụng internet và xem điều gì sẽ xảy ra".

Tuy nhiên, OpenAI cảnh báo rằng Deep Research "có thể gặp khó khăn trong việc phân biệt thông tin có thẩm quyền với tin đồn và đang có điểm yếu trong việc hiệu chỉnh độ tin cậy (chưa thể đánh giá chính xác mức độ đáng tin cậy của thông tin đưa ra – PV), không thể hiện rõ thông tin chưa chắc chắn khiến người dùng có thể hiểu nhầm".

Theo OpenAI, khi Deep Research mới ra mắt, người dùng cũng có thể thấy các lỗi định dạng nhỏ trong báo cáo và trích dẫn, với các nhiệm vụ có thể mất nhiều thời gian hơn để bắt đầu.

"Chúng tôi kỳ vọng tất cả những vấn đề này sẽ nhanh chóng được cải thiện khi có thêm người dùng và thời gian", OpenAI cho hay.

Sam Altman tin rằng Deep Research sẽ có tác động đáng kể và có thể thực hiện "khoảng 5% nhiệm vụ trong nền kinh tế hiện nay".

Bài liên quan
Em trai Elon Musk bán 75.000 cổ phiếu Tesla một ngày, kiếm lời từ đợt tăng giá sau khi ông Trump đắc cử
Hôm 11.2, hồ sơ của Ủy ban Giao dịch và Chứng khoán Mỹ (SEC) tiết lộ Kimbal Musk, em trai Elon Musk, đã bán số cổ phiếu Tesla trị giá khoảng 28 triệu USD chỉ trong một ngày.

(0) Bình luận
Nổi bật Một thế giới
Thông qua Luật Tổ chức chính phủ (sửa đổi)
3 giờ trước Sự kiện
Tiếp tục chương trình kỳ họp bất thường lần thứ 9, sáng nay (18.2), Quốc hội biểu quyết thông qua Luật Tổ chức chính phủ (sửa đổi) với 463/465 đại biểu quốc hội (ĐBQH) tham gia biểu quyết tán thành.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Elon Musk: Grok-3 vượt Google Gemini, DeepSeek-V3 và GPT-4o trong các bài kiểm tra