Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Mô hình ngôn ngữ lớn Baidu và Zhipu AI đứng đầu Trung Quốc, nhưng kém OpenAI về khả năng tổng thể

Sơn Vân • 22/04/2024 21:30

Ernie 4.0 của Baidu và GLM-4 của Zhipu AI đứng đầu bảng xếp hạng các mô hình ngôn ngữ lớn Trung Quốc, nhưng các đối thủ nước ngoài vẫn dẫn đầu về khả năng tổng thể, theo thử nghiệm mới từ Đại học Thanh Hoa ở Bắc Kinh (thủ đô Trung Quốc).

Báo cáo đánh giá SuperBench của Đại học Thanh Hoa đã kiểm tra 14 mô hình ngôn ngữ lớn, công nghệ làm nền tảng cho chatbot trí tuệ nhân tạo (AI) tạo sinh. Kết quả cho thấy các mô hình ngôn ngữ lớn nước ngoài, chẳng hạn như GPT-4 của OpenAI và Claude-3 của Anthropic, đã dẫn đầu về nhiều khả năng, gồm cả hiểu ngữ nghĩa, tạo mã lập trình và sự liên kết với các lệnh của con người.

Các nhà nghiên cứu phát hiện ra "sự chênh lệch rõ ràng" về khả năng tạo mã lập trình và vận hành trong môi trường thực tế giữa các mô hình ngôn ngữ lớn nội địa với mô hình nước ngoài hàng đầu.

Báo cáo này nhằm mục đích “cung cấp các tiêu chí đánh giá khách quan và khoa học” để kiểm tra số lượng mô hình ngôn ngữ lớn ngày càng tăng gần đây, theo một bài đăng trên WeChat của Trung tâm Nghiên cứu Mô hình Cơ bản thuộc Đại học Thanh Hoa, nơi tiến hành đánh giá cùng Phòng thí nghiệm Trung Quan Thôn do chính phủ Trung Quốc hậu thuẫn.

Các gã khổng lồ công nghệ và công ty khởi nghiệp Trung Quốc đã chạy đua để phát triển mô hình ngôn ngữ lớn riêng kể từ khi OpenAI tung ra một số công cụ AI tạo sinh gây tiếng vang, gồm cả chabot ChatGPT và mô hình chuyển văn bản thành video Sora. OpenAI là công ty khởi nghiệp Mỹ được Microsoft đầu tư hơn 10 tỉ USD.

Theo số liệu từ chính phủ Trung Quốc, khoảng 200 mô hình ngôn ngữ lớn đã được giới thiệu ở nước này, nơi các dịch vụ của OpenAI không có sẵn.

Báo cáo của Đại học Thanh Hoa tương đồng nhận xét gần đây từ Thái Sùng Tín, đồng sáng lập và Chủ tịch Alibaba. Ông cho biết các hãng công nghệ Trung Quốc đi sau khoảng 2 năm so với các công ty hàng đầu Mỹ trong cuộc đua AI toàn cầu, với lý do OpenAI đã vượt qua phần còn lại của ngành công nghệ trong đổi mới AI.

Bản cập nhật các biện pháp kiểm soát xuất khẩu của Mỹ, có hiệu lực từ ngày 4.4, khiến Trung Quốc gặp khó khăn hơn trong việc tiếp cận các chip AI tiên tiến và thiết bị sản xuất chất bán dẫn. Thái Sùng Tín nói rằng các hãng công nghệ Trung Quốc đang tiếp tục tìm cách giảm thiểu tác động của những hạn chế này, gồm tìm nguồn cung ứng chip lý tiên tiến từ các nhà cung cấp khác và tích trữ chip hiện có sẵn trên thị trường. Ví dụ, gã khổng lồ tìm kiếm Baidu năm ngoái đã đặt mua chip AI từ Huawei, theo trang SCMP.

Thái Sùng Tín nhận định: “Tôi nghĩ trong năm tới hoặc 18 tháng tới, việc đào tạo về các mô hình ngôn ngữ lớn vẫn có thể được tiến hành, dựa trên lượng dữ liệu mà mọi người có sẵn”.

“Việc đào tạo mô hình ngôn ngữ lớn đòi hỏi tính toán hiệu suất cao hơn, trái ngược với các ứng dụng mà nhiều người gọi là suy luận. Vì vậy, về mặt suy luận thì có nhiều lựa chọn. Bạn không cần phải có chip mạnh và cao cấp như phiên bản mới nhất của Nvidia”, ông lý giải.

Chủ tịch Alibaba dự đoán rằng trong dài hạn, Trung Quốc sẽ phát triển khả năng của riêng mình để tạo ra những chip AI cao cấp này.

Bất chấp những thách thức mà các nhà phát triển mô hình ngôn ngữ lớn Trung Quốc phải đối mặt, báo cáo của Đại học Thanh Hoa cho thấy Ernie 4.0 của Baidu và GLM-4 từ Zhipu AI (công ty khởi nghiệp được thành lập bởi một sinh viên Đại học Thanh Hoa) đã dần thu hẹp khoảng cách với những mô hình ngôn ngữ lớn tốt nhất thế giới về thành tích tổng thể.

Thử nghiệm cho thấy một lĩnh vực mà mô hình ngôn ngữ lớn Trung Quốc hoạt động tốt hơn là các tác vụ bằng ngôn ngữ văn bản tiếng Trung. Kimi của công ty khởi nghiệp Moonshot AI, Tongyi Qianwen 2.1 của Alibaba, GLM-4 và Ernie 4.0 được xếp hạng trong top 4 ở hạng mục đó, dù GPT-4 vẫn đứng đầu về lý luận ngôn ngữ văn bản tiếng Trung.

mo-hinh-ngon-ngu-lon-baidu-va-zhipu-ai-dung-dau-trung-quoc-nhung-kem-openai-ve-hieu-suat-tong-the.jpg — Theo đánh giá từ Đại học Thanh Hoa, phiên bản mới nhất Ernie 4.0 của Baidu là một trong những mô hình ngôn ngữ lớn hoạt động tốt nhất ở Trung Quốc - Ảnh: Bloomberg

Moonshot AI, Zhipu AI cùng với Baichuan và MiniMax được người dân địa phương gọi là “bốn con hổ AI mới” của Trung Quốc vì là những công ty khởi nghiệp về AI có khả năng sáng tạo hứa hẹn nhất đất nước.

Được thành lập vào năm 2019 và có trụ sở tại Bắc Kinh, Zhipu AI đã huy động được 2,5 tỉ nhân dân tệ (347 triệu USD) kể từ năm ngoái, từ các nhà đầu tư liên kết với nhà nước, công ty đầu tư mạo hiểm và các hãng công nghệ lớn như Tencent Holdings, Ant Group, Meituan, Xiaomi và Alibaba.

Moonshot AI (cũng có trụ sở tại Bắc Kinh) đã huy động được 1 tỉ USD trong vòng tài trợ vào tháng 2, theo nhiều phương tiện truyền thông Trung Quốc.

“Trung Quốc không thể bắt kịp những tiến bộ của Mỹ về AI do gặp thách thức về lý thuyết và công nghệ”

Trung Quốc không thể bắt kịp Mỹ trong những tiến bộ về AI do "gặp phải nhiều thách thức về lý thuyết và công nghệ", theo một bản thuyết trình gần đây trước Thủ tướng Lý Cường.

Những khó khăn đó được trình bày trước Thủ tướng Trung Quốc - Lý Cường trong chuyến thị sát vào tháng trước của ông tới Học viện Trí tuệ nhân tạo Bắc Kinh (BAAI), tổ chức phi lợi nhuận tư nhân được thành lập vào năm 2018, tham gia nghiên cứu và phát triển AI, đài truyền hình trung ương CCTV đưa tin.

Theo bài thuyết trình tại BAAI, rào cản lớn mà các sáng kiến AI tạo sinh của Trung Quốc phải đối mặt là sự phụ thuộc quá mức vào Llama, mô hình ngôn ngữ được Meta Platforms (Mỹ) phát hành vào tháng 2.2023.

Có “sự thiếu tự chủ nghiêm trọng” trong lĩnh vực phát triển AI của Trung Quốc vì hầu hết mô hình ngôn ngữ lớn trong nước đều được xây dựng dựa trên Llama, theo bài thuyết trình. Meta Platforms (công ty mẹ Facebook) vào tháng 7.2023 đã cung cấp mô hình ngôn ngữ lớn mã nguồn mở Llama 2 miễn phí cho nghiên cứu và sử dụng thương mại. Hôm 18.4, Meta Platforms đã ra mắt phiên bản đầu tiên của phiên bản Llama 3.

Nhược điểm về mô hình ngôn ngữ lớn làm gia tăng mối lo rằng Trung Quốc đang đối mặt với khoảng cách ngày càng mở rộng so với Mỹ về đổi mới AI, điều này đã được nhấn mạnh trong buổi thảo luận tại cuộc họp lưỡng hội đầu tháng 3 ở Bắc Kinh.

Trong khi các cơ quan nhà nước đang hợp tác song song với các hãng công nghệ tư nhân Trung Quốc để đổi mới AI, họ vẫn phải đối mặt với các vấn đề liên quan đến cơ sở hạ tầng điện toán để đào tạo mô hình ngôn ngữ lớn.

“Hàng tá chip được phát triển trong nước khác nhau về dòng và hệ sinh thái, khiến quá trình đào tạo 100 tỉ tham số cho mô hình ngôn ngữ lớn Trung Quốc trở nên rất không ổn định”, trích nội dung bài thuyết trình. Các lệnh trừng phạt công nghệ từ chính quyền Biden đã hạn chế khả năng tiếp cận của Trung Quốc với các chất bán dẫn tiên tiến được sản xuất bằng công nghệ Mỹ, cho các dự án phát triển AI trong nước.

Khả năng của mô hình ngôn ngữ lớn một phần phụ thuộc vào số lượng tham số, thước đo mức độ phức tạp cho mô hình. Ví dụ, mô hình ngôn ngữ lớn GPT-4 của OpenAI được đào tạo với 1.000 tỉ tham số. Trong khi hầu hết mô hình ngôn ngữ lớn nguồn mở của Trung Quốc trên thị trường chỉ có từ 6 tỉ đến 13 tỉ tham số.

Số lượng mô hình ngôn ngữ lớn được chính phủ Trung Quốc phê duyệt hiện có tổng cộng hơn 40.

Theo bài thuyết trình tại BAAI, một vấn đề lớn khác liên quan đến việc kiểm soát nội dung do AI tạo ra. Cụ thể hơn, thách thức lớn mà mô hình ngôn ngữ lớn ở Trung Quốc phải đối mặt là tạo ra “nội dung chất lượng phù hợp với thực tế”, đồng thời cũng phải xem xét tư tưởng chính trị và các cảm xúc khác nhau.

Các chatbot AI, gồm cả ChatGPT và Gemini của Google, đôi khi trả lời sai nhưng y như thật, được gọi là ảo giác.

Dù CCTV không xác định tác giả bài thuyết trình BAAI, các slide được phát sóng có logo của Zhipu AI. Đại diện của Zhipu AI hôm 14.3 xác nhận rằng công ty đã có mặt trong chuyến thị sát của Thủ tướng Trung Quốc tại BAAI một ngày trước đó.

Là một phần của hệ sinh thái hợp tác mà BAAI đang nuôi dưỡng, Zhipu AI cho biết đã xây dựng mô hình ngôn ngữ lớn với quy mô 100 tỉ tham số.

Trong cuộc họp bên lề hôm 5.3 của Ủy ban Chính Hiệp Toàn quốc (CPPCC) - cơ quan cố vấn chính trị hàng đầu Trung Quốc, Zeng Yi (đại biểu đứng đầu China Electronics Corporation) cho biết công ty của ông còn “một chặng đường dài” để bắt kịp Mỹ. China Electronics Corporation là công ty chip lớn thuộc sở hữu nhà nước Trung Quốc có trụ sở ở thành phố Thâm Quyến.

“Nói một cách khách quan, bất chấp những nỗ lực to lớn mà chúng ta đã và đang thực hiện, sự khác biệt của chúng ta với Mỹ vẫn rất lớn”, Zeng Yi phát biểu trước đám đông đại diện của cộng đồng khoa học và công nghệ.

Zeng Yi lãnh đạo một công ty phát triển công nghệ an ninh thông tin và mạng quốc gia, nghiên cứu và thiết kế chip, thiết bị bán dẫn, quy trình sản xuất tiên tiến và hệ điều hành.

Bài liên quan

Trung Quốc phê duyệt hơn 40 mô hình ngôn ngữ lớn trong nửa năm mặc cảnh báo từ CEO Baidu

Trung Quốc đã phê duyệt hơn 40 mô hình ngôn ngữ lớn để sử dụng công khai trong 6 tháng đầu tiên kể từ khi chính quyền bắt đầu quá trình này.

Đọc tiếp

Microsoft: Hacker từ Trung Quốc, Nga và Iran sử dụng các mô hình ngôn ngữ lớn của OpenAI

Adobe đưa Sora của OpenAI và các công cụ AI bên thứ ba vào phần mềm Premiere Pro đình đám

Baidu, Tencent, Ant Group hợp tác với OpenAI, Microsoft, Nvidia tạo 2 tiêu chuẩn AI quốc tế đầu tiên

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Tổng Bí thư: KH-CN, đổi mới sáng tạo là con đường duy nhất để đưa đất nước phát triển

24 phút trước Nhịp đập khoa học

Theo Tổng Bí thư Tô Lâm, phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số là lựa chọn bắt buộc, là con đường duy nhất để đưa đất nước phát triển và nâng cao đời sống cho nhân dân. Phải triển khai thật mạnh để quản trị xã hội tốt hơn và tăng năng suất lao động.

Chủ tịch VUSTA: Xây dựng năng lượng xanh bền vững cần có sự tham gia của đội ngũ khoa học

Để có thể xây dựng và phát triển ngành năng lượng và điện lực Việt Nam theo hướng bền vững,...
Tiếp tục rà soát bộ máy các cơ quan, tổ chức thuộc Đảng ủy Mặt trận Tổ quốc

Sáng 1.4, Đảng ủy Mặt trận Tổ quốc, các đoàn thể trung ương tổ chức hội nghị nghiên cứu, học...
3 mẫu iPhone có thể không nhận được iOS 19, bản cập nhật lớn nhất kể từ năm 2013

Apple có thể sẽ ngừng hỗ trợ ba mẫu iPhone hiện tại của mình khi ra mắt iOS 19.

Đừng bỏ lỡ

Quỹ nhà ở quốc gia: Cần có cơ chế ứng ra hoặc cho vay rồi thu về

6 phút trước Hạ tầng và bất động sản

Ông Lê Văn Bình cho rằng nếu chỉ dùng Quỹ nhà ở quốc gia để xây nhà ở xã hội thì sẽ không đủ nguồn lực, bởi không có quỹ nào đủ lớn để gánh toàn bộ chi phí xây dựng hàng trăm nghìn căn hộ trên cả nước.
Xây dựng nền tảng tiêu chuẩn hóa: Động lực thúc đẩy đổi mới sáng tạo

28 phút trước Khoa học - công nghệ

Tại buổi làm việc với Ủy ban Tiêu chuẩn Đo lường Chất lượng Quốc gia (TĐC), Bộ trưởng Bộ KH-CN Nguyễn Mạnh Hùng đề cập tới việc xây dựng các nền tảng phát triển tiêu chuẩn hóa.
Bản án nào cho các cựu lãnh đạo tỉnh An Giang ‘tiếp tay’ khai thác cát lậu?

một giờ trước Theo dòng thời sự

Ngày mai (2.4), Hội đồng xét xử TAND TP.HCM sẽ tuyên án sơ thẩm đối với các bị cáo trong vụ án khai thác cát lậu xảy ra tại Công ty cổ phần Đầu tư Trung Hậu 68 - Tổng 68.
Bộ Tài chính: Khối lượng công việc rất lớn, các đơn vị phải làm việc ngày đêm, cả thứ bảy, Chủ nhật

một giờ trước Theo dòng thời sự

Thứ trưởng Bộ Tài chính Lê Tấn Cận cho biết, sau khi rà soát văn bản theo định hướng sửa đổi Hiến pháp, Bộ Tài chính cần phải sửa đổi 195 văn bản quy phạm pháp luật. Khối lượng công việc rất lớn, các đơn vị của bộ làm việc không ngơi nghỉ, cả ngày đêm, cả thứ bảy, Chủ nhật.
Sóc Trăng tiếp nhận Quỹ học bổng Dương Kỳ Hiệp, tiếp sức học sinh nghèo

một giờ trước Giáo dục

Ngày 1.4, tại ấp Trường An, xã Trường Khánh (huyện Long Phú, tỉnh Sóc trăng), Hội Khuyến học tỉnh Sóc Trăng cùng gia đình nhà cách mạng Dương Kỳ Hiệp tổ chức kỷ niệm 25 năm ngày mất của ông và tiếp nhận quỹ học bổng mang tên Dương Kỳ Hiệp với số tiền gần 500 triệu đồng do gia đình và các nhà hảo tâm trao tặng.

Mới nhất

Tổng Bí thư: KH-CN, đổi mới sáng tạo là con đường duy nhất để đưa đất nước phát triển

24 phút trước Nhịp đập khoa học

Theo Tổng Bí thư Tô Lâm, phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số là lựa chọn bắt buộc, là con đường duy nhất để đưa đất nước phát triển và nâng cao đời sống cho nhân dân. Phải triển khai thật mạnh để quản trị xã hội tốt hơn và tăng năng suất lao động.
Tiếp tục rà soát bộ máy các cơ quan, tổ chức thuộc Đảng ủy Mặt trận Tổ quốc

3 giờ trước Theo dòng thời sự

Sáng 1.4, Đảng ủy Mặt trận Tổ quốc, các đoàn thể trung ương tổ chức hội nghị nghiên cứu, học tập, quán triệt tuyên truyền nghị quyết của Đảng.
3 mẫu iPhone có thể không nhận được iOS 19, bản cập nhật lớn nhất kể từ năm 2013

3 giờ trước Thế giới số

Apple có thể sẽ ngừng hỗ trợ ba mẫu iPhone hiện tại của mình khi ra mắt iOS 19.
Nông sản hữu cơ trồng 'thuận tự nhiên': Mùa nào thức đó

4 giờ trước Bảo vệ môi trường

“Mùa nào thức đó” thể hiện sự thông thái của người Việt từ xa xưa trong nông nghiệp. Triết lý này nhấn mạnh về việc cây cối, rau củ quả phát triển tốt nhất vào đúng mùa và cho ra hoa trái, rau củ giàu dinh dưỡng nhất.
Bảo vệ thông tin cá nhân và tài khoản để giao dịch an toàn

4 giờ trước Khoa học - công nghệ

Để giao dịch an toàn, TPBank khuyên người dân nên cài đặt và sử dụng xác thực sinh trắc học.