CEO Baidu: Có quá nhiều mô hình ngôn ngữ lớn nhưng lại thiếu ứng dụng AI ở Trung Quốc

Nhịp đập khoa học - Ngày đăng : 22:39, 05/07/2024

Robin Li Yanhong (Lý Ngạn Hoành), đồng sáng lập và là Giám đốc điều hành Baidu, cho biết Trung Quốc có quá nhiều mô hình ngôn ngữ lớn và kêu gọi các nhà lãnh đạo công nghệ tập trung hơn vào việc xây dựng các ứng dụng trong thế giới thực dựa trên trí tuệ nhân tạo (AI).

Nhịp đập khoa học

CEO Baidu: Có quá nhiều mô hình ngôn ngữ lớn nhưng lại thiếu ứng dụng AI ở Trung Quốc

Sơn Vân • {Ngày xuất bản}

“Vào năm 2023, sự cạnh tranh gay gắt giữa hơn 100 mô hình ngôn ngữ lớn đã xuất hiện ở Trung Quốc, dẫn đến lãng phí đáng kể tài nguyên, đặc biệt là sức mạnh tính toán”, Robin Li Yanhong nói trong cuộc thảo luận tại Hội nghị AI Thế giới (WAIC) ở thành phố Thượng Hải hôm 5.7. Baidu là hãng tìm kiếm internet số 1 Trung Quốc.

Lý Ngạn Hoành kêu gọi các nhà phát triển xây dựng các ứng dụng thực tế hơn thay vì liên tục điều chỉnh mô hình ngôn ngữ lớn (công nghệ làm nền tảng cho các sản phẩm AI tạo sinh như chatbot). Ông nói: “Tôi nhận thấy rằng nhiều người vẫn chủ yếu tập trung vào các mô hình nền tảng. Thế nhưng, tôi muốn hỏi: Còn ứng dụng trong thế giới thực thì sao? Ai đã được hưởng lợi từ chúng?”.

Thị trường AI tạo sinh của Trung Quốc đã trở nên đông đúc với hơn 200 mô hình ngôn ngữ lớn xuất hiện kể từ khi ChatGPT ra mắt vào tháng 11.2022. Sự cạnh tranh quá mức giữa các hãng công nghệ lớn đã dẫn đến cuộc chiến về giá cho các dịch vụ AI thương mại, trong khi các công ty Mỹ như OpenAI và Google bị loại khỏi thị trường Trung Quốc.

Giống như phần lớn ngành công nghiệp trên toàn cầu, thị trường AI của Trung Quốc vẫn đang trong giai đoạn đầu kiếm tiền. Lý Ngạn Hoành cho biết logistics và viết sáng tạo là hai ngành đã được hưởng lợi từ các ứng dụng AI giúp cải thiện hiệu quả.

Viết sáng tạo là hình thức viết lách sử dụng ngôn ngữ để truyền tải ý tưởng, cảm xúc và trải nghiệm theo cách sáng tạo, độc đáo. Nó vượt ra ngoài khuôn khổ của các dạng viết truyền thống như báo chí, học thuật hay kỹ thuật, mà tập trung vào việc kể chuyện, phát triển nhân vật và sử dụng ngôn ngữ linh hoạt để thu hút, truyền cảm hứng cho người đọc.

Baidu Comate, trợ lý lập trình được hỗ trợ bởi mô hình ngôn ngữ lớn Ernie của công ty, đã được triển khai nội bộ để sử dụng cho nhân viên. Lý Ngạn Hoành cho biết 30% công việc lập trình tại Badu hiện do AI xử lý.

Hôm 5.7, Baidu cũng đã giới thiệu mô hình ngôn ngữ lớn Ernie 4.0 Turbo mới dành cho khách hàng doanh nghiệp, kèm theo việc giảm giá thêm 83% với mô hình Ernie 4.0 và Ernie 3.5.

Xu Li, đồng sáng lập và Giám đốc điều hành SenseTime (hãng tiên phong về AI của Trung Quốc), nói tại WAIC: “Tôi nghĩ các ứng dụng là chìa khóa để xác định liệu thời đại này có phải là thời điểm quan trọng với AI hay không”.

“Dù ngành của chúng tôi hiện là chủ đề nóng, nhưng nó vẫn chưa đạt đến thời điểm quan trọng vì chưa thâm nhập vào bất cứ ứng dụng nào trong bất kỳ ngành dọc nào dẫn đến sự thay đổi rộng rãi”, Xu Li nói thêm.

Ngành dọc là nhóm các doanh nghiệp và khách hàng cùng hoạt động trong một lĩnh vực cụ thể, có mối liên hệ chặt chẽ với nhau trong chuỗi giá trị. Ví dụ:

Ngành công nghiệp bán lẻ: Gồm các doanh nghiệp như nhà sản xuất hàng tiêu dùng, nhà bán buôn, nhà bán lẻ và người dùng cuối.

Ngành công nghiệp chăm sóc sức khỏe: Gồm các bệnh viện, phòng khám, hãng dược phẩm, công ty bảo hiểm y tế và bệnh nhân.

Ngành công nghiệp sản xuất: Gồm các nhà sản xuất ô tô, máy bay, thiết bị điện tử cùng các nhà cung cấp nguyên liệu và linh kiện cho họ.

Ví dụ về các công ty tập trung vào thị trường dọc:

Salesforce: Cung cấp phần mềm quản lý quan hệ khách hàng (CRM) cho các doanh nghiệp trong nhiều ngành dọc khác nhau, gồm bán lẻ, dịch vụ tài chính và chăm sóc sức khỏe.

SAP: Cung cấp phần mềm quản lý doanh nghiệp (ERP) cho các doanh nghiệp trong nhiều ngành dọc khác nhau, gồm sản xuất, chuỗi cung ứng và bán lẻ.

Adobe: Cung cấp phần mềm sáng tạo và tiếp thị cho các doanh nghiệp trong nhiều ngành dọc khác nhau, gồm truyền thông, giáo dục và bán lẻ.

Yan Junjie, Giám đốc điều hành MiniMax - một trong những công ty khởi nghiệp AI hàng đầu khác của Trung Quốc, nói tại WAIC rằng ông kỳ vọng có sự hợp nhất lớn trong ngành với mô hình ngôn ngữ lớn chủ yếu chỉ được phát triển bởi 5 công ty.

Thành công bất ngờ của ChatGPT sau thời gian ngắn đã châm ngòi cho làn sóng AI ở Trung Quốc và cuộc chạy đua tạo ra mô hình ngôn ngữ lớn tốt nhất trong nước.

Ngoài một nhóm nhỏ các công ty khởi nghiệp được mệnh danh là “những con hổ AI” của Trung Quốc, các hãng công nghệ lớn đã rót nguồn lực vào thị trường này.

ceo-baidu-co-qua-nhieu-mo-hinh-ngon-ngu-lon-nhung-lai-thieu-ung-dung-ai-o-trung-quoc.jpg — Lý Ngạn Hoành cảnh báo tại WAIC rằng Trung Quốc đang lãng phí tài nguyên để điều chỉnh các mô hình ngôn ngữ lớn trong khi không xây dựng được các ứng dụng AI thực tế hơn - Ảnh: AFP

Trong 19 tháng kể từ khi OpenAI ra mắt ChatGPT, các hãng công nghệ lớn và nhỏ của Trung Quốc đã tập trung vào mục tiêu đánh bại công ty khởi nghiệp Mỹ được Microsoft hậu thuẫn bằng các chatbot riêng.

Các kết quả còn trái ngược nhau, với một số gã khổng lồ công nghệ tuyên bố đạt kết quả tốt hơn GPT-4, mô hình ngôn ngữ lớn tiên tiến của OpenAI, với những truy vấn tiếng Trung. Có hơn 200 mô hình ngôn ngữ lớn từ nhiều công ty Trung Quốc đang tranh giành thị phần. Dù khó vượt qua OpenAI, các công ty AI của Trung Quốc có thể tự hào thông báo sở hữu ít nhất một lợi thế rõ ràng so với đối thủ ở Mỹ là giá cả của mô hình ngôn ngữ lớn.

Vào tháng 5, ByteDance, Baidu, Alibaba và Tencent đều đã giảm giá mạnh việc đăng ký sử dụng mô hình ngôn ngữ lớn của họ.

Dịch vụ cao cấp từ mô hình ngôn ngữ lớn Doubao Pro của ByteDance có giá chỉ 0,0008 nhân dân tệ cho 1.000 token, giảm 99,8% so với mức phí OpenAI tính cho quyền truy cập GPT-4. Token là đơn vị dữ liệu được mô hình ngôn ngữ lớn xử lý. Với mô hình ngôn ngữ lớn tiếng Trung, 1 token thường tương đương với từ 1 đến 1,8 ký tự tiếng Trung.

Với mức giá này, 1 nhân dân tệ có thể mua được 1,25 triệu token đầu vào. Để so sánh, sẽ tốn khoảng 37,50 USD (tương đương 272 nhân dân tệ) để mua 1,25 triệu mã token đầu vào của GPT-4.

Ở Mỹ, những gã khổng lồ công nghệ như Alphabet (công ty mẹ Google), Meta Platforms (chủ sở hữu Facebook), Amazon và Microsoft cũng đang cạnh tranh trong lĩnh vực AI bằng cách đi theo chiến lược “tăng quy mô chớp nhoáng” đã trở nên phổ biến ở Thung lũng Silicon. Cụ thể là thu hút người dùng càng nhanh càng tốt, bấp chấp doanh thu, để chiếm lĩnh thị trường.

Ngay cả khi đang tận hưởng “khu vườn có tường bao quanh” đằng sau Great Fireawall (tường lửa vĩ đại kiểm duyệt các dịch vụ internet nước ngoài), các công ty Trung Quốc vẫn phải đối mặt với thách thức lớn do Mỹ hạn chế xuất khẩu chip tiên tiến của Nvidia. Họ cũng có sức chi tiêu doanh nghiệp ít hơn so với các công ty cùng ngành tại thị trường Mỹ với nguồn tiền dồi dào.

Cung cấp bộ xử lý đồ họa (GPU) mạnh mẽ cho máy chủ, Nvidia đóng vai trò quan trọng trong việc các hãng lớn phát triển các mô hình AI.

“Việc giảm giá với các dịch vụ AI của Trung Quốc chủ yếu nhằm mục đích thu hút nhiều khách hàng hơn và giống như một hoạt động xây dựng thương hiệu hơn”, Xu Li, Giám đốc điều hành và đồng sáng lập SenseTime (công ty AI niêm yết tại Hồng Kông), nói với trang SCMP.

ByteDance đã mở đầu cuộc chiến giá cả mô hình ngôn ngữ lớn vào giữa tháng 5 khi công bố mức giá cho các dịch vụ AI Doubao của mình giảm mạnh so với các đối thủ trong nước. Các hãng công nghệ lớn khác của Trung Quốc đã nhanh chóng phản ứng.

Alibaba Cloud, đơn vị đám mây của gã khổng lồ thương mại điện tử Alibaba, đã công bố giảm giá đến 97% cho hàng loạt mô hình ngôn ngữ lớn Tongyi Qwen. Ví dụ, Alibaba giảm giá mô hình Qwen-Long từ 0,02 nhân dân tệ trên 1.000 token xuống 0,0005 nhân dân tệ, tức rẻ hơn 0,0003 nhân dân tệ so với ByteDance.

Baidu nhanh chóng chạy theo Alibaba Cloud khi thông báo rằng mô hình ngôn ngữ lớn Ernie Speed và Ernie Lite sẽ được miễn phí cho tất cả người dùng doanh nghiệp.

Các công ty như Tencent và iFlytek (chuyên gia AI nổi tiếng với công nghệ nhận dạng âm thanh) cũng giảm giá mạnh mô hình ngôn ngữ lớn của họ.

Wang Sheng, nhà đầu tư của hãng InnoAngel Fund có trụ sở tại Bắc Kinh (thủ đô Bắc Kinh), cho biết kiểu cạnh tranh giá “ác liệt” này đang gây tổn hại cho các công ty khởi nghiệp AI địa phương. Ông nói: “Khi nói đến việc phát triển mô hình ngôn ngữ lớn, các hãng công nghệ lớn không nhất thiết phải giỏi hơn các công ty khởi nghiệp. Tuy nhiên, chiến lược giảm giá của họ để giành thị phần sẽ gây bất lợi cho các công ty khởi nghiệp”.

Alain Le Couedic, đối tác cấp cao tại công ty đầu tư AI Artificial Intelligence Quartermaster (AIQ), cho rằng cuộc cạnh tranh về giá sẽ mang lại kết quả theo thời gian. Ông nói: “Cuộc đua giành quyền thống trị thị trường là dấu hiệu cho thấy nhiều công ty nhìn thấy các cơ hội hấp dẫn trong tương lai, ngay cả khi điều đó gây ra một số khó khăn trong ngắn hạn đến trung hạn”.

Mô hình ngôn ngữ lớn tiêu tốn nhiều năng lượng, khiến chúng tốn kém khi vận hành, do đó chi phí biên để thêm người dùng mới có thể cao hơn so với các dịch vụ trực tuyến khác. Điều này làm cho việc mở rộng quy mô nhanh chóng trở nên phức tạp hơn với các dịch vụ AI. Tuy nhiên, một cuộc đua để làm cho mô hình ngôn ngữ lớn hiệu quả hơn cuối cùng có thể thay đổi điều này.

Chi phí biên (marginal cost) là chi phí phát sinh thêm khi sản xuất thêm một đơn vị sản phẩm hoặc dịch vụ. Cụ thể, nó là sự thay đổi trong tổng chi phí khi tăng sản lượng thêm một đơn vị.

Bill MacCartney, Giám đốc công nghệ của công ty đầu tư mạo hiểm SignalFire và là giáo sư khoa học máy tính tại Đại học Stanford (Mỹ), chia sẻ với SCMP tại Hội nghị Đầu tư châu Á UBS cuối tháng 5: “Việc vận hành những mô hình ngôn ngữ lớn này tốn rất nhiều tiền và mọi hãng có động lực kinh tế mạnh mẽ để tìm cách làm cho nó rẻ hơn”.

Một số công ty cho biết hiệu quả được cải thiện trong đào tạo và vận hành các mô hình ngôn ngữ lớn là lý do chính để họ giảm giá. OpenAI ghi nhận những hiệu quả như vậy là lý do đằng sau mức giá thấp hơn nhiều của mô hình ngôn ngữ lớn đa phương thức GPT-4o ra mắt hôm 14.5.

Vào tháng 4, Lý Ngạn Hoành nói rằng hiệu quả đào tạo Ernie, mô hình ngôn ngữ lớn hàng đầu của Baidu, đã cải thiện 5,1 lần trong vòng một năm. Hiệu suất suy luận của Ernie tăng 105 lần, giảm 99% chi phí suy luận.

ByteDance cho biết giảm giá mô hình ngôn ngữ lớn vì tự tin có thể giảm chi phí thông qua cải tiến kỹ thuật.

Sơn Vân