Hotline quảng cáo: 0934999945 Hotline nội dung:

Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI

Sơn Vân | 13/10/2023, 08:26

Trung Quốc đã công bố các yêu cầu bảo mật được đề xuất với những công ty cung cấp dịch vụ generative AI (trí tuệ nhân tạo tạo sinh), bao gồm cả danh sách đen các nguồn không được sử dụng để đào tạo các mô hình AI.

Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.

Phổ biến nhờ sự thành công của chatbot ChatGPT do OpenAI phát triển, generative AI học cách thực hiện hành động từ dữ liệu trong quá khứ và tạo nội dung mới như văn bản hoặc hình ảnh dựa trên khóa đào tạo đó.

Các yêu cầu bảo mật đã được Ủy ban Tiêu chuẩn An toàn Thông tin Quốc gia Trung Quốc công bố hôm 12.10, gồm các quan chức của Cục Quản lý Không gian mạng Trung Quốc (CAC), Bộ Công nghiệp và Công nghệ Thông tin, cảnh sát.

Ủy ban đề xuất tiến hành đánh giá bảo mật với từng nội dung được sử dụng để đào tạo các mô hình generative AI hướng tới công chúng, trong đó những nội dung chứa “hơn 5% thông tin bất hợp pháp và có hại” sẽ bị đưa vào danh sách đen. Những thông tin như vậy bao gồm "ủng hộ khủng bố" hoặc bạo lực, "lật đổ hệ thống xã hội chủ nghĩa", "làm tổn hại hình ảnh đất nước", "phá hoại đoàn kết dân tộc và ổn định xã hội".

Dự thảo quy định cũng nêu rõ rằng thông tin bị kiểm duyệt trên mạng internet Trung Quốc không được phép sử dụng để đào tạo mô hình generative AI.

Việc xuất bản dự thảo này diễn ra chỉ hơn một tháng sau khi các cơ quan quản lý cho phép một số hãng công nghệ Trung Quốc ra mắt các chatbot dựa trên generative AI của họ cho công chúng sử dụng.

Kể từ tháng 4, CAC đã yêu cầu các công ty phải nộp đánh giá về bảo mật cho cơ quan chức năng trước khi ra mắt dịch vụ dựa trên generative AI cho công chúng.

Vào tháng 7, CAC đã công bố các biện pháp quản lý các dịch vụ như vậy mà các nhà phân tích cho rằng ít phiền toái hơn nhiều so với các biện pháp được nêu trong dự thảo hồi tháng 4.

Dự thảo được công bố hôm 12.10 yêu cầu các tổ chức sở hữu mô hình AI phải có được sự đồng ý từ những người có thông tin cá nhân được sử dụng cho mục đích đào tạo, gồm cả dữ liệu sinh trắc học.

Dự thảo cũng đưa ra những hướng dẫn chi tiết về cách tránh vi phạm sở hữu trí tuệ.

Các quốc gia trên toàn cầu đang vật lộn với việc thiết lập rào cản với AI. Trung Quốc coi AI là lĩnh vực mà họ muốn cạnh tranh với Mỹ và đặt mục tiêu trở thành nước dẫn đầu thế giới trong mảng này vào năm 2030.

trung-quoc-de-xuat-danh-sach-den-nguon-du-lieu-dao-tao-cac-mo-hinh-generative-ai.jpg — Trung Quốc vừa công bố các yêu cầu bảo mật được đề xuất với những công ty cung cấp dịch vụ generative AI, bao gồm cả danh sách đen các nguồn không được sử dụng để đào tạo các mô hình AI - Ảnh: Internet

Cuối tháng 8, năm hãng công nghệ Trung Quốc, trong đó có SenseTime và Baidu, đã phát hành chatbot AI của riêng họ trong nỗ lực để cạnh tranh với ChatGPT. Quyết định được đưa ra sau sự chấp thuận từ chính phủ Trung Quốc.

Baidu, nhà cung cấp dịch vụ tìm kiếm trực tuyến hàng đầu Trung Quốc, cho biết Ernie Bot đã có sẵn để mọi người có thể trải nghiệm.

Chia sẻ với hãng tin Reuters, người phát ngôn SenseTime nói rằng SenseChat cũng đã “có sẵn để phục vụ tất cả người dùng”.

Ba công ty khởi nghiệp khác về AI gồm Baichuan Intelligence Technology, Zhipu AI và MiniMax cũng công bố phát hành chatbot AI tương tự với công chúng hôm 31.8.

Không giống như các quốc gia khác, Trung Quốc yêu cầu các công ty gửi đánh giá bảo mật và nhận được giấy phép trước khi tung ra thị trường đại chúng các sản phẩm AI.

Truyền thông Trung Quốc đưa tin tổng cộng 11 công ty đã nhận được sự chấp thuận từ chính phủ về việc phát triển sản phẩm AI của họ, gồm cả ByteDance (chủ sở hữu TikTok) và Tencent Holdings.

Theo Robin Li - Giám đốc điều hành của Baidu, bằng cách ra mắt Ernie Bot, Baidu sẽ "thu thập lượng lớn phản hồi có giá trị của con người trong thế giới thực" để cải thiện hơn nữa chất lượng của chatbot. Baidu cũng có kế hoạch phát hành một loạt "ứng dụng gốc AI".

Kai Wang, nhà phân tích tại hãng Morningstar, nói: “Tôi nghĩ những công ty được phê duyệt có lợi thế đi đầu để có thể tinh chỉnh sản phẩm của họ nhanh hơn so với các đối thủ cạnh tranh”.

Trước đó, Trung Quốc đã công bố một bộ quy tắc tạm thời nhằm quản lý các sản phẩm AI mang tính sáng tạo cho công chúng, có hiệu lực vào ngày 15.8.

Trước đây, các công ty chỉ được phép tiến hành thử nghiệm công khai quy mô nhỏ các sản phẩm AI, nhưng với các quy định mới, họ đã mở rộng thử nghiệm sản phẩm AI của mình bằng cách kích hoạt nhiều tính năng hơn và tham gia nhiều hoạt động tiếp thị hơn.

Cuộc chiến trăm mô hình ngôn ngữ lớn của Trung Quốc sắp thay đổi vì áp lực chi phí tăng

Cơn sốt generative AI của Trung Quốc đã dẫn đến hàng loạt thông báo về sản phẩm từ các công ty khởi nghiệp và gã khổng lồ công nghệ gần như hàng ngày, nhưng các nhà đầu tư đang cảnh báo một sự thay đổi sắp xảy ra khi áp lực chi phí và lợi nhuận tăng lên.

Sự phấn khích ở Trung Quốc lần đầu tiên được khơi dậy bởi thành công của ChatGPT gần một năm trước, đã dẫn đến điều mà một lãnh đạo cấp cao Tencent mô tả trong tháng này là “cuộc chiến của một trăm mô hình”, khi các đối thủ từ Baidu đến Alibaba và Huawei đua nhau quảng bá các sản phẩm của họ.

Theo công ty môi giới CLSA, Trung Quốc hiện có ít nhất 130 mô hình ngôn ngữ lớn, chiếm 40% tổng số toàn cầu và chỉ sau con số 50% của Mỹ. Ngoài ra, các công ty cũng đã công bố hàng chục mô hình ngôn ngữ lớn theo ngành liên kết với mô hình cốt lõi của họ. Tuy nhiên, các nhà đầu tư và nhà phân tích nói rằng hầu hết vẫn chưa tìm được mô hình kinh doanh khả thi, quá giống nhau và đang phải vật lộn với chi phí tăng cao.

Căng thẳng Trung – Mỹ cũng đè nặng lên lĩnh vực này, khi các quỹ USD đầu tư ít hơn vào các dự án giai đoạn đầu và khó khăn trong việc có được chip AI do những công ty như Nvidia sản xuất bắt đầu ảnh hưởng.

Esme Pau, người đứng đầu bộ phận nghiên cứu tài sản kỹ thuật số và internet Trung Quốc tại tập đoàn tài chính Macquarie Group, cho biết: “Chỉ những người có năng lực mạnh nhất mới tồn tại được”.

Bà nói thêm rằng một số công ty hàng đầu đã phát tín hiệu rằng sẽ cạnh tranh về giá để giành thị phần, giống như các dịch vụ đám mây như của Alibaba và Tencent từng làm.

Esme Pau nhận định: “Trong 6-12 tháng tới, mô hình ngôn ngữ lớn có khả năng thấp hơn sẽ dần bị loại bỏ do hạn chế về chip, chi phí cao và cạnh tranh gay gắt”.

Bài liên quan

Dùng AI, Google tìm ra cách chặn thư rác trong Gmail

Thư rác (email spam) luôn là một vấn đề kể từ khi email tồn tại. Dù các nhà cung cấp dịch vụ email công cộng như Google và Microsoft đã tìm cách giảm lượng thư rác mà người dùng nhận được, chúng vẫn tiếp tục tràn vào hộp thư đến và lấp đầy hộp thư rác.

Đọc tiếp

Meta trả cho nhà sáng tạo làm đại diện chatbot AI đến 5 triệu USD sau 6 giờ làm việc

Đông Nam Á xem xét các quy tắc AI, thách thức tham vọng của EU

Các công ty generative AI có thể gặp muôn vàn khó khăn vào năm 2024 vì chi phí khủng

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Thủ tướng: Cơ chế, chính sách phù hợp sẽ nhân đôi, nhân ba sức mạnh

2 giờ trước Sự kiện

Trong chương trình kỳ họp thứ 8, sáng 23.11, các đại biểu Quốc hội thảo luận tại tổ về dự án Luật Quản lý và đầu tư vốn Nhà nước tại doanh nghiệp và dự án Luật Công nghiệp công nghệ số. Thủ tướng Phạm Minh Chính tham gia thảo luận tại tổ 8, gồm đại biểu Quốc hội các địa phương Vĩnh Long, Điện Biên, Kon Tum, Cần Thơ.

Đánh thức tiềm năng văn hóa của các dân tộc thiểu số

Là một bộ phận hữu cơ của văn hóa quốc gia nhưng văn hóa của các dân tộc thiểu số vẫn mang...
Phát hiện gần 50 website giả mạo thương hiệu với mục đích lừa đảo

Trong tháng 10.2024, hệ thống của NCSC đã phát hiện 49 website giả mạo thương hiệu với mục...
Elon Musk phá vỡ kỷ lục về tài sản cá nhân khi cổ phiếu Tesla tiếp tục tăng, bỏ xa Jeff Bezos 129 tỉ USD

Elon Musk vừa phá vỡ kỷ lục về khối tài sản của mình nhờ đợt tăng giá cổ phiếu Tesla mạnh mẽ...

Đừng bỏ lỡ

TP.HCM: Số ca sốt xuất huyết liên tục gia tăng, đã có 1 trường hợp tử vong

một giờ trước Thông tin Y học

Trong những tuần gần đây, số ca mắc sốt xuất huyết trên địa bàn TP.HCM gia tăng và đã có 1 trường hợp tử vong.
Tìm kiếm ý tưởng sáng tạo tối ưu hóa quy trình chế biến lương thực - thực phẩm

một giờ trước Khoa học - công nghệ

Ngày 23.11, Trung tâm Phát triển khoa học và công nghệ trẻ TP.HCM tổ chức vòng thi bán kết và chung kết cuộc thi Công nghệ chế biến sau thu hoạch - năm 2024, tại Trường Đại học Công Thương TP.HCM.
Điểm qua 3 loại tên lửa làm leo thang cuộc chiến Ukraine

2 giờ trước Quốc tế

Tuần qua chứng kiến nhiều diễn biến đáng ngại làm leo thang cuộc chiến Ukraine. Tất cả xoay quanh 3 loại tên lửa tiên tiến.
Miền Bắc sắp chuyển rét, có nơi rét đậm dưới 10 độ

4 giờ trước Sự kiện

Nhiệt độ thấp nhất trong đợt không khí lạnh này ở Bắc Bộ và Bắc Trung Bộ phổ biến từ 16-18 độ, vùng núi 12-14 độ, vùng núi cao dưới 10 độ.
Ngày Di sản văn hóa Việt Nam: Nhiều di tích ở Hà Nội mở cửa miễn phí

4 giờ trước Văn hóa

Nhân ngày Di sản văn hóa Việt Nam 23.11, hàng loạt di tích lịch sử ở Hà Nội thông báo mở cửa miễn phí đón tiếp du khách tới tham quan.

Mới nhất

Thủ tướng: Cơ chế, chính sách phù hợp sẽ nhân đôi, nhân ba sức mạnh

2 giờ trước Sự kiện

Trong chương trình kỳ họp thứ 8, sáng 23.11, các đại biểu Quốc hội thảo luận tại tổ về dự án Luật Quản lý và đầu tư vốn Nhà nước tại doanh nghiệp và dự án Luật Công nghiệp công nghệ số. Thủ tướng Phạm Minh Chính tham gia thảo luận tại tổ 8, gồm đại biểu Quốc hội các địa phương Vĩnh Long, Điện Biên, Kon Tum, Cần Thơ.
Đánh thức tiềm năng văn hóa của các dân tộc thiểu số

3 giờ trước Văn hóa

Là một bộ phận hữu cơ của văn hóa quốc gia nhưng văn hóa của các dân tộc thiểu số vẫn mang những bản sắc riêng có, mới lạ và đầy hấp dẫn.
Phát hiện gần 50 website giả mạo thương hiệu với mục đích lừa đảo

5 giờ trước Khoa học - công nghệ

Trong tháng 10.2024, hệ thống của NCSC đã phát hiện 49 website giả mạo thương hiệu với mục đích lừa đảo được phát tán trên không gian mạng.
Elon Musk phá vỡ kỷ lục về tài sản cá nhân khi cổ phiếu Tesla tiếp tục tăng, bỏ xa Jeff Bezos 129 tỉ USD

5 giờ trước Thế giới số

Elon Musk vừa phá vỡ kỷ lục về khối tài sản của mình nhờ đợt tăng giá cổ phiếu Tesla mạnh mẽ sau khi ông Trump đắc cử Tổng thống Mỹ.
Chính quyền An Giang vào cuộc vụ khai thác trái phép hơn 875.000m3 đất

9 giờ trước Kinh tế - đầu tư - dự án

UBND tỉnh An Giang đã việc thành lập Tổ xem xét, xử lý vi phạm đối với hoạt động khai thác khoáng sản, sử dụng đất của Công ty cổ phần Xây lắp An Giang tại cụm công nghiệp, thị trấn An Phú, huyện An Phú.