ByteDance cho biết việc sử dụng công nghệ từ OpenAI để hỗ trợ phát triển mô hình trí tuệ nhân tạo (AI) riêng tuân thủ các điều khoản dịch vụ của công ty Mỹ, bác bỏ cáo buộc cho rằng họ dùng công nghệ này để xây dựng một dịch vụ cạnh tranh.
Theo hãng tin công nghệ The Verge (Mỹ), ByteDance đang phát triển dự án AI Project Seed, gồm hai sản phẩm chính là Doubao (chatbot AI dành cho thị trường Trung Quốc) và một chatbot AI khác để thương mại hóa trên toàn cầu thông qua nền tảng đám mây. Cách phân bổ này tương tự khi tập đoàn Trung Quốc phát hành ứng dụng video ngắn Douyin và TikTok. Tuy nhiên theo The Verge, thay vì sử dụng công cụ huấn luyện AI theo mô hình ngôn ngữ lớn riêng, ByteDance được cho dùng giao diện lập trình ứng dụng (API) của OpenAI, vi phạm quy định trong ngành AI.
The Verge đưa tin ByteDance lạm dụng công cụ của OpenAI trong nhiều giai đoạn phát triển Project Seed, gồm công đoạn đào tạo và đánh giá mô hình AI. Song khi cần xin cấp phép hoạt động chatbot Doubao tại Trung Quốc vài tháng trước, ByteDance yêu cầu nhóm nghiên cứu dừng sử dụng API OpenAI để tránh rắc rối pháp lý.
Theo The Verge, Project Seed được khởi động khoảng một năm trước và nhận được sự ưu tiên từ lãnh đạo ByteDance. Mục tiêu của dự án là tạo một mô hình ngôn ngữ lớn mạnh mẽ trong thời gian tối thiểu. Dự kiến mô hình AI này đạt 200 tỉ tham số cuối năm 2023, vượt qua mốc 175 tỉ của GPT-3.5, đồng thời đuổi kịp GPT-4 vào 2024.
Hôm 17.12, ByteDance đã đưa ra lời giải thích sau khi bị The Verge cáo buộc lén lút sử dụng công nghệ của OpenAI để phát triển mô hình ngôn ngữ lớn riêng, đồng thời cố gắng che giấu dấu vết của mình thông qua “giảm dữ liệu nhạy cảm”.
Trong một tuyên bố với trang SCMP, ByteDance thừa nhận rằng khi bắt đầu khám phá mô hình ngôn ngữ lớn vào đầu năm nay, một nhóm nhỏ kỹ sư của họ đã sử dụng dịch vụ API của OpenAI trong một mô hình thử nghiệm chưa bao giờ được ra mắt công khai.
Công ty mẹ TikTok nói thêm rằng công việc ban đầu này đã bị ngừng vào tháng 4, sau khi giới thiệu một giao thức nhằm đảm bảo tuân thủ các điều khoản sử dụng của OpenAI, trong đó cấm sử dụng đầu ra từ các sản phẩm GPT của công ty Mỹ để “phát triển các mô hình cạnh tranh với OpenAI”.
Theo ByteDance – tập đoàn có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), nhóm kỹ thuật của họ vẫn sử dụng API từ OpenAI cùng với một số mô hình bên thứ ba khác “ở một mức độ rất hạn chế trong quá trình đánh giá/thử nghiệm, chẳng hạn như đo điểm chuẩn”.
“ByteDance được cấp phép sử dụng API OpenAI và rất chú trọng đến việc tuân thủ các điều khoản sử dụng của OpenAI”, tập đoàn Trung Quốc cho biết.
Trước đó, Jodi Seth (đại diện ByteDance) xác nhận tập đoàn có dùng API của OpenAI trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm 2023.
"Công ty được Microsoft cấp phép truy cập API OpenAI. Ngoài ra, ByteDance chỉ sử dụng công cụ này để hỗ trợ sản phẩm AI ở thị trường quốc tế. Với chatbot Doubao tại Trung Quốc, chúng tôi có các mô hình tự phát triển", Jodi Seth nói.
Tuy nhiên, OpenAI thông báo đã đình chỉ ByteDance truy cập vào dịch vụ của mình.
“Dù việc sử dụng API của chúng tôi ở mức tối thiểu nhưng ByteDance đã bị đình chỉ tài khoản của họ trong khi điều tra thêm. Nếu phát hiện ra rằng việc sử dụng của ByteDance không tuân theo các chính sách này, chúng tôi sẽ yêu cầu thực hiện những thay đổi cần thiết hoặc chấm dứt tài khoản của họ”, OpenAI, công ty được Microsoft hậu thuẫn, cho biết trong một tuyên bố gửi tới The Verge.
OpenAI chưa được chính thức cung cấp dịch vụ của mình ở Trung Quốc.
Việc cáo buộc ByteDance sử dụng công nghệ của OpenAI để xây dựng mô hình ngôn ngữ lớn riêng đến sau khi công ty khởi nghiệp 01.AI và bị tố sao chép kiến trúc Llama của Meta Platforms trong mô hình Yi-34B LLM của mình, theo một bài đăng trên cộng đồng mã nguồn mở Huggingface.
01.AI được Lý Khải Phục, chuyên gia AI và cựu Chủ tịch Google Trung Quốc, thành lập.
Lời cáo buộc đã làm dấy lên cuộc tranh luận sôi nổi vào thời điểm đó về khả năng sáng tạo của các công ty khởi nghiệp AI Trung Quốc.
Kể từ khi OpenAI ra mắt ChatGPT (hoạt động dựa trên mô hình ngôn ngữ lớn GPT-3.5) vào tháng 11.2022, các hãng công nghệ Trung Quốc đã cố gắng tận dụng làn sóng AI để tung ra sản phẩm cạnh tranh. Tuy nhiên, những người trong ngành và các nhà phân tích cho biết việc trình làng mô hình ngôn ngữ lớn GPT-4 Turbo vào đầu tháng 11 dự kiến sẽ giúp OpenAI tiếp tục kéo dài vị trí dẫn đầu trước các đối thủ Trung Quốc.
GPT-4 Turbo là phiên bản mạnh mẽ hơn và rẻ hơn GPT-4. Các cải tiến của GPT-4 Turbo bao gồm bộ nhớ lớn hơn để ghi nhớ tới 300 trang văn bản chỉ trong một lời nhắc, giá rẻ hơn cho nhà phát triển và ngày được đào tạo kiến thức đến tháng 4.2023, theo Sam Altman - Giám đốc điều hành OpenAI.
GPT-4 Turbo gồm hai phiên bản, một phiên bản phân tích văn bản chặt chẽ và phiên bản còn lại có tìm hiểu về bối cảnh của văn bản, hình ảnh.
OpenAI cho biết đã tối ưu hóa hiệu suất để có thể cung cấp GPT-4 Turbo với mức giá cho chuỗi ký tự đầu vào và đầu ra lần lượt chỉ bằng 1/3 và 1/2 so với giá GPT-4.
Nếu như GPT-4 được cập nhật dữ liệu lấy từ các trang web đến tháng 9.2021 thì GPT-4 Turbo lấy dữ liệu cập nhật tới tháng 4.2023. GPT-4 Turbo có thể đưa ra câu trả lời với độ dài tương đương hơn 300 trang văn bản trong một lần nhận yêu cầu.
Trong khi đó, Trung Quốc đã chứng kiến sự tăng trưởng bùng nổ về số lượng mô hình ngôn ngữ lớn đang được phát triển. Tính đến tháng 7 năm nay, ít nhất 130 mô hình ngôn ngữ lớn đã được các hãng công nghệ và viện nghiên cứu Trung Quốc phát hành, khiến Lý Ngạn Hoành (người sáng lập kiêm Giám đốc điều hành Baidu) nói rằng nước này có quá nhiều mô hình AI nền tảng, gọi đó là “sự lãng phí tài nguyên rất lớn”.
“Tôi đã quan sát thấy một hiện tượng ở Trung Quốc, trong đó nhiều ngành công nghiệp, công ty và thậm chí cả thành phố đang mua phần cứng, dự trữ chip và xây dựng các trung tâm máy tính để đào tạo các mô hình ngôn ngữ lớn riêng từ đầu.
Bản thân mô hình ngôn ngữ lớn là nền tảng cơ bản giống như hệ điều hành, nhưng cuối cùng các nhà phát triển cần phải dựa vào một số lượng hạn chế các mô hình đó để phát triển ứng dụng gốc khác nhau. Do đó, việc liên tục phát triển lại các mô hình ngôn ngữ lớn mang tính nền tảng sẽ gây lãng phí rất lớn tài nguyên xã hội", Lý Ngạn Hoành nói.