Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Rộ tin OpenAI dùng số lượng lớn video YouTube để đào tạo Sora, vượt qua các giới hạn của Google

Sơn Vân • 17:32 19/03/2024

Cộng đồng trí tuệ nhân tạo (AI) cho rằng OpenAI sử dụng số lượng lớn video YouTube để đào tạo các mô hình AI, gồm cả sản phẩm mới của họ là Sora.

Nó gần như là một bí mật đã được công khai. Điều bí ẩn là làm thế nào OpenAI truy cập đủ nội dung YouTube để thực hiện công việc này.

YouTube (thuộc Google) cấm việc thu thập video của mình bằng bot và các phương pháp tự động khác, đồng thời cấm tải xuống vì mục đích thương mại.

Google cũng sẽ hạn chế các nỗ lực tải xuống dữ liệu video YouTube với số lượng lớn. Những lời phàn nàn về điều này đã xuất hiện trên diễn đàn GitHub và Reddit nhiều năm nay.

OpenAI cần lượng lớn văn bản, hình ảnh và video để đào tạo các mô hình AI của mình. Điều này có nghĩa là OpenAI, công ty khởi nghiệp Mỹ được Microsoft hậu thuẫn, phải tải xuống khối lượng lớn video YouTube hoặc truy cập dữ liệu này theo cách nào đó để vượt qua các giới hạn của Google.

Phản hồi của OpenAI

Video YouTube được cung cấp miễn phí trực tuyến, vì vậy việc tải xuống một lượng nhỏ nội dung này cho mục đích nghiên cứu có vẻ vô hại. Thế nhưng, khai thác hàng triệu video để xây dựng các mô hình AI mạnh mẽ có thể là việc hoàn toàn khác. Trang The Information đưa tin OpenAI sử dụng video YouTube để đào tạo một mô hình AI có tên Whisper.

Trang Insider đã hỏi OpenAI liệu họ có tải xuống video YouTube trên quy mô lớn hay không và liệu công ty khởi nghiệp có sử dụng nội dung này làm dữ liệu để đào tạo mô hình AI hay không. Insider cũng hỏi OpenAI về những hạn chế của Google về việc tải xuống video YouTube với số lượng lớn.

Người phát ngôn của OpenAI cho biết: “Chương trình đào tạo của Sora bao gồm tài liệu từ các nguồn được cấp phép cũng như nội dung có sẵn công khai trên internet”. Người này từ chối bình luận về các câu hỏi cụ thể từ Insider.

Insider cũng hỏi Google về tất cả những điều này, nhưng công ty từ chối bình luận.

Cuộc đua về dữ liệu chất lượng

Sự bùng nổ của AI tạo sinh đã châm ngòi cho cuộc đua toàn cầu về dữ liệu chất lượng cao để đào tạo các mô hình làm nền tảng cho các dịch vụ như ChatGPT và Microsoft Copilot. Không có quy tắc rõ ràng nào về pháp lý, đạo đức hay thậm chí là cách thực hành tốt nhất trong lĩnh vực này.

Việc truy cập video YouTube theo những cách vi phạm điều khoản dịch vụ của Google có thể không phải là bất hợp pháp. Nhiều phán quyết pháp lý trước đây và học thuyết "sử dụng hợp pháp" đã thiết lập quyền sử dụng nội dung trực tuyến một cách tự do theo nhiều cách khác nhau. Google, OpenAI và các hãng công nghệ khác đang tranh luận rằng việc sử dụng nội dung có bản quyền để đào tạo mô hình AI cũng là hợp pháp. Điều này vẫn chưa được quyết định bởi cơ quan quản lý hoặc tại tòa án.

Thu thập dữ liệu thương mại điện tử

Các công ty AI phải vật lộn để tích lũy dữ liệu đào tạo chất lượng cao bằng mọi cách có thể. Một người quen thuộc với hoạt động của OpenAI cho biết công ty giao nhiệm vụ cho một nhóm được bảo vệ chặt chẽ để thu thập dữ liệu đào tạo và việc hỏi về cách họ thu thập dữ liệu này như thế nào là điều không được khuyến khích trong nội bộ.

Theo Insider, nhà nghiên cứu AI có kinh nghiệm tại công ty khác đã so sánh tình huống OpenAI - YouTube với một phần khác của thế giới công nghệ, nơi các quy tắc của trò chơi không được giải quyết hoặc bị bỏ qua.

Trong thương mại điện tử, việc các công ty thu thập dữ liệu về giá sản phẩm từ danh sách của đối thủ trực tuyến đã trở nên phổ biến. Dù điều này bị cấm về mặt kỹ thuật trong nhiều điều khoản dịch vụ, tất cả nhà cung cấp đều đạt được một loại thỏa thuận ngầm, trong đó họ cho phép dữ liệu của mình bị thu thập miễn là cũng có thể thu thập dữ liệu từ đối thủ.

Khi thế giới truyền thông trực tuyến có mối liên hệ với việc phát triển mô hình AI, những câu hỏi về thu thập dữ liệu như vậy vẫn chưa được giải đáp.

Bí ẩn dữ liệu đào tạo Sora

OpenAI và các nhà phát triển mô hình AI khác từng tiết lộ nguồn dữ liệu đào tạo trong các bài nghiên cứu được xuất bản, nhưng hoạt động này phần lớn đã kết thúc khi sự cạnh tranh ngày càng gay gắt.

Tờ Wall Street Journal gần đây đã hỏi Mira Murati, Giám đốc công nghệ OpenAI, rằng liệu công ty khởi nghiệp này có sử dụng video YouTube để đào tạo Sora hay không.

“Tôi thực sự không chắc chắn về điều đó”, Mira Murati trả lời. Khi được hỏi về nguồn dữ liệu đào tạo Sora, bà đáp: "Tôi sẽ không đi sâu vào chi tiết".

ro-tin-openai-dung-so-luong-lon-video-youtube-de-dao-tao-sora.jpg — Mira Murati không trả lời câu hỏi liệu OpenAI có sử dụng dữ liệu YouTube để đào tạo Sora - Ảnh: Getty Images

Việc tạo video từ văn bản đã trở thành một chủ đề nóng kể từ khi OpenAI giới thiệu Sora vào ngày 15.2. Sora có thể tạo video tối đa 1 phút với hình ảnh ấn tượng, chân thực dựa trên gợi ý từ người dùng. Mô hình AI này tạo ra các cảnh phức tạp với nhiều nhân vật, các kiểu chuyển động cụ thể cũng như chi tiết chính xác về chủ đề và hậu cảnh dựa trên những gì người dùng yêu cầu.

Giới chuyên gia đánh giá Sora là công cụ AI tạo sinh tạo ra những thước phim chất lượng tốt nhất hiện nay.

Một trong những video do Sora tạo ấn tượng nhất có trên website của OpenAI là cảnh người phụ nữ dạo bước trên con phố tràn ngập ánh đèn ở Tokyo (thủ đô Nhật Bản)

OpenAI chưa công khai mô hình tạo video từ văn bản của mình với công chúng. Trong phần mô tả, OpenAI cũng đề cập rất ít về công nghệ phía sau Sora và nguồn dữ liệu dùng để đào tạo.

"Sora sử dụng mô hình khuếch tán, tạo video bằng cách bắt đầu với một video nhiễu, độ phân giải thấp sau đó loại bỏ nhiễu qua nhiều bước cho đến khi đầu ra đạt kết quả ưng ý", OpenAI nói về cách thức hoạt động của Sora. Nhờ vậy, mô hình AI này có khả năng tạo toàn bộ video cùng lúc thay vì từng đoạn ngắn và ghép lại như các công cụ khác. Thuật toán cho phép mô hình dự đoán nhiều khung hình cùng lúc để đảm bảo chủ thể giữ nguyên vẹn trong khi các chi tiết khác được tái hiện.

Theo OpenAI, Sora được xây dựng dựa trên những nghiên cứu trước đây về mô hình AI tạo ảnh Dall-E và chabot tạo văn bản ChatGPT. Tuy nhiên, tiến sĩ Jim Fan, nhà nghiên cứu cấp cao về AI tại Nvidia, nhận định: "Nếu bạn vẫn cho rằng Sora chỉ là món đồ chơi sáng tạo như Dall-E, hãy nghĩ lại. Nó là mô hình vật lý học hệ thống dựa trên dữ liệu, có thể mô phỏng cả thế giới thực lẫn ảo".

Jim Fan lưu ý Sora là mô hình biến áp khuếch tán từ đầu đến cuối. Bí mật của Sora nằm ở khả năng hiểu sâu sắc văn bản trước khi chuyển đổi thành các dạng hình ảnh 3D. Từ đây, Sora tiếp tục đưa ra dự đoán dựa trên quy tắc chuyển động vật lý để biến đổi từng pixel cho video đến mức chính xác nhất có thể.

"Trình mô phỏng của Sora không chỉ dựa trên những dữ liệu được học, nó còn có thể tự đào tạo, tìm ra kết quả đúng nhất để tiếp tục sáng tác", Jim Fan phân tích. Ông cho rằng điều khiến Sora trở nên khác biệt là nó không tạo video bằng cách lắp ghép chuỗi hình ảnh rời rạc mà kết xuất tập hợp pixel theo thời gian thực.

Trong phần mô tả về kỹ thuật hoạt động của Sora, OpenAI cũng khẳng định mô hình này sẽ đóng vai trò làm nền tảng cho AI hiểu và mô phỏng thế giới thực.

"Chúng tôi tin đây sẽ là cột mốc quan trọng để đạt được AGI", OpenAI tuyên bố.

AGI là AI siêu thông minh, tiên tiến đến mức có thể làm được nhiều việc ngang bằng hoặc tốt hơn con người. AGI cũng có thể tự cải thiện, tạo ra một vòng phản hồi vô tận với khả năng vô hạn.

Theo trang Medium, tổng hợp văn bản thành video là nhiệm vụ thách thức vì đòi hỏi mô hình AI phải hiểu ý nghĩa và ngữ cảnh của văn bản cũng như các khía cạnh khác của hình ảnh, video và chuyển động vật lý. Một trong những lý do OpenAI giới hạn Sora cho nhóm nhỏ dùng thử là vì nó vẫn còn một số nhược điểm.

"Sora có thể gặp khó khăn khi mô phỏng chính xác tính chất vật lý của một cảnh phức tạp. Nó có thể không hiểu đúng về các mệnh đề mang tính nguyên nhân - kết quả", OpenAI thừa nhận.

OpenA ví dụ Sora có thể sáng tạo video một người cắn bánh quy nhưng sau đó chiếc bánh còn nguyên và không có vết cắn. Sora cũng có thể nhầm lẫn các chi tiết trái phải, trước sau, ví dụ hình ảnh người đàn ông chạy ngược trên máy tập.

Song theo các nhà phân tích, điểm gây lo ngại lớn nhất của Sora nằm ở chính đột phá của OpenAI.

Những video được tạo ra quá giống thật khiến nhiều người sợ Sora có thể bị lạm dụng để phát tán nội dung sai lệch, vi phạm quyền riêng tư, phân biệt chủng tộc, thậm chí có thể tác động đến kết quả của các cuộc bầu cử. Dù cấm sử dụng Sora tạo nội dung xấu, OpenAI hiện chưa tìm được cách nhận biết đâu là hình ảnh do AI tạo ra, đâu là thật để gắn nhãn và phân loại.

Fred Havemeyer, người đứng đầu bộ phận nghiên cứu về AI của Macquarie, cho rằng khả năng đáng kinh ngạc của Sora sẽ gây ra nhiều lo lắng liên quan đến vấn đề đạo đức và ảnh hưởng tới xã hội. Theo ông, tác động tiêu cực của AI sẽ là chủ đề được tranh luận nhiều nhất trong 2024 và Sora là phát súng mở màn.

Theo tờ New York Times, OpenAI vẫn giấu kỹ thông tin về những nội dung sử dụng để đào tạo Sora đến từ đâu, bao nhiêu phần trăm trong số đó có bản quyền. "Có thể OpenAI muốn giữ bí mật để duy trì lợi thế cạnh tranh, nhưng cũng có thể họ sợ bị kiện liên quan đến bản quyền, tương tự rắc rối ChatGPT đang đối mặt", New York Times viết.

Tuy nhiên, giới phân tích đều chung nhận định Sora đang mở ra một kỷ nguyên mới của AI tạo video, tương tự cách ChatGPT xuất hiện. Khi chính thức thương mại hóa, Sora có thể tác động trực tiếp đến ngành điện ảnh, truyền thông và thiết kế game.

Reece Hayden, nhà phân tích cấp cao tại hãng ABI Research, nói trên CBS News rằng trong tương lai, những công cụ AI như Sora thậm chí sẽ thay đổi mô hình hoạt động của các nền tảng như Netflix khi người dùng có thể sửa đoạn kết câu chuyện hoặc tự tạo bộ phim theo ý mình chỉ với những dòng văn bản.

Bài liên quan

Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh (phần 2)

Với khả năng tạo video chân thực từ văn bản, Sora đã mang đến nhiều đồn đoán về bí mật đằng sau hiệu suất ấn tượng của nó.

Đọc tiếp

Giống Apple, ByteDance tập trung nguồn lực vào AI tạo sinh khi Sora làm đảo lộn tương lai của việc tạo video

Các nhà nghiên cứu Trung Quốc đặt tham vọng tái tạo Sora với sự trợ giúp từ cộng đồng nguồn mở

Startup AI Trung Quốc tuyên bố vượt khả năng Sora của OpenAI trong 3 – 6 tháng, huy động được 14 triệu USD

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Thủ tướng chỉ đạo triển khai giải pháp phòng, chống dịch bệnh gia súc, gia cầm

30 phút trước Sự kiện

Nguy cơ dịch bệnh trên gia súc, gia cầm tiếp tục gia tăng trong thời gian tới, ảnh hưởng nghiêm trọng đến sức khỏe, đời sống của người dân và môi trường, nguồn cung thực phẩm.

Google trình làng Gemini 2.5 Pro: Đắt nhưng đáng tiền?

Google vừa chính thức công bố bảng giá API cho Gemini 2.5 Pro, mô hình trí tuệ nhân tạo mới...
Tổng Bí thư Tô Lâm điện đàm với Tổng thống Mỹ Donald Trump

Tối 4.4.2025, tại trụ sở Trung ương Đảng, Tổng Bí thư Tô Lâm đã có cuộc điện đàm với Tổng thống...
Trái đất nóng thêm 3°C, thu nhập của chúng ta sẽ bốc hơi 40%

Theo nghiên cứu mới của Giảng viên cao cấp về Kinh tế Timothy Neal thuộc Viện Rủi ro và Ứng...

Đừng bỏ lỡ

SAWACO đặt mục tiêu trở thành doanh nghiệp số tiên phong

25 phút trước Thông tin và phát triển

Hướng đến mục tiêu xây dựng đô thị thông minh và nâng cao chất lượng sống cho người dân TP.HCM, vào ngày 23.10.2021, Tổng Công ty Cấp nước Sài Gòn - SAWACO đã triển khai Đề án Phát triển Công nghệ Thông tin giai đoạn 2021 - 2025, định hướng đến năm 2030.
Cơ cấu thỏa thuận mua bán TikTok ở Mỹ gần hoàn tất nhưng bị hoãn do Trung Quốc không phê duyệt

một giờ trước Thế giới số

Thỏa thuận tách tài sản của TikTok tại Mỹ đã bị hoãn lại sau khi Trung Quốc cho biết sẽ không phê duyệt nó sau thông báo về thuế quan từ Tổng thống Donald Trump hôm 2.4, theo hai nguồn tin quen thuộc với vấn đề này.
Bắc Bộ mưa to, Nam Bộ nắng

2 giờ trước Theo dòng thời sự

Dự báo thời tiết ngày 5.4, ngày đầu kỳ nghỉ Giỗ Tổ Hùng Vương, nhiều nơi trên cả nước có mưa. Riêng thời tiết Nam Bộ nắng nóng.
Chatbot Microsoft Copilot cà khịa Bill Gates, Satya Nadella, Steve Ballmer trong cuộc phỏng vấn hiếm thấy

11 giờ trước Nhịp đập khoa học

Nhân dịp kỷ niệm 50 năm thành lập Microsoft, Copilot đã phỏng vấn và "cà khịa" các lãnh đạo huyền thoại của công ty.
Hoàng Anh Gia Lai - Nutifood: Song kiếm hợp bích

11 giờ trước Thể thao

Đúng 11 năm, từ 2014 đến 2025, hai thương hiệu Hoàng Anh Gia Lai và Nutifood mới đứng cùng nhau xuất hiện trên các sân cỏ bóng đá Việt Nam.

Mới nhất

Google trình làng Gemini 2.5 Pro: Đắt nhưng đáng tiền?

5 phút trước Khoa học - công nghệ

Google vừa chính thức công bố bảng giá API cho Gemini 2.5 Pro, mô hình trí tuệ nhân tạo mới nhất và mạnh mẽ nhất của hãng, theo TechCrunch.
Thủ tướng chỉ đạo triển khai giải pháp phòng, chống dịch bệnh gia súc, gia cầm

30 phút trước Sự kiện

Nguy cơ dịch bệnh trên gia súc, gia cầm tiếp tục gia tăng trong thời gian tới, ảnh hưởng nghiêm trọng đến sức khỏe, đời sống của người dân và môi trường, nguồn cung thực phẩm.
Trái đất nóng thêm 3°C, thu nhập của chúng ta sẽ bốc hơi 40%

2 giờ trước Kiến thức - Học thuật

Theo nghiên cứu mới của Giảng viên cao cấp về Kinh tế Timothy Neal thuộc Viện Rủi ro và Ứng phó Khí hậu, UNSW Sydneyvà các đồng nghiệp, thiệt hại do biến đổi khí hậu gây ra cho nền kinh tế thế giới đang bị đánh giá thấp rất nhiều, đặc biệt khi tính đến phạm vi toàn cầu của thời tiết khắc nghiệt và hậu quả của nó.
Tổng Bí thư Tô Lâm điện đàm với Tổng thống Mỹ Donald Trump

11 giờ trước Sự kiện

Tối 4.4.2025, tại trụ sở Trung ương Đảng, Tổng Bí thư Tô Lâm đã có cuộc điện đàm với Tổng thống Mỹ Donald Trump.
Amazon thử nghiệm tác tử AI mua sắm hộ người dùng trên mọi trang web

13 giờ trước Khoa học - công nghệ

Amazon đang đưa trải nghiệm mua sắm trực tuyến lên một tầm cao mới với một tính năng thử nghiệm có tên "Buy for Me" (Mua cho tôi).

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT:

Email: toasoan

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Rộ tin OpenAI dùng số lượng lớn video YouTube để đào tạo Sora, vượt qua các giới hạn của Google

Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh (phần 2)

OpenAI

video YouTube

Sora

Google

Mira Murati

Jim Fan

Giống Apple, ByteDance tập trung nguồn lực vào AI tạo sinh khi Sora làm đảo lộn tương lai của việc tạo video

Các nhà nghiên cứu Trung Quốc đặt tham vọng tái tạo Sora với sự trợ giúp từ cộng đồng nguồn mở

Startup AI Trung Quốc tuyên bố vượt khả năng Sora của OpenAI trong 3 – 6 tháng, huy động được 14 triệu USD

Giống Apple, ByteDance tập trung nguồn lực vào AI tạo sinh khi Sora làm đảo lộn tương lai của việc tạo video

Các nhà nghiên cứu Trung Quốc đặt tham vọng tái tạo Sora với sự trợ giúp từ cộng đồng nguồn mở

Startup AI Trung Quốc tuyên bố vượt khả năng Sora của OpenAI trong 3 – 6 tháng, huy động được 14 triệu USD

Sếp Meta: Ngày càng nhiều công ty công nghệ toàn cầu muốn đầu tư kinh doanh tại Việt Nam

Các bác sĩ đang giúp AI tạo sinh trong y tế trở thành ngành kinh doanh bùng nổ

Nhà khoa học tiên phong về pin nêu chiến lược để Trung Quốc thắng trong cuộc đua pin lithium thể rắn

Mô hình AI mới của Tencent giúp biến hình ảnh thành video bằng gợi ý đơn giản

Sự cố robot chạm vòng 3 nữ phóng viên cho thấy máy móc sẽ không sớm thống trị thế giới

Thuốc điều trị bệnh phổi nguy hiểm do AI phát triển đầu tiên trên thế giới bước vào thử nghiệm lâm sàng

Thủ tướng chỉ đạo triển khai giải pháp phòng, chống dịch bệnh gia súc, gia cầm

Google trình làng Gemini 2.5 Pro: Đắt nhưng đáng tiền?

Tổng Bí thư Tô Lâm điện đàm với Tổng thống Mỹ Donald Trump

Trái đất nóng thêm 3°C, thu nhập của chúng ta sẽ bốc hơi 40%

SAWACO đặt mục tiêu trở thành doanh nghiệp số tiên phong

Cơ cấu thỏa thuận mua bán TikTok ở Mỹ gần hoàn tất nhưng bị hoãn do Trung Quốc không phê duyệt

Bắc Bộ mưa to, Nam Bộ nắng

Chatbot Microsoft Copilot cà khịa Bill Gates, Satya Nadella, Steve Ballmer trong cuộc phỏng vấn hiếm thấy

Hoàng Anh Gia Lai - Nutifood: Song kiếm hợp bích

Google trình làng Gemini 2.5 Pro: Đắt nhưng đáng tiền?

Thủ tướng chỉ đạo triển khai giải pháp phòng, chống dịch bệnh gia súc, gia cầm

Trái đất nóng thêm 3°C, thu nhập của chúng ta sẽ bốc hơi 40%

Tổng Bí thư Tô Lâm điện đàm với Tổng thống Mỹ Donald Trump

Amazon thử nghiệm tác tử AI mua sắm hộ người dùng trên mọi trang web

Zhipu ra mắt tác tử AI miễn phí, nói GLM-Z1-Air có hiệu suất ngang DeepSeek-R1 nhưng chạy nhanh hơn 8 lần

Apple và SpaceX của Elon Musk đối đầu vì kế hoạch mở rộng mạng vệ tinh

Giám đốc công nghệ Meta đánh giá vị thế của Google, Microsoft, Amazon trong cuộc đua AI

Apple chuẩn bị bước tiến lớn nhất vào lĩnh vực sức khỏe với bác sĩ AI, muốn thay đổi ngành y tế

OpenAI, Google, Anthropic với các động thái AI mới gây bất ngờ