Adobe đang trong giai đoạn đầu cho phép sử dụng các công cụ trí tuệ nhân tạo (AI) tạo sinh bên thứ ba như Sora của OpenAI bên trong phần mềm chỉnh sửa video nổi tiếng Premiere Pro.
Premiere Pro của Adobe được sử dụng rộng rãi trong ngành truyền hình và điện ảnh. Công ty có trụ sở ở thành phố San Jose (bang California, Mỹ) đang lên kế hoạch trong năm nay để bổ sung các tính năng dựa trên AI vào Premiere Pro, chẳng hạn khả năng lấp đầy các phần của cảnh bằng các vật thể do AI tạo hoặc loại bỏ những yếu tố không mong muốn khỏi cảnh mà không cần bất kỳ công việc thủ công tẻ nhạt nào từ biên tập viên video.
Cả hai tính năng này sẽ dựa trên Firefly, mô hình AI mà Adobe đã triển khai trong phần mềm Photoshop để chỉnh sửa ảnh tĩnh.
Giữa sự cạnh tranh từ OpenAI, Midjourney và các công ty khởi nghiệp khác, Adobe đã tìm cách tạo sự khác biệt bằng cách đào tạo mô hình Firefly bằng dữ liệu mà họ có toàn quyền sử dụng và cung cấp quyền miễn trừ cho người dùng chống lại các khiếu nại về bản quyền. Điều này đồng nghĩa là nếu người dùng sử dụng phần mềm của Adobe và bị kiện tụng về bản quyền, hãng sẽ chịu trách nhiệm pháp lý, giúp bảo vệ họ khỏi các vấn đề pháp lý liên quan đến vấn đề đó.
Hôm 15.4, Adobe thông báo đang phát triển một cách để cho phép người dùng khai thác các công cụ AI bên thứ ba từ OpenAI cũng như công ty khởi nghiệp Runway, Pika Labs để tạo và sử dụng video trong Premiere Pro. Động thái này có thể giúp Adobe (cổ phiếu giảm khoảng 20% trong năm nay) giải quyết mối lo ngại ở Phố Wall rằng các công cụ AI tạo hình ảnh và video bên thứ ba khiến hoạt động kinh doanh cốt lõi của họ gặp rủi ro.
OpenAI đã trình diễn Sora tạo ra các video chân thật dựa trên lời gợi ý bằng văn bản nhưng chưa công khai công nghệ này hoặc đưa ra mốc thời gian sẽ ra mắt nó. Đã phát hành bản demo về việc sử dụng Sora để tạo video trong Premiere Pro, Adobe mô tả bản này là một "thử nghiệm" và không đưa ra mốc thời gian khi nào nó sẽ có sẵn.
Deepa Subramaniam, Phó chủ tịch tiếp thị sản phẩm cho các ứng dụng sáng tạo chuyên nghiệp của Adobe, nói công ty vẫn chưa giải quyết cách chia doanh thu được tạo ra bởi các công cụ AI bên thứ ba được sử dụng trên nền tảng phần mềm của mình, giữa Adobe với các nhà phát triển bên ngoài.
Thế nhưng, Deepa Subramaniam nói người dùng Adobe sẽ được cảnh báo khi không sử dụng các mô hình AI "an toàn về mặt thương mại" của Adobe và tất cả các video do Premiere Pro sản xuất sẽ chỉ rõ công nghệ AI nào được dùng để tạo ra chúng.
Bà nói với Reuters: “Phương pháp tiếp cận đạo đức AI hàng đầu trong ngành của chúng tôi và chống định kiến của con người mà chúng tôi làm, không có điều nào trong số đó sẽ biến mất. Chúng tôi thực sự vui mừng được khám phá một thế giới nơi bạn có thể có nhiều sự lựa chọn hơn thông qua các mô hình AI của bên thứ ba”.
Cách đây vài ngày, trang Bloomberg đưa tin Adobe đã bắt đầu mua video để xây dựng công cụ AI chuyển ảnh thành video nhằm bắt kịp các đối thủ.
Theo Bloomberg, Adobe sẽ cung cấp 120 USD cho mạng lưới nhiếp ảnh gia và nghệ sĩ của công ty để họ gửi video hoạt động hàng ngày như đi bộ, thể hiện cảm xúc, gồm cả niềm vui và tức giận. Mục tiêu của Adobe là có nguồn dữ liệu chất lượng để đào tạo AI.
Trong năm qua, Adobe tập trung vào việc thêm các tính năng AI vào phần mềm dành cho các nhà sáng tạo chuyên nghiệp, gồm cả Photoshop và Illustrator. Công ty đã phát hành các công cụ AI tạo hình ảnh và hình minh họa dựa trên gợi ý bằng văn bản, được dùng hàng tỉ lần cho đến nay.
Tuy nhiên, việc OpenAI trình diễn Sora đã làm dấy lên nỗi sợ hãi của các nhà đầu tư rằng Adobe có thể gặp rủi ro bởi công nghệ mới chuyển văn bản thành video. Adobe cho biết đang phát triển công nghệ AI tạo video và sẽ thảo luận thêm về nó vào cuối năm nay.
Adobe đang cần hơn 100 video ngắn về các hành động và thể hiện cảm xúc của con người, cũng như bức ảnh giải phẫu đơn giản của bàn chân, bàn tay hoặc mắt. Công ty cũng muốn có video về người tương tác với các đồ vật như smartphone hoặc thiết bị tập thể dục. Nghệ sĩ không được cung cấp nội dung vi phạm bản quyền, khỏa thân hoặc "khiếm nhã".
Trung bình mỗi phút video, Adobe trả khoảng 2,62 USD, dù con số có thể lên tới 7,25 USD/phút.
Động thái của Adobe nhấn mạnh lượng dữ liệu khổng lồ cần để xây dựng các mô hình AI, làm nền tảng cho các sản phẩm sáng tạo nội dung phổ biến.
Đã có nhiều tranh luận và tranh cãi về nguồn dữ liệu đó.
Trong một video gây tranh cãi tháng trước, Mira Murati (Giám đốc Công nghệ OpenAI) nói không chắc liệu Sora có được đào tạo dựa trên các video của người dùng YouTube, Facebook hay Instagram hay không.
Adobe đã tìm cách tạo sự khác biệt cho các mô hình AI của mình bằng cách đào tạo chúng chủ yếu trên thư viện khổng lồ các phương tiện truyền thông có sẵn của họ dành cho dành cho những nhà tiếp thị và đại lý sáng tạo. Trong trường hợp thư viện thiếu nội dung, công ty mua hình ảnh trực tiếp từ những người đóng góp. Abobe cũng đề xuất trả tiền cho những người đóng góp để gửi một lượng lớn ảnh để đào tạo AI. Theo Bloomberg, họ nhận được từ 6 cent đến 16 cent cho mỗi hình ảnh.
Khi OpenAI, Google và các công ty khác chạy đua để phát triển AI mạnh mẽ hơn, họ đang tìm cách tìm nguồn càng nhiều nội dung càng tốt để đào tạo các mô hình AI của mình nhằm đạt được kết quả chất lượng tốt hơn.
Cộng đồng AI cho rằng OpenAI sử dụng số lượng lớn video YouTube để đào tạo các mô hình AI, gồm cả sản phẩm mới của họ là Sora. Nó gần như là một bí mật đã được công khai. Điều bí ẩn là làm thế nào OpenAI truy cập đủ nội dung YouTube để thực hiện công việc này.
YouTube thuộc Google cấm việc thu thập video của mình bằng bot và các phương pháp tự động khác, đồng thời cấm tải xuống vì mục đích thương mại.
YouTube cũng sẽ hạn chế các nỗ lực tải xuống video trên nền tảng của mình với số lượng lớn.
OpenAI cần lượng lớn văn bản, hình ảnh và video để đào tạo các mô hình AI của mình. Điều này có nghĩa là OpenAI, công ty khởi nghiệp Mỹ được Microsoft đầu tư hàng tỉ USD, nếu muốn vượt qua các giới hạn thì phải tải xuống khối lượng lớn video YouTube hoặc truy cập dữ liệu này theo cách nào đó.
Video YouTube được cung cấp miễn phí trực tuyến, nên việc tải xuống một lượng nhỏ nội dung này cho mục đích nghiên cứu có vẻ vô hại. Thế nhưng, khai thác hàng triệu video để xây dựng các mô hình AI mạnh mẽ có thể là việc hoàn toàn khác.
Trang Insider đã hỏi OpenAI liệu họ có tải xuống video YouTube trên quy mô lớn hay không và liệu công ty này có sử dụng nội dung này làm dữ liệu để đào tạo mô hình AI hay không. Insider cũng hỏi OpenAI về những hạn chế của YouTube về việc tải xuống video với số lượng lớn.
Người phát ngôn của OpenAI cho biết: “Chương trình đào tạo của Sora bao gồm tài liệu từ các nguồn được cấp phép cũng như nội dung có sẵn công khai trên internet”. Người này từ chối bình luận về các câu hỏi cụ thể từ Insider.
Tờ Wall Street Journal đưa tin OpenAI đã thảo luận về việc đào tạo mô hình ngôn ngữ lớn thế hệ tiếp theo, GPT-5, dựa trên các bản trích dẫn từ video công khai trên YouTube.
Trong bài phát biểu công khai đầu tiên về chủ đề trên, Neal Mohan cho biết ông không biết liệu OpenAI có thực sự sử dụng video YouTube để tinh chỉnh Sora hay không. Nếu có thì OpenAI sẽ “vi phạm rõ ràng” các điều khoản sử dụng của YouTube, Neal Mohan nói.
Neal Mohan cho biết Google tuân thủ các hợp đồng cá nhân của YouTube với người sáng tạo trước khi quyết định có sử dụng video từ nền tảng này để đào tạo mô hình AI mạnh mẽ Gemini hay không.
Ông nói: “Rất nhiều người sáng tạo có các loại hợp đồng cấp phép khác nhau về nội dung của họ trên nền tảng của chúng tôi. Dù một phần trong kho dữ liệu YouTube đó có thể đang được sử dụng để đào tạo các mô hình như Gemini, Google và YouTube đảm bảo rằng việc sử dụng video làm dữ liệu đào tạo cho AI là phù hợp với bất kỳ điều khoản dịch vụ hoặc hợp đồng nào mà người sáng tạo đã ký trước đó”.