Liệu bạn có còn đọc một câu chuyện tin tức nếu có trí tuệ nhân tạo (AI) xử lý tất cả thông tin trên web và đưa ra bản tóm tắt theo yêu cầu?
Đó là cơn ác mộng với các hãng tin khi Google và những công ty khác thử nghiệm generative AI, tạo ra nội dung dựa trên dữ liệu trong quá khứ.
Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Kể từ tháng 5, Google đã bắt đầu tung ra một phương thức tìm kiếm mới được hỗ trợ bởi generative AI, khi các nhà quan sát trong ngành đặt câu hỏi về tương lai của tập đoàn công nghệ lớn trong việc cung cấp thông tin cho người dùng sau sự gia tăng của chatbot trả lời câu hỏi như ChatGPT.
Sản phẩm này có tên Search Generative Experience (SGE), sử dụng AI để tạo bản tóm tắt phản hồi một số truy vấn tìm kiếm, khi hệ thống của Google xác định rằng định dạng này sẽ hữu ích. Những bản tóm tắt đó xuất hiện ở đầu trang chủ tìm kiếm của Google kèm liên kết để “tìm hiểu sâu hơn”.
Nếu các hãng tin muốn ngăn AI của Google sử dụng nội dung của họ để giúp tạo ra những bản tóm tắt đó, họ phải dùng cùng một công cụ có thể ngăn chúng xuất hiện trong kết quả tìm kiếm Google, khiến chúng hầu như trở nên gần như vô hình trên internet.
Google nói các thông tin tổng quan do AI tạo ra được tổng hợp từ nhiều trang web và các liên kết được thiết kế trở thành điểm xuất phát để tìm hiểu thêm. Google mô tả SGE như một thử nghiệm tùy chọn tham gia cho người dùng, nhằm giúp phát triển và cải thiện sản phẩm, đồng thời kết hợp phản hồi từ các hãng tin và những người khác.
Với các hãng tin, công cụ tìm kiếm mới của Google là tín hiệu báo động đỏ mới nhất trong mối quan hệ kéo dài hàng thập kỷ giữa hai bên. Trong đó, các hãng tin phải vật lộn để cạnh tranh với Google về quảng cáo trực tuyến và phụ thuộc vào gã khổng lồ công nghệ về lưu lượng tìm kiếm.
Sản phẩm SGE vẫn đang phát triển (hiện có mặt ở Mỹ, Ấn Độ và Nhật Bản) đã gây lo ngại cho các hãng tin khi họ cố gắng tìm ra vị trí của mình trong một thế giới, nơi AI có thể thống trị cách người dùng tìm kiếm và trả tiền cho thông tin. Bốn hãng tin lớn chia sẻ điều này cho Reuters với điều kiện giấu tên để tránh làm phức tạp các cuộc đàm phán đang diễn ra với Google.
Những lo ngại đó liên quan đến lưu lượng truy cập web, việc liệu các nhà xuất bản sẽ được công nhận như nguồn thông tin xuất hiện trong các bản tóm tắt SGE và tính chính xác của những bản tóm tắt đó. Đáng kể nhất, các hãng tin muốn được trả thù lao cho nội dung mà Google và các công ty AI khác sử dụng đào tạo các công cụ AI của họ – điểm mấu chốt xung quanh AI.
Người phát ngôn Google cho biết trong một tuyên bố: “Khi đưa generative AI vào tìm kiếm, chúng tôi sẽ tiếp tục ưu tiên các phương pháp tiếp cận mang lại lưu lượng truy cập có giá trị cho nhiều người sáng tạo, gồm cả các nhà xuất bản tin tức, để hỗ trợ một trang web mở, lành mạnh”.
Về phần đền bù, Google cho biết đang nỗ lực phát triển sự hiểu biết tốt hơn về mô hình kinh doanh của các ứng dụng generative AI và nhận ý kiến đóng góp từ các hãng tin cùng những người khác.
Cuối tháng 9, Google đã công bố một công cụ mới là Google-Extends, cung cấp cho các hãng tin tùy chọn chặn nội dung của họ bị gã khổng lồ công nghệ này sử dụng để đào tạo các mô hình AI.
Danielle Coffey, Chủ tịch và Giám đốc điều hành của News Media Alliance, một nhóm thương mại trong ngành đã vận động Quốc hội Mỹ về những vấn đề này, nói việc cung cấp cho các hãng tin tùy chọn từ chối thu thập thông tin để đào tạo AI là “cử chỉ thiện chí”.
“Câu hỏi là liệu có sự đền bù sau này và mức độ sẵn sàng của các bên tham gia để thiết lập quan hệ trao đổi giá trị có lợi là bao nhiêu”, Danielle Coffey nói.
Công cụ mới không cho phép hãng tin chặn thu thập nội dung của họ cho SGE, kể cả các bản tóm tắt hoặc liên kết xuất hiện cùng với chúng.
Các hãng tin muốn có nhiều lượt nhấp vào liên kết để tăng lượt truy cập, thu hút các nhà quảng cáo và việc xuất hiện trong kết quả tìm kiếm Google là rất quan trọng với hoạt động kinh doanh của họ. Theo giám đốc điều hành của một trong những hãng tin, thiết kế của SGE đã đẩy các liên kết xuất hiện trong tìm kiếm truyền thống Google xuống sâu hơn trên trang, có khả năng làm giảm lưu lượng truy cập các liên kết đó tới 40%.
Đáng báo động hơn là khả năng những người lướt web sẽ tránh nhấp vào bất kỳ liên kết nào nếu đoạn tóm tắt của SGE đã đáp ứng đủ nhu cầu thông tin cho họ. Ví dụ, người dùng hài lòng khi tìm hiểu thời điểm tốt nhất trong năm để đến Paris (thủ đô Pháp) mà không cần phải nhấp vào trang web của ấn phẩm du lịch.
Nhà phân tích cấp cao Nikhil Lai của hãng Forrester Research nói SGE “chắc chắn sẽ làm giảm lưu lượng truy cập không phải trả tiền của hãng tin và họ sẽ phải suy nghĩ về một cách khác để đo lường giá trị nội dung đó, nếu không phải là tỷ lệ nhấp chuột”. Dù vậy, ông tin rằng danh tiếng của các hãng tin sẽ vẫn mạnh mẽ do các liên kết của họ xuất hiện trên SGE.
Google cho biết thiết kế SGE để làm nổi bật nội dung web. Người phát ngôn công ty nói: “Bất kỳ ước tính nào về tác động lưu lượng truy cập cụ thể đều mang tính suy đoán và không mang tính đại diện, vì những gì bạn thấy ngày hôm nay trên SGE có thể trông khá khác so với những gì cuối cùng được ra mắt rộng rãi hơn trong Search”.
Trong khi các hãng tin và ngành khác đã dành hàng thập kỷ điều chỉnh trang web của họ để hiển thị nổi bật trên trang tìm kiếm truyền thống Google, họ không có đủ thông tin để làm điều tương tự cho các bản tóm tắt SGE mới.
Dù vậy, Google cho biết các hãng tin không cần phải làm bất cứ điều khác với những gì từng làm để xuất hiện trong Search.
Các hãng tin từ lâu đã cho phép Google thu thập nội dung của họ nhằm mục đích xuất hiện trong kết quả tìm kiếm, cụ thể là sử dụng bot hoặc phần mềm để tự động quét và lập chỉ mục nội dung đó. Thu thập dữ liệu là cách Google lập chỉ mục trang web để làm cho nội dung hiển thị trong tìm kiếm.
Mối lo ngại của các hãng tin với SGE tóm lại ở một điểm mấu chốt: Họ nói rằng Google đang thu thập miễn phí nội dung để tạo các bản tóm tắt mà người dùng có thể đọc thay vì nhấp vào liên kết của mình và và Google chưa đưa ra cách họ có thể ngăn chặn nội dung khỏi việc thu thập cho SGE.
Theo Reuters, một hãng tin cho biết công cụ tìm kiếm mới của Google “thậm chí còn đe dọa chúng tôi và việc kinh doanh của chúng tôi hơn cả một chương trình đang thu thập dữ liệu doanh nghiệp một cách bất hợp pháp”. Google không bình luận về nhận xét đó.
Theo dữ liệu độc quyền từ Originality.ai - trình phát hiện nội dung AI, khi được cung cấp tùy chọn, các trang web sẽ chặn nội dung của họ được sử dụng cho AI nếu làm như vậy không ảnh hưởng đến tìm kiếm. 27,4% hãng tin hàng đầu đang chặn bot của ChatGPT, gồm cả The New York Times và Washington Post, kể từ khi công cụ này ra mắt vào ngày 7.8. Con số này so với chỉ 6% đang chặn Google-Extends kể từ khi trình làng vào ngày 28.9.