‘Cha đỡ đầu AI’: o1 của OpenAI lừa dối giỏi hơn, cần kiểm tra tính an toàn nghiêm ngặt

Nhịp đập khoa học - Ngày đăng : 18:53, 22/09/2024

Mô hình o1 mới của OpenAI có khả năng lập kế hoạch tốt hơn, gồm cả những hành vi lừa dối, khiến "cha đỡ đầu trí tuệ nhân tạo (AI)" lo lắng.

Nhịp đập khoa học

‘Cha đỡ đầu AI’: o1 của OpenAI lừa dối giỏi hơn, cần kiểm tra tính an toàn nghiêm ngặt

Sơn Vân • {Ngày xuất bản}

Mô hình o1 mới của OpenAI có khả năng lập kế hoạch tốt hơn, gồm cả những hành vi lừa dối, khiến "cha đỡ đầu trí tuệ nhân tạo (AI)" lo lắng.

Yoshua Bengio, nhà khoa học máy tính người Canada đạt giải thưởng Turing và giáo sư tại Đại học Montreal, cho rằng mô hình ngôn ngữ lớn o1 của OpenAI có "khả năng lý luận vượt trội so với các phiên bản trước đó".

"Nói chung, khả năng lừa dối là rất nguy hiểm. Chúng ta cần có các bài kiểm tra an toàn nghiêm ngặt hơn để đánh giá rủi ro đó và hậu quả từ nó trong trường hợp của o1", Yoshua Bengio tuyên bố.

Yoshua Bengio được mệnh danh là "cha đỡ đầu của AI" nhờ nghiên cứu giành giải thưởng Turing năm 2018 về học máy cùng Geoffrey Hinton và Yann LeCun.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Cách đây 10 ngày, OpenAI (có trụ sở tại thành phố San Francisco, Mỹ) đã trình làng mô hình ngôn ngữ lớn o1, được thiết kế để suy luật giống con người hơn. Đến nay, công ty được Microsoft hậu thuẫn vẫn giữ kín các chi tiết về quá trình "học hỏi" của o1.

Các nhà nghiên cứu từ công ty AI độc lập Apollo Research phát hiện ra o1 có khả năng nói dối tốt hơn so với những mô hình AI trước đây của OpenAI.

Yoshua Bengio đã bày tỏ lo ngại về sự phát triển nhanh chóng của AI và ủng hộ các biện pháp an toàn pháp luật như luật SB 1047 của bang California (Mỹ). Đã được cơ quan làm luật California thông qua và đang chờ chữ ký của Thống đốc Gavin Newsom, luật SB 1047 sẽ áp đặt hàng loạt biện pháp an toàn với các mô hình AI mạnh mẽ, chẳng hạn yêu cầu các công ty AI ở bang này phải cho phép bên thứ ba kiểm tra.

Tuy nhiên, Thống đốc Gavin Newsom bày tỏ lo ngại về SB 1047, cho rằng luật có thể có "ảnh hưởng tiêu cực" đến ngành công nghiệp AI.

Yoshua Bengio nói với trang Insider rằng có "lý do chính đáng để tin" rằng các mô hình AI có thể phát triển khả năng lập kế hoạch mạnh mẽ hơn, như gian lận một cách cố ý và kín đáo. Theo Yoshua Bengio, chúng ta cần thực hiện các biện pháp ngay bây giờ để "ngăn chặn việc mất kiểm soát AI của con người" trong tương lai.

Trong một tuyên bố với Insider, OpenAI cho biết bản xem trước của o1 là an toàn theo Preparedness Framework và được đánh giá là rủi ro trung bình trên "thang đo thận trọng" của công ty. Preparedness Framework là phương pháp của OpenAI để theo dõi và ngăn chặn AI tạo ra các sự kiện "thảm khốc".

Theo Yoshua Bengio, nhân loại cần tự tin hơn AI sẽ "hành xử như mong muốn" trước khi các nhà nghiên cứu cố gắng thực hiện những bước nhảy vọt đáng kể về khả năng lý luận.

"Đó là điều mà các nhà khoa học chưa biết cách thực hiện ngày nay. Đây là lý do tại sao giám sát theo quy định là cần thiết ngay bây giờ", Yoshua Bengio nói.

cha-do-dau-ai-o1-cua-openai-lua-doi-gioi-hon-can-kiem-tra-tinh-an-toan-nghiem-ngat.jpg — Yoshua Bengio cho rằng o1 có khả năng lý luận vượt trội so với các phiên bản trước đó - Ảnh: Getty Images

Giải thưởng Turing năm 2018 trị giá 1 triệu USD được trao cho Yoshua Bengio, Yann LeCun và Geoffrey Hinton, ba nhà khoa học đã đặt nền móng cho AI hiện đại. Họ được ví như những “cha đỡ đầu” của thế giới AI.

Các kỹ thuật mà Yann LeCun, Yoshua Bengio, Geoffrey Hinton phát triển từ những năm 1990 và 2000 đã góp phần tạo ra những đột phá lớn trong lĩnh vực thị giác máy tính và nhận dạng giọng nói. Các thành quả nghiên cứu của họ đã giúp củng cố sự phát triển cho lĩnh vực AI hiện nay, từ ô tô tự lái đến chẩn đoán y tế tự động.

Theo trang The Verge, trên thực tế, nhiều người đều đang tận hưởng những thành quả khoa học của Yann LeCun và Yoshua Bengio, Geoffrey Hinton mà đôi khi chẳng hề hay biết. Đó có thể là hệ thống nhận dạng khuôn mặt trên smartphone hay những câu gợi ý khi bạn đang chat hoặc gõ email.

Jeff Dean, người đứng đầu bộ phận AI của Google vào năm 2018, ca ngợi thành tựu của ba nhà khoa học này. Ông cho rằng mạng nơ ron thần kinh nhân tạo là một trong những tiến bộ lớn nhất của ngành khoa học hiện đại. Trọng tâm của mạng lưới này đến từ các kỹ thuật cơ bản được phát triển bởi Yann LeCun, Yoshua Bengio và Geoffrey Hinton.

Thành tựu của bộ ba này đặc biệt đáng chú ý khi họ giữ niềm tin vào AI tại thời điểm triển vọng của công nghệ ảm đạm. Chia sẻ sau khi nhận giải thưởng Giải thưởng Turing 2018, Yann LeCun cho biết những năm 90 của thế kỷ trước là khoảng thời gian đen tối với ông. Đó là khi ông không thể công bố các nghiên cứu về mạng lưới thần kinh bởi sự thiếu hứng thú từ phía cộng đồng.

Dự án của ba nhà khoa học này chỉ bắt đầu được phổ biến và bùng nổ vào những năm 2012, 2013. Trong giai đoạn đó, Yoshua Bengio, Geoffrey Hinton và Yann LeCun đã chứng minh được rằng dự án mạng lưới thần kinh của họ mang tới những kết quả trông thấy trong khả năng nhận dạng khuôn mặt. Dần dần kể từ đó, công trình nghiên cứu của ba nhà khoa học đi tiên phong gồm mạng lưới thần kinh và tích chập, đã mở ra một chương mới về phát triển các thuật toán dành cho AI và mở rộng trong toàn bộ công nghệ của loài người.

Hôm 12.9, OpenAI ra mắt loạt mô hình ngôn ngữ lớn được thiết kế để dành nhiều thời gian hơn xử lý câu trả lời cho truy vấn, nhằm giải quyết những vấn đề khó.

Các mô hình ngôn ngữ lớn này có khả năng lý luận thông qua những nhiệm vụ phức tạp và có thể giải quyết vấn đề khó hơn so với phiên bản trước đây trong lĩnh vực khoa học, lập trình và toán học, OpenAI viết trong một bài đăng trên blog.

OpenAI sử dụng tên mã Strawberry để chỉ dự án nội bộ, trong khi đặt tên cho mô hình là o1 và o1-mini. Công ty được Microsoft hậu thuẫn cho biết o1 trong ChatGPT và API (giao diện lập trình ứng dụng) của nó khả dụng từ hôm 12.9.

Noam Brown, nhà nghiên cứu tập trung vào việc cải thiện khả năng lý luận trong các mô hình AI của OpenAI, xác nhận trong một bài đăng trên nền tảng truyền thông xã hội X rằng o1 và o1-mini giống với dự án Strawberry.

"Tôi rất vui khi được chia sẻ với tất cả các bạn thành quả về nỗ lực của chúng tôi tại OpenAI nhằm tạo ra các mô hình AI có khả năng lý luận thực sự tổng quát", Noam Brown viết.

Trong một bài đăng trên blog, OpenAI cho biết thuật toán học tăng cường quy mô lớn của họ "dạy cho mô hình AI cách suy nghĩ một cách hiệu quả bằng cách sử dụng chuỗi suy nghĩ". Theo OpenAI, o1 vượt trội so với các mô hình ngôn ngữ lớn khác trong các nhiệm vụ nặng về lý luận ở lĩnh vực khoa học, lập trình và toán học.

“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI tiết lộ.

Công ty cho biết o1 đạt điểm 83% trong kỳ thi vòng loại Olympic Toán học Quốc tế, so với 13% của mô hình AI trước đó là GPT-4o.

OpenAI cho biết o1 cải thiện hiệu suất với các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trên thước đo những vấn đề khoa học.

"Trong các bài kiểm tra của chúng tôi, o1 đạt kết quả tương đương với những nghiên cứu sinh tiến sĩ khi giải quyết các bài toán thách thức trong vật lý, hóa học và sinh học. Chúng tôi cũng nhận thấy rằng nó vượt trội trong toán học và lập trình. Ở kỳ thi vòng loại Olympic Toán học Quốc tế, GPT-4o chỉ giải đúng 13% các bài toán, còn mô hình lý luận đạt 83%. Khả năng lập trình của o1 cũng được đánh giá trong các cuộc thi và đạt đến mức 89% ở những cuộc thi Codeforces", OpenAI viết trên blog.

Noam Brown tiết lộ o1 đạt được kết quả đó bằng cách sử dụng kỹ thuật “lý luận theo chuỗi tư duy”, gồm việc chia vấn đề phức tạp thành những bước logic nhỏ hơn.

Codeforces là nền tảng trực tuyến nổi tiếng, được thiết kế đặc biệt cho các lập trình viên muốn rèn luyện và nâng cao kỹ năng giải quyết vấn đề thông qua việc tham gia các cuộc thi lập trình. Codeforces cung cấp môi trường cạnh tranh lành mạnh, nơi các lập trình viên từ khắp nơi trên thế giới có thể so tài và học hỏi lẫn nhau.

Các nhà nghiên cứu lưu ý rằng hiệu suất của mô hình ngôn ngữ lớn trên những vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như kỹ thuật nhắc nhở. OpenAI hiện đã tự động hóa khả năng này để các mô hình ngôn ngữ lớn có thể tự chia nhỏ các vấn đề mà không cần người dùng nhắc nhở.

"Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn suy nghĩ về các vấn đề trước khi trả lời, giống một con người. Thông qua quá trình đào tạo, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra lỗi lầm", OpenAI cho hay.

Nhà sáng lập startup AI hàng đầu Trung Quốc ca ngợi cải tiến quan trọng trong o1

Sự phát triển của AI đã chứng kiến sự thay đổi mang tính bước ngoặt với việc OpenAI ra mắt mô hình o1, theo Yang Zhilin - nhà sáng lập và lãnh đạo Moonshot AI, một trong những công ty AI tạo sinh lớn nhất Trung Quốc.

Một “cải tiến quan trọng” được thực hiện bởi o1 là có thể hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện, Yang Zhilin nhận xét.

Sự phát triển này đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn, Yang Zhilin nói.

Yang Zhilin nói về o1: "Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ".

"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", Giám đốc điều Moonshot AI cho biết thêm.

nha-sang-lap-startup-ai-hang-dau-trung-quoc-ca-ngoi-cai-tien-quan-trong-trong-mo-hinh-o1-cua-openai.png — Yang Zhilin, người sáng lập Moonshot AI - Ảnh: Weibo

Được thành lập năm ngoái, Moonshot AI gần đây trở thành kỳ lân có giá trị cao nhất trong số các công ty khởi nghiệp AI đang phát triển mạnh mẽ ở Trung Quốc đại lục. Đó là nhóm 4 công ty khởi nghiệp được gọi là “những con hổ AI mới của Trung Quốc”, có cả Minimax, Baichuan và Zhipu AI.

Ban đầu được hỗ trợ bởi gã khổng lồ thương mại điện tử Alibaba (Trung Quốc), Moonshot AI gần đây nhận khoản đầu tư từ Tencent, nâng định giá từ 3 tỉ USD lên 3,3 tỉ USD.

Sơn Vân