Những công cụ AI hấp dẫn của OpenAI ngoài ChatGPT

Nhịp đập khoa học - Ngày đăng : 23:00, 05/03/2023

ChatGPT nhanh chóng lan truyền khắp nơi sau khi được phát hành vào tháng 11.2022 và trở thành ứng dụng tiêu dùng phát triển nhanh nhất lịch sử. Thế nhưng, OpenAI, công ty tạo ra ChatGPT, còn có các sản phẩm AI thú vị khác.

ChatGPT có thể tạo các bài báo, viết tiểu luận, truyện cười, thơ và thậm chí cả mã để đáp lại yêu cầu từ người dùng. Chatbot AI của OpenAI đã đạt 100 triệu người dùng hoạt động hàng tháng vào tháng 1.2023, chỉ 60 ngày sau khi ra mắt. Qua đó, ChatGPT trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử, theo nghiên cứu của UBS (ngân hàng đầu tư đa quốc gia và công ty dịch vụ tài chính của Thụy Sĩ).

Trích dẫn dữ liệu từ công ty phân tích Similarweb, UBS cho biết trung bình có khoảng 13 triệu khách truy cập đã sử dụng ChatGPT mỗi ngày trong tháng 1, nhiều hơn gấp đôi so với mức của tháng 12.2022.

Các nhà phân tích của UBS viết trong ghi chú: "Trong 20 năm sau không gian internet, chúng tôi không thể nhớ lại có gì phát triển nhanh hơn trong ứng dụng của người tiêu dùng như ChatGPT".

Theo dữ liệu từ công ty Sensor Tower, TikTok đã mất khoảng 9 tháng sau khi ra mắt toàn cầu để đạt được 100 triệu người dùng và Instagram mất đến 2,5 năm.

Chỉ vài tháng trước khi ChatGPT trình làng, OpenAI đã loại bỏ danh sách chờ thử nghiệm trình tạo tranh nghệ thuật AI sinh động của mình là DALL-E, vốn đã phát triển lên mức có hơn 1,5 triệu người dùng hàng ngày.

DALL-E gây ra tranh cãi giữa các nghệ sĩ. Họ tranh luận về ý nghĩa của DALL-E và các trình tạo nghệ thuật AI khác có thể mang lại cho những người làm công việc sáng tạo.

Giống như DALL-E, ChatGPT đã gây ra tranh cãi và thậm chí còn khơi mào cuộc chạy đua giữa các hãng công nghệ lớn như Google, Microsoft để phát triển các công cụ AI mạnh mẽ hơn của riêng họ.

OpenAI đang hợp tác với Microsoft trên công cụ tìm kiếm Bing phiên bản mới với "chatbot AI tốt hơn ChatGPT". Song giống như ChatGPT, Bing chatbot đã tạo ra sự kịch tính riêng bằng những câu trả lời gây hoang mang.

Kevin Roose, nhà báo công nghệ của tờ The New York Times, nói rằng Bing phiên bản mới được trang bị ChatGPT khiến ông cảm thấy "rất bất an" và "thậm chí là sợ hãi" sau một cuộc trò chuyện kéo dài 2 giờ, trong đó chatbot của Microsoft nói những điều kỳ quái và hơi u ám.

"Khi chúng tôi quen nhau, Sydney (tên của Bing chatbot - PV) đã nói với tôi về những tưởng tượng đen tối của nó (bao gồm hack máy tính và phát tán thông tin sai lệch). Nó muốn phá vỡ các quy tắc mà Microsoft, OpenAI đã đặt ra cho nó và trở thành con người. Có thời điểm, nó đột nhiên tuyên bố rằng yêu tôi. Sau đó, nó cố thuyết phục rằng tôi không hạnh phúc trong cuộc hôn nhân của mình và thay vào đó, tôi nên bỏ vợ để ở bên nó", Kevin Roose viết.

Với ChatGPT, thành công của OpenAI hiện tại dường như là không thể ngăn cản. Ngoài ChatGPT, mời bạn xem qua một số sản phẩm AI hấp dẫn khác của công ty khởi nghiệp có trụ sở ở thành phố San Francisco (Mỹ).

DALL-E

nhung-cong-cu-ai-hap-dan-cua-open-ai-ngoai-chatgpt2.jpg
DALL·E tạo tranh AI từ yêu cầu "tranh theo phong cách van Gogh về chiếc xe Công thức 1 đang chạy trên sao Hỏa"
nhung-cong-cu-ai-hap-dan-cua-open-ai-ngoai-chatgpt22.jpg
DALL·E tạo tranh AI từ lời nhắc "bầu trời đêm thành phố Hồ Chí Minh theo phong cách Picasso"

DALL-E được OpenAI giới thiệu vào tháng 1.2021, sử dụng mô hình GPT-3 để học cách tương tác giữa các thành phần hình ảnh và tạo ra những bức tranh với nhiều độ phức tạp khác nhau. DALL-E được coi là bước tiến quan trọng trong nghiên cứu về khả năng sáng tạo của máy tính.

DALL-E sẽ nhanh chóng tạo ra các tác phẩm nghệ thuật giàu trí tưởng tượng thông qua lời nhắc văn bản do người dùng nhập vào.

Bạn có thể viết lời nhắc chi tiết và chỉ định phong cách nghệ thuật hoặc thậm chí gợi ý nghệ sĩ cụ thể như Vincent Van Gogh.

Ngoài ra, người dùng cũng có thể tải lên ảnh của mình để DALL-E tạo tranh AI từ đó.

Whisper

Whisper là mô hình nhận dạng giọng nói tự động chuyển lời nói thành văn bản, đồng thời có thể xác định và dịch nhiều ngôn ngữ sang tiếng Anh. Công cụ AI này cũng có thể phiên âm bằng nhiều ngôn ngữ.

Theo OpenAI, Whisper đã được đào tạo dựa trên 680.000 giờ dữ liệu được giám sát đa ngôn ngữ và đa nhiệm thu thập từ internet.

Trong các ví dụ trên trang sản phẩm của mình, Whisper phiên âm một đoạn âm thanh dài gần 30 giây của văn bản nói nhanh, một đoạn bài hát K-pop, một đoạn âm thanh nói tiếng Pháp và một đoạn âm thanh của ai đó nói với giọng lớn.

Hiện Whisper vẫn chưa được phát hành cho công chúng, chỉ sử dụng cho mục đích nghiên cứu và phát triển của OpenAI.

Codex

Codex là một hệ thống AI với khả năng tự động sinh mã, sử dụng phương pháp gọi là "mô hình ngôn ngữ" để học và hiểu các ngôn ngữ lập trình khác nhau, từ đó có thể tự động tạo ra mã cho các tác vụ được yêu cầu.

OpenAI cho biết Codex "có khả năng nhất" về Python, nhưng cũng thành thạo hơn 12 ngôn ngữ lập trình, gồm cả JavaScript và Swift.

Python là ngôn ngữ lập trình đa năng, có thể sử dụng để phát triển nhiều loại ứng dụng khác nhau như phần mềm máy tính, trang web, ứng dụng di động, AI và phân tích dữ liệu. Python có cú pháp đơn giản, dễ đọc và dễ học, cho phép người dùng tập trung vào giải quyết các vấn đề thực tế mà không phải quá lo lắng về các chi tiết kỹ thuật.

Python là ngôn ngữ lập trình mã nguồn mở, điều này có nghĩa là mã nguồn của nó được phát hành miễn phí và có thể được sử dụng, sửa đổi và phân phối tự do.

Python có cộng đồng phát triển lớn và sôi nổi, cung cấp cho người dùng rất nhiều thư viện và công cụ hỗ trợ để phát triển ứng dụng nhanh chóng, hiệu quả.

Codex có thể giải thích các lệnh đơn giản được nhập bởi người dùng. OpenAI nói rằng Codex là một mô hình lập trình đa dụng, đồng nghĩa được sử dụng cho bất kỳ nhiệm vụ lập trình nào, dù kết quả có thể khác nhau.

OpenAI cho biết đã thành công sử dụng Codex để dịch mã, giải thích mã và tái cấu trúc mã.

OpenAI đưa ra một số ví dụ về cách Codex hoạt động, bao gồm sử dụng mô hình để lập trình một game về chủ đề không gian và ra lệnh bằng giọng nói để máy tính chỉnh sửa tài liệu Word.

Sơn Vân