Gọi 2023 là năm của trí tuệ nhân tạo (AI) có lẽ là cách nói tương đối nhẹ nhàng.
Từ OpenAI, Nvidia, Microsoft đến, Google, Thung lũng Silicon đầy ắp generative AI (AI tạo sinh). Trong bất kỳ cuộc họp báo cáo kết quả kinh doanh quý nào, bạn cũng nghe thấy các giám đốc điều hành như Andy Jassy (Amazon), Mark Zuckerberg (Meta Platforms), Pat Gelsinger (Intel) hay Lisa Su (AMD) nói về khả năng AI của công ty mình. Thậm chí cả Wendy's cũng tham gia , thêm một trợ lý generative AI vào dịch vụ lái ô tô tự động hồi tháng 5 như một phần của chương trình thử nghiệm. Chuỗi thức ăn nhanh này sẽ mở rộng dịch vụ generative AI đến nhiều địa điểm hơn vào năm 2024.
AI có thể là câu chuyện quan trọng nhất năm 2023, nhưng nó thực sự bắt đầu nổi lên vào tháng 11.2022 khi OpenAI phát hành ChatGPT. Chatbot AI này nhanh chóng trở thành ứng dụng phát triển nhanh nhất trong lịch sử tính đến thời điểm đó, đạt 100 triệu người dùng hàng tháng chỉ sau 60 ngày trình làng.
Bên dưới là một số điểm nổi bật từ câu chuyện lớn nhất năm 2023: Sự bùng nổ generative AI.
Tháng 1 và tháng 2:
Sau thành công của ChatGPT, hồi tháng 1, Microsoft đã thông báo sẽ đầu tư hàng tỉ USD vào OpenAI trong vài năm. Đến tháng 2, sau những tin đồn xoay quanh việc Microsoft chuẩn bị ra mắt chatbot AI của riêng mình với ChatGPT làm nền tảng, Google đã trình làng chatbot Bard. Tuy nhiên, buổi ra mắt thiếu chi tiết cụ thể và Bard trả lời sai một câu hỏi khiến vốn hóa thị trường Alphabet (công ty mẹ Google) giảm hơn 100 tỉ USD.
Vài ngày sau, Microsoft tung ra chatbot Bing và trình duyệt Edge phiên bản mới. Cả Giám đốc điều hành Microsoft - Satya Nadella và Giám đốc điều hành OpenAI - Sam Altman đều lên sân khấu, giải thích về mối quan hệ đối tác và cách hai công ty sẽ đưa generative AI đến với khách hàng của Microsoft.
Tháng 3:
Google nhảy vào cuộc chơi, mở quyền truy cập Bard cho một số lượng người dùng hạn chế. Động thái này được coi là cách để Google chạy theo Microsoft, một trong những đối thủ lớn nhất trong lĩnh vực công nghệ.
Không chịu thua kém, cũng trong tháng 3, Mark Zuckerberg tuyên bố AI là khoản đầu tư lớn nhất của Meta Platforms.
Tháng 4:
Google tuyên bố hợp nhất nhóm AI Brain từ Google Research và DeepMind để thành lập tổ chức mới theo hướng ưu tiên AI. Cùng tháng đó, Amazon công bố nền tảng Bedrock, cung cấp cho khách hàng doanh nghiệp quyền truy cập các mô hình nền tảng generative AI, cùng các mô hình Titan của riêng mình.
Tháng 5:
Google tiếp tục tung ra nhiều tin tức, mở Bard cho công chúng nhiều nước hơn. Công ty cũng ra mắt Search Generative Experience, một phiên bản Google Search hỗ trợ generative AI, trong hội nghị nhà phát triển I/O của mình.
Microsoft sau đó đáp trả bằng cách tiết lộ đang đưa Windows Copilot tích hợp AI lên Windows 11.
Vào tháng 5, vốn hóa thị trường của Nvidia lần đầu tiên vượt mốc 1.000 tỉ USD, củng cố vị thế là hãng chip AI lớn nhất và có giá trị nhất thế giới.
Tháng 7:
Khi AI tiếp tục gây chú ý, chính quyền Biden thông báo đã đạt được các thỏa thuận với Amazon, Anthropic, Google, Inflection, Meta Platforms, Microsoft, OpenAI để tuân thủ các quy tắc tự nguyện liên quan đến an toàn và phát triển AI.
Cũng trong tháng 7, Microsoft thông báo sẽ tính phí 30 USD mỗi tháng cho mỗi người dùng 365 Copilot, bổ sung các khả năng generative AI cho bộ ứng dụng năng suất của công ty.
Tháng 8:
Google đã phản hồi Microsoft khi cho biết sẽ yêu cầu 30 USD/tháng cho mỗi người dùng để truy cập dịch vụ generative AI năng suất của riêng mình: Duet AI for Workspace.
Tháng 9:
Mong muốn tiến sâu hơn vào lĩnh vực generative AI, Amazon tuyên bố đang đầu tư 4 tỉ USD vào Anthropic, đối thủ của OpenAI.
Meta Platforms tiết lộ tung ra các gói sticker AI trên các ứng dụng của mình và một trợ lý AI mới cho WhatsApp, Messenger, Instagram. Công ty còn ra mắt các nhân vật AI với sự tham gia của người nổi tiếng như Tom Brady, Kendall Jenner...
Cũng trong tháng 9, với những lo ngại gia tăng về việc AI bị sử dụng theo cách tiêu cực và không có dấu hiệu nào cho thấy Quốc hội sẽ hành động, chính quyền Biden đã ký một lệnh hành pháp nhằm giải quyết các vấn đề tiềm tàng về an ninh mạng, phân biệt đối xử và tăng trưởng liên quan đến AI.
Tháng 11:
OpenAI đã tổ chức sự kiện dành cho nhà phát triển đầu tiên vào tháng 11, công bố GPT-4 Turbo (phiên bản mạnh mẽ và rẻ hơn GPT-4) cùng cửa hàng ứng dụng cho ChatGPT mang tên GPT Store. Đó là nơi khách hàng có thể mua các phiên bản tùy chỉnh phần mềm AI của công ty.
Các cải tiến của GPT-4 Turbo bao gồm bộ nhớ lớn hơn để ghi nhớ tới 300 trang văn bản chỉ trong một lời nhắc, giá rẻ hơn cho nhà phát triển và ngày được đào tạo kiến thức đến tháng 4.2023, theo Sam Altman.
GPT-4 Turbo gồm hai phiên bản, một phiên bản phân tích văn bản chặt chẽ và phiên bản còn lại có tìm hiểu về bối cảnh của văn bản, hình ảnh.
OpenAI cho biết đã tối ưu hóa hiệu suất để có thể cung cấp GPT-4 Turbo với mức giá cho chuỗi ký tự đầu vào và đầu ra lần lượt chỉ bằng 1/3 và 1/2 so với giá GPT-4.
Nếu như GPT-4 được cập nhật dữ liệu lấy từ các trang web đến tháng 9.2021 thì GPT-4 Turbo lấy dữ liệu cập nhật tới tháng 4.2023. GPT-4 Turbo có thể đưa ra câu trả lời với độ dài tương đương hơn 300 trang văn bản trong một lần nhận yêu cầu.
Sau đó, mọi chuyện trở nên tồi tệ tại OpenAI. Hội đồng quản trị cũ đã sa thải Giám đốc điều hành Sam Altman một cách bất ngờ. Microsoft nhảy vào cuộc và đề nghị cho Sam Altman một công việc, hàng trăm nhân viên OpenAI dọa từ chức và OpenAI cuối cùng phải mang ông về cùng với một số thành viên hội đồng quản trị mới, gồm cả vai trò "quan sát viên" không có quyền bỏ phiếu cho Microsoft.
Trong khi đó, Amazon đã công bố chatbot Q của riêng mình để cạnh tranh tốt hơn với Microsoft và Google.
Tháng 12:
Google đã công bố Gemini, đối thủ đáng gờm với GPT-4, mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT.
Có ba phiên bản khác nhau về kích thước, khả năng gồm Ultra, Pro và Nano, Gemini là hệ thống trí AI đa phương thức, không chỉ xử lý văn bản mà còn cả mã, âm thanh, hình ảnh và video để phản hồi truy vấn từ người dùng.
Gemini cũng tích hợp trực tiếp vào các thiết bị di động, là lần đầu tiên cho một mô hình AI và điểm thú vị cho những người tạo ứng dụng. Google tự hào rằng Gemini cũng là mô hình AI "linh hoạt nhất" của họ, có khả năng chạy trên nhiều nguồn từ trung tâm dữ liệu đến smartphone.
Mô hình tiên tiến nhất Gemini Ultra không xuất hiện cho đến đầu năm 2024, được thiết kế cho "các tác vụ cực kỳ phức tạp", vượt trội GPT-4 trong một số lĩnh vực, từ kiến thức về môn học như Lịch sử và Luật, đến việc tạo ra mã Python và các tác vụ đòi hỏi suy luận nhiều bước, Google tuyên bố.
Google cho biết Gemini đã vượt trội so với GPT-4 trong bài kiểm tra Massive Multitask Language Understanding (MMLU, hiểu ngôn ngữ đa nhiệm lớn), một trong những phương pháp phổ biến nhất để đánh giá kiến thức và kỹ năng giải quyết vấn đề của các mô hình AI.
Trên podcast công nghệ Hard Fork của tờ The New York Times, nhà báo Kevin Roose đã so sánh bài kiểm tra MMLU như "SAT dành cho các mô hình AI". Tuy nhiên, MMLU phức tạp hơn một bài kiểm tra chuẩn bị đại học thông thường. Theo thông báo của Google, bài kiểm tra này gồm 57 môn học, trong đó có Toán, Vật lý, Lịch sử, Luật, Y học và Đạo đức, để đánh giá cả kiến thức thế giới và khả năng giải quyết vấn đề.
SAT là bài kiểm tra đánh giá năng lực chuẩn hóa được sử dụng rộng rãi cho xét tuyển đại học trong hệ thống giáo dục Mỹ.
Theo Google, Gemini Ultra đạt 90% điểm trên MMLU, trong khi GPT-4 chỉ đạt 86,4%.
Thế nhưng, thành tích ấn tượng hơn: Gemini Ultra có thể là mô hình AI đầu tiên vượt trội các chuyên gia con người trên MMLU. Trong một báo cáo kỹ thuật về Gemini, Google cho biết các chuyên gia con người chỉ đạt khoảng 89,8 điểm.
"Nếu bạn quay lại hai hoặc ba năm trước và nói với các nhà nghiên cứu AI rằng Google sẽ có một mô hình đạt 90% điểm trên MMLU, vượt qua ngưỡng chuẩn của các chuyên gia con người, họ sẽ gọi đó là AGI", Kevin Roose cho hay.
AGI (trí tuệ nhân tạo tổng quát) là một dạng trí tuệ nhân tạo được giả định có thể xử lý các khả năng phức tạp của con người như trực giác và ý thức. AGI từng được coi là mục tiêu cuối cùng của lĩnh vực AI vì về mặt lý thuyết, đại diện cho thời điểm khi loài người tạo ra thứ gì đó thông minh bằng hoặc hơn chính mình.