Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Kỹ sư nghiên cứu AI: ‘Gemini nhanh hơn GPT-4 rất nhiều’

Sơn Vân • 22:38 07/12/2023

Kỹ sư nghiên cứu trí tuệ nhân tạo (AI) tại hãng MosaicML nhận xét: "Gemini quá tốt. Tốt hơn và nhanh hơn GPT-4 rất nhiều".

OpenAI, công ty khởi nghiệp tương đối nhỏ và mới nổi, đã thách thức Google khi phát hành ChatGPT vào tháng 11.2022.

Hôm 6.12, Sundar Pichai (Giám đốc điều hành Google) và Demis Hassabis (Giám đốc điều hành google DeepMind) đã giới thiệu với thế giới về mô hình generative AI mới mang tên Gemini. Google mô tả đây là "mô hình AI thông minh và tổng quát nhất của mình cho đến nay".

Có ba phiên bản khác nhau gồm Ultra, Pro và Nano, Gemini là hệ thống AI đa phương thức, nghĩa là không chỉ xử lý văn bản mà còn cả mã, âm thanh, hình ảnh và video để phản hồi truy vấn từ người dùng. Gemini cũng tích hợp trực tiếp vào các thiết bị di động, là lần đầu tiên cho một mô hình AI và điểm thú vị cho những người tạo ứng dụng.

Ra mắt Gemini là khoảnh khắc quan trọng với Google đến nỗi người đồng sáng lập Sergey Brin đã tham gia "gần như mỗi ngày" trong quá trình phát triển mô hình AI này.

Các phản hồi ban đầu cho thấy Gemini đang có hiệu suất tốt so với GPT-4, mô hình ngôn ngữ lớn của OpenAI làm nền tảng cho ChatGPT.

Google cho biết Gemini Ultra (phiên bản Gemini mạnh mẽ nhất sẽ ra mắt vào năm tới) "vượt qua kết quả hiện tại của 30 trong số 32 thước đo học thuật phổ biến" để đánh giá các mô hình ngôn ngữ lớn.

Trong một thước đo, Gemini Ultra có tỷ lệ thành công là 74,4% trong tạo mã Python, so với 67% của GPT-4. Với một thước đo khác, Gemini Ultra có điểm đọc hiểu là 82,4 so với 80,9 của GPT-4.

Ấn tượng đầu tiên về Gemini dường như tích cực với những người dùng đang trải nghiệm mô hình AI này thông qua Bard.

Mihir Patel, kỹ sư nghiên cứu tại hãng MosaicML, đã đăng ảnh chụp màn hình lên X để so sánh phản hồi từ Gemini và GPT-4 với câu hỏi "Mamba trong học sâu là gì?"

Theo ảnh chụp màn hình, phản hồi của Gemini chi tiết hơn và cũng được liên kết với các tài liệu nghiên cứu bên ngoài. ChatGPT gần giống một bài viết thông minh trên Wikipedia.

Mihir Patel nhận xét: "Gemini quá tốt. Tốt hơn và nhanh hơn GPT-4 rất nhiều".

“
Mamba là một kiến trúc học sâu (deep learning) tương đối mới được phát triển bởi hãng Anakin AI.
Học sâu là một lĩnh vực trong AI tập trung vào việc xây dựng và huấn luyện các mô hình học máy sâu, còn được gọi là mạng nơ-ron sâu. Mục tiêu của học sâu là tự động học các đặc trưng và biểu diễn cấp cao từ dữ liệu, giúp máy tính tự động thực hiện các nhiệm vụ phức tạp mà trước đây đòi hỏi sự can thiệp của con người.
Mô hình học sâu thường được xây dựng bằng cách sử dụng nhiều lớp của các nơ-ron. Nơ-ron là các đơn vị tính toán cơ bản mô phỏng theo cách hoạt động của não người. Những mô hình này có khả năng học các biểu diễn phức tạp của dữ liệu thông qua quá trình huấn luyện trên tập dữ liệu lớn.
Học sâu đã đạt được sự chú ý lớn nhờ vào khả năng giải quyết hiệu quả nhiều vấn đề khác nhau, bao gồm nhận dạng hình ảnh, ngôn ngữ tự nhiên, dịch ngôn ngữ và nhiều ứng dụng khác trong thực tế. Các mô hình nổi tiếng trong học sâu bao gồm Mạng nơ-ron tích chập (CNN) và Mạng nơ-ron hồi quy (RNN).

Một video cho thấy Gemini mô tả bức tranh phát triển hình con vịt đang bơi trong nước chính xác.

Các nhà phát triển có thể sẽ chào đón Gemini như một sự thay thế thú vị cho sản phẩm của OpenAI. Google nói với tờ Financial Times rằng, vì mô hình Gemini Nano được xây dựng để "chạy tự nhiên" trên smartphone Pixel nên các nhà phát triển Android sẽ dễ dàng xây dựng ứng dụng AI hơn.

Vẫn còn nhiều ý kiến đánh giá về Gemini và khả năng của Google có thể thu hút người dùng từ ChatGPT hay không. Rất nhiều người dùng muốn thử nghiệm Gemini có thể phải chờ vì Google vẫn tiếp tục làm việc trên các phiên bản mô hình không phải tiếng Anh.

Gemini vẫn dường như vẫn có thể mắc phải những vấn đề liên quan đến "ảo giác" (trả lời sai như thật) ở ChatGPT.

Sundar Pichai, Demis Hassabis và các lãnh đạo Google khác hẳn đã quen với tình thế tiến thoái lưỡng nan của nhà đổi mới - ý tưởng cho rằng các công ty lớn có nguy cơ mất đi vị trí dẫn đầu thị trường nếu không nhanh nhẹn trong việc phát triển sản phẩm. Các phản hồi sớm với Gemini cho thấy vẫn còn sức sống trong cỗ máy tìm kiếm cũ của Google.

ky-su-nghien-cuu-ai-gemini-nhanh-hon-gpt-4-rat-nhieu-.jpg — Các phản hồi ban đầu cho thấy Gemini đang có hiệu suất tốt so với GPT-4 - Ảnh: Internet

Sẽ được ra mắt theo từng giai đoạn, Gemini là cơ hội để Google ngăn chặn quan điểm cho rằng hãng đang tụt hậu so với đối thủ OpenAI.

Dù người dùng sẽ có quyền truy cập vào Gemini trong tháng 12, phiên bản cao cấp nhất của mô hình AI này sẽ không xuất hiện cho đến đầu năm 2024.

Gemini có ba phiên bản được phát hành theo từng giai đoạn, gồm Ultra, Pro và Nano. Phiên bản Nano được thiết kế để chạy cục bộ trên các thiết bị, chẳng hạn smartphone.

Google sẽ cấp cho người dùng quyền truy cập vào phiên bản Gemini Pro hôm 6.12 thông qua chatbot Bard và cho khách hàng dùng Cloud trong những ngày tới. Song, Google cho biết Gemini Ultra (phiên bản lớn nhất và tiên tiến nhất về mặt kỹ thuật trong ba mô hình AI) vẫn đang trong quá trình thử nghiệm nội bộ và sẽ không triển khai cho đến đầu năm 2024.

Google thông báo có kế hoạch đưa Gemini vào các sản phẩm phổ biến nhất của mình theo thời gian. Công ty cũng ra mắt Gemini Ultra cho Bard phiên bản mới có tên Bard Advanced vào năm tới.

Sissie Hsiao, Phó chủ tịch Google kiêm quản lý Bard and Assistant, không tiết lộ liệu có tốn phí để sử dụng Bard Advanced hay không nhưng không phủ nhận khả năng đó.

Hiện Google phải chịu áp lực rất lớn để chứng minh họ vẫn là công ty dẫn đầu ngành AI với Gemini, được đào tạo để trở nên đa phương thức, nghĩa là có thể xử lý các loại phương tiện khác nhau như văn bản, hình ảnh, video và âm thanh. Google tự hào rằng Gemini cũng là mô hình AI "linh hoạt nhất" của họ, có khả năng chạy trên nhiều nguồn từ trung tâm dữ liệu đến smartphone.

Trong cuộc thảo luận bàn tròn với các phóng viên tuần này, các lãnh đạo Google nói Gemini Ultra là mô hình AI đầu tiên vượt trội hơn các chuyên gia về MMLU (hiểu biết ngôn ngữ đa nhiệm quy mô lớn), một phép đo kiểm tra các môn như Toán, Lịch sử, Luật và Đạo đức. Gemini Ultra đạt 90,0% số điểm, vượt qua con số 86,4% của GPT-4 của OpenAI.

Google tuyên bố Gemini Pro hoạt động tốt hơn GPT-3.5 (mô hình ngôn ngữ lớn làm nền tảng cho phiên bản ChatGPT miễn phí) và người dùng sẽ có thể thử nghiệm bản tinh chỉnh cho Bard bắt đầu từ ngày 6.12 (ban đầu chỉ bằng ngôn ngữ tiếng Anh).

Google đã bác bỏ những đề xuất rằng đã nỗ lực để đuổi kịp đối thủ, nhưng bên trong công ty, mọi thứ trông rất khác khi họ đua nhau tung ra Gemini và tích hợp AI vào tất cả sản phẩm chính của mình.

Hồi tháng 4, Sundar Pichai đã sáp nhập đơn vị DeepMind được đánh giá cao của Alphabet với nhóm AI nội bộ là Google Brain, để đẩy nhanh quá trình phát triển Gemini. Nhân viên cũng được thông báo rằng Google sẽ giảm số lượng nghiên cứu được xuất bản để hạn chế các đối thủ thương mại hóa ý tưởng của họ, trang Insider đưa tin.

Google tin rằng Gemini có lợi thế hơn trong cuộc cạnh tranh ở "lý luận phức tạp", cách mô hình xử lý thông tin phức tạp trên các loại phương tiện khác nhau.

Trong một bản demo được trình chiếu cho báo chí, các nhà nghiên cứu DeepMind đã sử dụng Gemini để tìm kiếm hàng trăm nghìn tài liệu nghiên cứu nhằm trích xuất các loại dữ liệu cụ thể. Google cho biết Gemini có thể phân biệt giữa những bài viết có liên quan đến nghiên cứu và không liên quan. Thú vị hơn, họ cho Gemini xem một biểu đồ với dữ liệu cũ và yêu cầu nó tạo ra một phiên bản cập nhật với dữ liệu mới được vẽ.

Dù Gemini có thể xử lý các loại phương tiện khác nhau, Eli Collins, Phó chủ tịch sản phẩm của DeepMind, cho biết các mô hình Gemini ban đầu sẽ không thể tạo hình ảnh và video, nhưng gợi ý rằng điều này sẽ xuất hiện trong các mô hình AI khác trong tương lai.

Eli Collins nói thêm rằng Google đã nhận thấy một số khả năng "mới lạ" ở Gemini có thể mang lại lợi thế cho nó so với các mô hình AI đối thủ, nhưng sẽ không nói rõ những khả năng đó có thể là gì.

Gemini đã được đào tạo và được hỗ trợ bởi các bộ xử lý Tensor (TPU). Google sử dụng buổi giới thiệu Gemini để công bố Cloud TPU v5p mới và siêu máy tính AI mới sẽ được sử dụng để cải thiện hoạt động đào tạo và phân phối AI. Điều thú vị là Amin Vahdat, Phó chủ tịch của Google Cloud AI, cho biết Gemini sẽ chạy trên cả GPU và TPU trong tương lai, nhưng không nói rõ hơn điều đó.

Google thông báo sẽ cung cấp Gemini Pro cho khách hàng doanh nghiệp thông qua chương trình Vertex AI và dành cho các nhà phát triển trong AI Studio vào ngày 13.12.

Bài liên quan

Nhân viên rời Apple thường gia nhập Google

Theo trang Switch on Business, phân tích về hồ sơ LinkedIn trong ngành công nghệ cho thấy điểm đến phổ biến nhất của các cựu nhân viên Apple là Google.

Đọc tiếp

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Tổng Bí thư Tô Lâm viếng nguyên Chủ tịch nước Lào Khamtay Siphandone

8 giờ trước Sự kiện

Ngày 3.4, được tin đại tướng Khamtay Siphandone, nguyên Chủ tịch Đảng Nhân dân Cách mạng Lào, nguyên Chủ tịch nước, nguyên Thủ tướng nước Cộng hòa Dân chủ Nhân dân Lào từ trần, Tổng Bí thư Tô Lâm đã dẫn đầu đoàn lãnh đạo cấp cao của Đảng, Nhà nước Việt Nam sang viếng đồng chí Khamtay Siphandone.

Việt Nam để quốc tang nguyên Chủ tịch nước Lào Khamtay Siphandone trong 2 ngày

Việt Nam quyết định để tang nguyên Chủ tịch nước Lào Khamtay Siphandone theo nghi thức quốc...
Đoàn công tác của Chính phủ sẽ sang Mỹ làm việc về vấn đề áp thuế 46% với hàng Việt

Thứ trưởng Bộ Tài chính Nguyễn Đức Chi cho biết: "Cuối tuần này, Chính phủ cử đoàn công tác...
Video robot Trung Quốc nhào lộn như người thật sau khi nâng cấp AI

G1 - mẫu robot hình người đến từ công ty Unitree (Trung Quốc) - đã thực hiện thành công cú...

Đừng bỏ lỡ

Ngày hội thanh trà Bình Minh: 135 món ẩm thực chờ xác lập kỷ lục

7 giờ trước Du lịch

Ngày 3.4, UBND tỉnh Vĩnh Long phê duyệt kế hoạch tổ chức Ngày hội thanh trà Bình Minh, công diễn xác lập kỷ lục Việt Nam đối với 135 món ẩm thực được chế biến từ trái thanh trà của thị xã Bình Minh.
Cách khôi phục tin nhắn bị xóa trên iPhone

7 giờ trước Khoa học - công nghệ

Ai cũng có thể vô tình xóa tin nhắn chỉ bằng một cú vuốt nhẹ trong ứng dụng Messages của iPhone.
Bộ trưởng Y tế: Đầu tư nâng cao sức khỏe nhân dân là đầu tư cho phát triển

8 giờ trước Thông tin Y học

Đầu tư cho bảo vệ, chăm sóc và nâng cao sức khỏe nhân dân là đầu tư cho phát triển. Cần thực hiện tốt nhiệm vụ chăm sóc sức khỏe bà mẹ, trẻ em, đặc biệt là ở khu vực miền núi, vùng sâu, vùng xa, vùng khó khăn, biên giới, hải đảo.
Sở ATTP TP.HCM: Còn sống, còn ăn thì còn những vấn đề về thực phẩm xảy ra

8 giờ trước Thông tin Y học

Đề cập đến vấn đề giải quyết tận gốc ngộ độc thực phẩm, đại diện Sở ATTP TP.HCM cho biết đã làm hết sức trong khả năng, phạm vi quản lý nhà nước và khẳng định "còn sống, còn ăn thì còn những vấn đề về thực phẩm xảy ra".
Không ngừng đổi mới sáng tạo trong lĩnh vực công nghệ số, Vietjet thắng lớn tại Asia Pacific Loyalty Awards 2025

9 giờ trước Thông tin doanh nghiệp

Chương trình khách hàng thân thiết của hãng hàng không Vietjet - Vietjet Sky Joy đã xuất sắc giành giải thưởng "Best Use of Digital Technology" tại Asia Pacific Loyalty Awards 2025 được tổ chức tại Melbourne, Australia.

Mới nhất

Tổng Bí thư Tô Lâm viếng nguyên Chủ tịch nước Lào Khamtay Siphandone

8 giờ trước Sự kiện

Ngày 3.4, được tin đại tướng Khamtay Siphandone, nguyên Chủ tịch Đảng Nhân dân Cách mạng Lào, nguyên Chủ tịch nước, nguyên Thủ tướng nước Cộng hòa Dân chủ Nhân dân Lào từ trần, Tổng Bí thư Tô Lâm đã dẫn đầu đoàn lãnh đạo cấp cao của Đảng, Nhà nước Việt Nam sang viếng đồng chí Khamtay Siphandone.
Việt Nam để quốc tang nguyên Chủ tịch nước Lào Khamtay Siphandone trong 2 ngày

8 giờ trước Sự kiện

Việt Nam quyết định để tang nguyên Chủ tịch nước Lào Khamtay Siphandone theo nghi thức quốc tang trong 2 ngày, từ ngày 4 - 5.4.
Đoàn công tác của Chính phủ sẽ sang Mỹ làm việc về vấn đề áp thuế 46% với hàng Việt

11 giờ trước Kinh tế - đầu tư - dự án

Thứ trưởng Bộ Tài chính Nguyễn Đức Chi cho biết: "Cuối tuần này, Chính phủ cử đoàn công tác sang Mỹ có nội dung liên quan trực tiếp tới vấn đề áp thuế 46% với hàng hóa xuất khẩu của Việt Nam".
Phúc thẩm vụ án Vạn Thịnh Phát (giai đoạn 2): Luật sư đề nghị SCB cung cấp số liệu

11 giờ trước Theo dòng thời sự

Bào chữa cho bị cáo Trương Mỹ Lan, luật sư đề nghị xem xét toàn diện về nguyên nhân, bối cảnh vụ án; đồng thời kiến nghị Viện kiểm sát tiếp tục yêu cầu SCB cung cấp số liệu.
Mảng chip lao đao, Samsung tìm 'phao cứu sinh' từ Trung Quốc

11 giờ trước Khoa học - công nghệ

Khi mảng kinh doanh bán dẫn đang lao đao, Samsung - tập đoàn điện tử hàng đầu Hàn Quốc - đang dần chuyển hướng sang Trung Quốc để tìm kiếm động lực tăng trưởng mới, theo Financial Times.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT:

Email: toasoan

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Kỹ sư nghiên cứu AI: ‘Gemini nhanh hơn GPT-4 rất nhiều’

Nhân viên rời Apple thường gia nhập Google

Gemini

GPT-4

OpenAI

Google

Mihir Patel

MosaicML

mamba

học sâu

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

Google DeepMind dùng AI dự đoán cấu trúc hơn 2 triệu vật liệu mới

Elon Musk đầu tư vào Google DeepMind vì lo ngại AI có thể phá hủy việc thuộc địa hóa sao Hỏa

Cơ hội nào cho Việt Nam trong chuỗi giá trị công nghệ bán dẫn?

'SpaceX là thách thức chưa từng có với tham vọng thống trị vũ trụ của Trung Quốc'

Google ra mắt 3 phiên bản mô hình Gemini, vũ khí AI hạng nặng để đấu với OpenAI

Giám đốc AI cảnh báo Mark Zuckerberg rằng Facebook có thể lạc hậu nếu không bắt kịp ChatGPT

Nghiên cứu mới: ChatGPT cung cấp thông tin sai lệch hoặc không đầy đủ về thuốc

Gạo ST25 của ông Hồ Quang Cua đạt giải nhất cuộc thi gạo ngon nhất thế giới năm 2023

Tổng Bí thư Tô Lâm viếng nguyên Chủ tịch nước Lào Khamtay Siphandone

Việt Nam để quốc tang nguyên Chủ tịch nước Lào Khamtay Siphandone trong 2 ngày

Đoàn công tác của Chính phủ sẽ sang Mỹ làm việc về vấn đề áp thuế 46% với hàng Việt

Video robot Trung Quốc nhào lộn như người thật sau khi nâng cấp AI

Ngày hội thanh trà Bình Minh: 135 món ẩm thực chờ xác lập kỷ lục

Cách khôi phục tin nhắn bị xóa trên iPhone

Bộ trưởng Y tế: Đầu tư nâng cao sức khỏe nhân dân là đầu tư cho phát triển

Sở ATTP TP.HCM: Còn sống, còn ăn thì còn những vấn đề về thực phẩm xảy ra

Không ngừng đổi mới sáng tạo trong lĩnh vực công nghệ số, Vietjet thắng lớn tại Asia Pacific Loyalty Awards 2025

Tổng Bí thư Tô Lâm viếng nguyên Chủ tịch nước Lào Khamtay Siphandone

Việt Nam để quốc tang nguyên Chủ tịch nước Lào Khamtay Siphandone trong 2 ngày

Đoàn công tác của Chính phủ sẽ sang Mỹ làm việc về vấn đề áp thuế 46% với hàng Việt

Phúc thẩm vụ án Vạn Thịnh Phát (giai đoạn 2): Luật sư đề nghị SCB cung cấp số liệu

Mảng chip lao đao, Samsung tìm 'phao cứu sinh' từ Trung Quốc

Zhipu ra mắt tác tử AI miễn phí, nói GLM-Z1-Air có hiệu suất ngang DeepSeek-R1 nhưng chạy nhanh hơn 8 lần

EU sẽ hạn chế tiền phạt Apple và Meta để tránh gia tăng căng thẳng với ông Trump

Apple và SpaceX của Elon Musk đối đầu vì kế hoạch mở rộng mạng vệ tinh

Giám đốc công nghệ Meta đánh giá vị thế của Google, Microsoft, Amazon trong cuộc đua AI

Apple chuẩn bị bước tiến lớn nhất vào lĩnh vực sức khỏe với bác sĩ AI, muốn thay đổi ngành y tế