Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Meta: Mô hình Llama 3 lớn nhất miễn phí nhưng không kém GPT-4o và Claude 3.5 Sonnet

Sơn Vân • 23:18 23/07/2024

Hôm 23.7, Meta Platforms đã phát hành phiên bản lớn nhất của mô hình trí tuệ nhân tạo (AI) Llama 3, tự hào về các kỹ năng đa ngôn ngữ và chỉ số hiệu suất chung không kém mô hình trả phí do OpenAI và Anthropic cung cấp.

Phiên bản Llama 3 lớn nhất có thể trò chuyện bằng 8 ngôn ngữ, viết mã máy tính chất lượng cao hơn và giải quyết các bài toán phức tạp hơn so với các phiên bản trước đó. Meta Platforms (công ty mẹ của Facebook) cho biết thông tin này trong các bài đăng trên blog và một bài báo nghiên cứu công bố việc phát hành bản Llama 3 mới nhất.

Với 405 tỉ tham số (các biến mà thuật toán xem xét để tạo phản hồi cho các truy vấn của người dùng), Llama 3 phiên bản mới vượt xa phiên bản trước được phát hành năm ngoái nhưng vẫn nhỏ hơn so với mô hình AI hàng đầu do các đối thủ cung cấp. GPT-4 của OpenAI được cho có 1.000 tỉ tham số và Amazon đang đầu tư vào một mô hình AI có 2.000 tỉ tham số.

Việc Meta Platforms phát hành phiên bản Llama 3 lớn nhất diễn ra khi các hãng công nghệ đang chạy đua để chứng minh rằng danh mục ngày càng phát triển của họ về mô hình ngôn ngữ lớn (đòi hỏi nhiều tài nguyên) có thể mang lại những lợi ích đáng kể trong các lĩnh vực đã biết, chẳng hạn lập luận nâng cao, để biện minh cho những khoản tiền khổng lồ được đầu tư vào chúng.

Ngoài mô hình AI hàng đầu với 405 tỉ tham số, Meta Platforms cũng phát hành các phiên bản cập nhật phiên bản Llama 3 nhẹ hơn với 8 tỉ và 70 tỉ tham số, từng được giới thiệu vào mùa xuân. Cả ba mô hình AI mới đều đa ngôn ngữ và có thể xử lý các yêu cầu của người dùng lớn hơn thông qua "cửa sổ ngữ cảnh" mở rộng, mà Ahmad Al-Dahle (trưởng bộ phận AI tạo sinh của Meta Platforms) cho biết sẽ cải thiện trải nghiệm tạo mã máy tính đặc biệt.

Cửa sổ ngữ cảnh (còn được gọi là bộ nhớ dài) là kỹ thuật được sử dụng trong các mô hình ngôn ngữ lớn như Llama 3 để giúp chúng xử lý các yêu cầu phức tạp và tạo ra phản hồi chính xác hơn. Cửa sổ ngữ cảnh hoạt động bằng cách cho phép mô hình AI xem xét một lượng lớn văn bản trước và sau truy vấn của người dùng, giúp nó hiểu rõ hơn về bối cảnh của truy vấn và tạo ra phản hồi phù hợp hơn.

"Đó là phản hồi hàng đầu mà chúng tôi nhận được từ cộng đồng", Al-Dahle nói với Reuters trong một cuộc phỏng vấn, lưu ý rằng các cửa sổ ngữ cảnh lớn hơn cung cấp cho các mô hình cái gì đó giống như bộ nhớ dài hơn giúp xử lý các yêu cầu nhiều bước.

Meta Platforms phát hành các mô hình Llama của mình chủ yếu miễn phí để sử dụng cho các nhà phát triển. Đây là chiến lược mà Giám đốc điều hành Meta Platforms - Mark Zuckerberg cho biết sẽ được đền đáp bằng các sản phẩm sáng tạo và mức độ tương tác cao hơn trên các mạng xã hội cốt lõi của công ty. Tuy nhiên, một số nhà đầu tư đã nghi ngờ sẽ có các chi phí liên quan.

Meta Platforms cũng có thể thu được lợi ích nếu các nhà phát triển chọn sử dụng các mô hình AI miễn phí của mình thay vì mô hình trả phí. Lý do vì điều này sẽ làm suy yếu mô hình AI của các đối thủ. Trong thông báo mới nhất, Meta Platforms quảng cáo những lợi ích về các bài kiểm tra toán học và kiến thức chính có thể khiến triển vọng đó hấp dẫn hơn.

Dù tiến độ phát triển AI rất khó đo lường nhưng kết quả kiểm tra do Meta Platforms cung cấp dường như cho thấy mô hình Llama 3 lớn nhất gần ngang bằng và trong một số trường hợp trội hơn so với Claude 3.5 Sonnet của Anthropic lẫn GPT-4o của OpenAI. Claude 3.5 Sonnet và GPT-4o được coi là hai mô hình AI tiên tiến mạnh nhất trên thị trường hiện nay.

Ví dụ, trên điểm chuẩn MATH của các bài toán đố bằng lời ở cấp độ thi đấu, phiên bản Llama 3 lớn nhất đạt 73,8 điểm, so với 76,6 của GPT-4o và 71,1 của Claude 3.5 Sonnet.

Phiên bản Llama 3 lớn nhất đạt được 88,6 điểm trên MMLU (điểm chuẩn bao gồm hàng chục môn về toán học, khoa học và nhân văn), trong khi GPT-4o được 88,7 điểm và Claude 3.5 Sonnet được 88,3 điểm.

Trong bài viết của mình, các nhà nghiên cứu Meta Platforms cũng giới thiệu các phiên bản "đa phương thức" sắp tới cho các mô hình AI dự kiến ra mắt cuối năm nay, bổ sung khả năng hình ảnh, video và giọng nói cho mô hình Llama 3 cốt lõi. Họ nói những thử nghiệm ban đầu cho thấy các mô hình AI đó có khả năng cạnh tranh với mô hình đa phương thức khác như Gemini 1.5 của Google và Claude 3.5 Sonnet của Anthropic.

meta-mo-hinh-llama-3-lon-nhat-mien-phi-nhung-khong-kem-gpt-4o-va-claude-3-5-sonnet.jpg — Meta Platforms vừa phát hành phiên bản lớn nhất của Llama 3, tự hào về các kỹ năng đa ngôn ngữ và chỉ số hiệu suất chung không kém mô hình trả phí của OpenAI và Anthropic - Ảnh: Reuters

Mới đây, Reuters đưa tin OpenAI đang phát triển phương pháp suy luận mới cho các mô hình AI của mình trong dự án có tên mã Strawberry, theo một người quen thuộc với vấn đề và tài liệu nội bộ.

Dự án này đến vào lúc công ty khởi nghiệp được Microsoft hậu thuẫn đang chạy đua để chứng minh rằng các loại mô hình AI của mình có khả năng cung cấp khả năng suy luận tiên tiến.

Các nhóm bên trong OpenAI đang làm việc trên Strawberry, theo một bản sao của tài liệu nội bộ gần đây của OpenAI mà Reuters thấy vào tháng 5. Tài liệu này nêu chi tiết kế hoạch về cách OpenAI dự định sử dụng Strawberry để thực hiện nghiên cứu. Nguồn tin của Reuters mô tả kế hoạch này là việc được đang tiến hành. Thế nhưng, Reuters không thể xác định Strawberry sắp ra mắt công chúng hay chưa.

Cách hoạt động với Strawberry là bí mật, được giữ kín ngay cả trong OpenAI, nguồn tin của Reuters cho biết. Theo Reuters, tài liệu mô tả một dự án sử dụng các mô hình Strawberry với mục đích giúp AI của công ty không chỉ trả lời câu hỏi từ truy vấn của người dùng mà còn lên kế hoạch đủ để điều hướng internet một cách tự động và đáng tin cậy nhằm thực hiện cái mà OpenAI gọi là "nghiên cứu sâu". Đây là điều mà các mô hình AI hiện tại chưa đạt được, theo các cuộc phỏng vấn của Reuters với hơn 12 nhà nghiên cứu AI.

Dự án Strawberry trước đây được biết đến với tên gọi Q*, là một bước đột phá trong OpenAI mà Reuters từng đưa tin. Hai nguồn tin của Reuters cho biết đã xem các bản demo Q* vào đầu năm nay, có khả năng trả lời những câu hỏi khoa học và toán học phức tạp mà nhiều mô hình hiện AI tại chưa thể làm được.

Tại cuộc họp gần đây, OpenAI đã trình diễn một dự án nghiên cứu mà họ tuyên bố có kỹ năng suy luận mới giống con người, theo hãng tin Bloomberg. Một phát ngôn viên của OpenAI xác nhận có cuộc họp nhưng từ chối cung cấp chi tiết về nội dung. Reuters chưa thể xác định liệu dự án được trình diễn hôm 9.7 có phải là Strawberry hay không.

OpenAI hy vọng sự đổi mới này sẽ cải thiện đáng kể khả năng suy luận cho các mô hình AI của mình. Một người quen thuộc với dự án nói rằng Strawberry bao gồm cả cách xử lý chuyên biệt một mô hình AI sau khi nó đã được đào tạo dựa trên các tập dữ liệu rất lớn.

Các nhà nghiên cứu mà Reuters phỏng vấn cho biết suy luận là chìa khóa để AI đạt được trí thông minh ngang bằng hoặc vượt trội con người. Trong khi các mô hình ngôn ngữ lớn hiện tại thể tóm tắt các văn bản dày đặc và viết văn xuôi thanh lịch nhanh hơn bất kỳ người nào, công nghệ này thường không đạt được ở những vấn đề thông thường mà con người giải quyết một cách trực quan, như lỗi sai trong lập luận và chơi cờ caro.

Khi gặp phải những vấn đề này, mô hình AI thường bị ảo giác và đưa ra thông tin sai lệch. Nhìn chung, các nhà nghiên cứu AI mà Reuters phỏng vấn đồng ý rằng suy luận, trong bối cảnh AI, liên quan đến việc hình thành mô hình cho phép AI lên kế hoạch trước, phản ánh cách thế giới vật lý hoạt động và giải quyết các vấn đề phức tạp nhiều bước một cách đáng tin cậy.

Cải thiện khả năng suy luận được coi là chìa khóa để mở ra khả năng cho các mô hình AI trong việc thực hiện mọi thứ, từ việc phát hiện các khám phá khoa học lớn đến lập kế hoạch và xây dựng ứng dụng phần mềm mới.

Sam Altman, Giám đốc điều hành OpenAI, nói đầu năm nay rằng “các lĩnh vực tiến bộ quan trọng nhất trong AI sẽ xoay quanh khả năng suy luận”.

Một số công ty khác như Google, Meta Platforms và Microsoft cũng đang thử nghiệm các kỹ thuật khác nhau để cải thiện khả năng suy luận trong mô hình AI, giống hầu hết phòng thí nghiệm học thuật thực hiện nghiên cứu về AI.

Các nhà nghiên cứu có quan điểm khác nhau về việc liệu mô hình ngôn ngữ lớn có khả năng đưa những ý tưởng và kế hoạch dài hạn vào cách chúng thực hiện dự đoán hay không.

Yann LeCun, Giám đốc Khoa học AI tại Meta Platforms (một trong những người tiên phong về AI), đã thường xuyên nói rằng các mô hình ngôn ngữ lớn không có khả năng suy luận giống con người.

Bài liên quan

Nvidia, Microsoft, Meta lặng lẽ cảnh báo AI là khoản đặt cược tài chính rủi ro để tránh bị nhà đầu tư kiện

Các hãng công nghệ lớn lặng lẽ cảnh báo rằng trí tuệ nhân tạo (AI) có thể ảnh hưởng xấu đến hoạt động kinh doanh của họ.

Đọc tiếp

Meta vẫn đặt cược Threads có thể đánh bại X nhưng Mark Zuckerberg phải đối mặt cuộc chiến khó khăn

Nhiều mô hình AI từ Trung Quốc đến Mỹ và Pháp trả lời sai câu hỏi: 9,90 hay 9,11 lớn hơn?

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Tổng Bí thư cho ý kiến về đề án về tổ chức quân sự địa phương 'tinh, gọn, mạnh'

3 giờ trước Theo dòng thời sự

Sáng 2.4, Quân ủy Trung ương nhiệm kỳ 2020 - 2025 đã tổ chức hội nghị lần thứ 13, xem xét, cho ý kiến vào đề án về tổ chức quân sự địa phương “tinh, gọn, mạnh” đáp ứng yêu cầu nhiệm vụ trong tình hình mới. Tổng Bí thư Tô Lâm, Bí thư Quân ủy Trung ương chủ trì hội nghị.

Cơn lốc plasma và UFO kỳ lạ: Mặt trời bất ngờ hé lộ hiện tượng chưa từng thấy

Một video mới được Cơ quan vũ trụ châu Âu (ESA) công bố đang thu hút sự chú ý của giới khoa...
Nghị định 75: Kỳ vọng tháo gỡ vướng mắc cho nhiều dự án

Chuyên gia cho rằng Nghị định 75 ban hành kịp thời, kỳ vọng sẽ tháo gỡ được vướng mắc cho các...
AI cho cộng đồng: Tạo nền tảng vững chắc để phát triển kỹ năng số

Việc nâng cao hiểu biết về AI cho toàn dân sẽ giúp Việt Nam nhanh chóng thích ứng với những...

Đừng bỏ lỡ

Kiên Giang: Lãnh hơn 3 năm tù vì thuê xe cuốc rồi đem bán

2 phút trước Sự kiện

Ngày 2.4, TAND tỉnh Kiên Giang đã mở phiên tòa sơ thẩm và tuyên phạt Nguyễn Hoàng Khởi (SN 1985, ngụ huyện Châu Thành A, tỉnh Hậu Giang) 3 năm 6 tháng tù về tội “Lạm dụng tín nhiệm chiếm đoạt tài sản” .
Cứu bé gái 14 tuổi thoát khỏi những 'cơn điên' hủy hoại cơ thể

17 phút trước Thông tin Y học

Mỗi lần lên cơn kích động, bé K.N (14 tuổi, ngụ Lâm Đồng) hay la hét, không nhận ra người nhà; tự hủy hoại bản thân như tự bóp cổ mình, cắn môi, cắn lưỡi...
Bộ Y tế vào cuộc vụ người nhà bệnh nhân hành hung bác sĩ ở Gia Lai

44 phút trước Thông tin Y học

Ngày 2.4, Bộ Y tế đã có công văn chỉ đạo Giám đốc Sở Y tế tỉnh Gia Lai tăng cường bảo đảm an ninh, trật tự tại cơ sở khám bệnh, chữa bệnh; tập trung các giải pháp để ngăn chặn, hạn chế tối đa các trường hợp gây mất an ninh trật tự.
Dấu hiệu nhận biết sạc dự phòng giả

một giờ trước Khoa học - công nghệ

Sạc dự phòng giả được bán tràn lan trên thị trường, trong đó có cả "thương hiệu lớn" và sản phẩm được phóng đại dung lượng lẫn tính năng. Người bán còn quảng cáo chúng sánh ngang với sản phẩm cung cấp bởi hãng nổi tiếng.
Nhiều quan chức Nhà Trắng vướng chỉ trích vì dùng Gmail trao đổi tài liệu nhạy cảm

một giờ trước Quốc tế

Cố vấn An ninh quốc gia Mỹ Michael Waltz và nhóm của ông đang vướng vào một loạt chỉ trích sau khi bị phát hiện sử dụng tài khoản Gmail cá nhân để xử lý công việc chính phủ Mỹ.

Mới nhất

Cơn lốc plasma và UFO kỳ lạ: Mặt trời bất ngờ hé lộ hiện tượng chưa từng thấy

một giờ trước Nhịp đập khoa học

Một video mới được Cơ quan vũ trụ châu Âu (ESA) công bố đang thu hút sự chú ý của giới khoa học và công chúng: một cơn “lốc xoáy” khổng lồ của gió mặt trời cuộn trào từ cực bắc của Mặt trời, tạo ra hình dạng xoắn độc đáo.
Nghị định 75: Kỳ vọng tháo gỡ vướng mắc cho nhiều dự án

1 giờ trước Hạ tầng và bất động sản

Chuyên gia cho rằng Nghị định 75 ban hành kịp thời, kỳ vọng sẽ tháo gỡ được vướng mắc cho các dự án mà nhà đầu tư đang sử dụng đất hoặc đã “mua gom” đất, phù hợp với quy hoạch làm nhà ở thương mại nhưng chưa thể thực hiện do không có đất ở.
Tổng Bí thư cho ý kiến về đề án về tổ chức quân sự địa phương 'tinh, gọn, mạnh'

3 giờ trước Theo dòng thời sự

Sáng 2.4, Quân ủy Trung ương nhiệm kỳ 2020 - 2025 đã tổ chức hội nghị lần thứ 13, xem xét, cho ý kiến vào đề án về tổ chức quân sự địa phương “tinh, gọn, mạnh” đáp ứng yêu cầu nhiệm vụ trong tình hình mới. Tổng Bí thư Tô Lâm, Bí thư Quân ủy Trung ương chủ trì hội nghị.
Nghệ sĩ Trần Mạnh Tuấn: Thổi hồn vào nhạc Trịnh bằng câu chuyện của đời mình

4 giờ trước Văn hóa

Nghệ sĩ Trần Mạnh Tuấn không chỉ thổi hồn vào những bản nhạc của Trịnh mà qua những giai điệu ấy anh đã kể câu chuyện của đời mình khi có một tình yêu thủy chung và một tình bạn rất đẹp.
Bị cáo Trương Mỹ Lan mong được tạo điều kiện để khắc phục hậu quả

4 giờ trước Sự kiện

Tại phiên tòa phúc thẩm, Chủ tịch Vạn Thịnh Phát – bà Trương Mỹ Lan mong muốn được tạo điều kiện để khắc phục hậu quả nhưng “quan trọng là SCB phải hợp tác”.