Meta vừa ra mắt Llama 4, dòng mô hình trí tuệ nhân tạo (AI) mới dựa trên kiến trúc Mixture of Experts (MoE). Llama 4 được thiết kế để cạnh tranh trực tiếp với các hệ thống hàng đầu như GPT – 4o và Gemini 2.5 Pro. Điểm nổi bật của Llama 4 là tính chất mã nguồn mở, cho phép cộng đồng truy cập và tùy chỉnh.
Dòng sản phẩm Llama 4 bao gồm ba mô hình chính: Llama 4 Scout, một mô hình đa phương thức nhẹ nhưng mạnh mẽ; Llama 4 Maverick, mô hình hiệu suất cao được cho là vượt trội hơn DeepSeek – V3 trong các bài kiểm tra; và Llama 4 Behemoth, mô hình với 2 nghìn tỷ tham số, dự kiến sẽ vượt qua GPT – 4.5. Hiện tại, Meta chưa chính thức phát hành Llama 4 Behemoth.
Một trong những đặc điểm nổi bật của Llama 4 là hiệu suất tính toán. Cả Llama 4 Scout và Maverick đều có thể hoạt động trên một GPU H100 duy nhất, giúp giảm chi phí so với các đối thủ. Meta cũng cung cấp mức giá API thấp hơn, có thể thay đổi cách các công ty tiếp cận và triển khai AI.
Llama 4 được thiết kế để xử lý các câu hỏi nhạy cảm về chính trị và xã hội một cách hiệu quả hơn. Không giống như phiên bản trước, Llama 3.3 từ chối 7% các yêu cầu như vậy, Llama 4 chỉ từ chối dưới 2%, giảm thiểu thiên vị chính trị và thể hiện sự cân bằng với các mô hình cạnh tranh như Grok của xAI. Meta nhấn mạnh nỗ lực giảm thiểu thiên vị và tạo ra AI có khả năng trình bày cả hai mặt của các vấn đề nhạy cảm.
Tuy nhiên, Meta đã gặp phải tranh cãi khi bị phát hiện sử dụng phiên bản thử nghiệm của Maverick, được tối ưu hóa cho trò chuyện nhưng không công khai để đạt điểm cao trên bảng xếp hạng AI LMArena. Điều này làm dấy lên lo ngại về tính minh bạch trong đánh giá mô hình AI. Meta bảo vệ hành động của mình bằng cách nhấn mạnh ý định thử nghiệm các biến thể mô hình khác nhau và khẳng định không có việc đào tạo trên tập kiểm tra.
Việc ra mắt Llama 4 cho thấy Meta đang đầu tư mạnh mẽ vào lĩnh vực AI, với cam kết chi 65 tỷ USD cho các sáng kiến AI. Các chatbot Meta AI hiện đã thu hút 600 triệu người dùng hàng tháng trên các nền tảng như Facebook, Instagram và WhatsApp. Chiến lược mã nguồn mở của Meta không chỉ thúc đẩy đổi mới trong AI mà còn đặt ra thách thức cho các đối thủ như OpenAI và Google, những công ty áp dụng mô hình thương mại hóa thông qua API.
Tuy nhiên, cách tiếp cận này cũng gây ra tranh cãi. Một số chuyên gia lo ngại rằng việc cung cấp miễn phí các mô hình AI mạnh mẽ có thể tăng nguy cơ bảo mật, cho phép tội phạm mạng lợi dụng công nghệ AI cho mục đích xấu. Mặc dù Meta đã cố gắng thiết lập các rào cản kỹ thuật để ngăn chặn hành vi sai trái, việc kiểm soát hoàn toàn các mô hình này vẫn là thách thức lớn.
Xem thêm: DeepSeek giới thiệu mô hình AI DeepSeek-V3-0324