Meta mở mã LLaMA: Cuộc chơi mạo hiểm của gã khổng lồ mạng xã hội trong trận chiến AI
11/06/25
![]() |
Ảnh: Andrea Chronopoulos |
Meta tung “vũ khí chiến lược” ra cộng đồng
Tháng Hai vừa qua, Meta – tập đoàn sở hữu Facebook, Instagram và WhatsApp – đã thực hiện một động thái gây chấn động giới công nghệ khi công khai mã nguồn của LLaMA, một mô hình ngôn ngữ lớn (LLM) tiên tiến do hãng phát triển. Đây là công nghệ có khả năng tạo ra văn bản, đoạn hội thoại, mã lập trình hoặc nội dung đa phương tiện một cách tự động, tương tự như ChatGPT của OpenAI.
Thay vì giữ bí mật để tạo lợi thế thương mại, Meta đã chia sẻ toàn bộ mã nguồn LLaMA dưới dạng phần mềm mã nguồn mở, đồng thời cấp quyền tải xuống trọng số huấn luyện – phần dữ liệu huấn luyện hàng tỷ từ giúp mô hình hoạt động hiệu quả.
LLaMA và trọng số huấn luyện: Vượt qua rào cản chi phí
Điểm then chốt trong nước đi của Meta là việc công khai trọng số (weights). Đây là phần dữ liệu chứa các giá trị toán học mà mô hình học được trong quá trình huấn luyện – thứ thường tốn hàng triệu USD và hàng trăm GPU để có được.
Việc công bố weights cho phép bất kỳ cá nhân, nhóm nghiên cứu hay startup nào cũng có thể:
- Tái triển khai mô hình với chi phí thấp.
- Không cần huấn luyện lại từ đầu.
- Tùy chỉnh mô hình theo mục đích riêng.
Chỉ cần đăng ký email và được Meta xác minh, người dùng có thể tải xuống toàn bộ mã lẫn weights để xây dựng chatbot hay hệ thống AI riêng.
Chiến lược “mở” đối lập với các ông lớn còn lại
Trong khi OpenAI và Google chọn chiến lược bảo mật tuyệt đối – chỉ cung cấp AI dưới dạng API tính phí và kiểm soát nghiêm ngặt – Meta lại chủ động tự nguyện mở cửa hậu trường.
Yann LeCun, nhà khoa học trưởng về AI của Meta, tuyên bố: “Nền tảng chiến thắng sẽ là nền tảng mở.” Ông khẳng định rằng một hệ sinh thái AI bền vững, nhanh nhạy và phát triển mạnh mẽ chỉ có thể được xây dựng khi công nghệ được chia sẻ rộng rãi.
Lo ngại và phản đối từ giới công nghệ
Ngay sau khi Meta phát hành LLaMA, một bản sao của mô hình đã bị rò rỉ lên 4chan, một diễn đàn khét tiếng với nội dung cực đoan. Sự cố này làm dấy lên lo ngại về khả năng công nghệ bị lạm dụng.
Zoubin Ghahramani, Phó Chủ tịch nghiên cứu tại Google, cho biết: “Chúng ta cần suy nghĩ nghiêm túc về hậu quả nếu mã nguồn AI bị sử dụng sai mục đích.” Một bản ghi nhớ nội bộ của Google thậm chí còn cảnh báo rằng mã nguồn mở như LLaMA có thể khiến Google và OpenAI mất vị trí dẫn đầu trong cuộc đua AI.
Tại Đại học Stanford, các nhà nghiên cứu đã sử dụng LLaMA để phát triển một chatbot thử nghiệm. Nhưng chỉ trong thời gian ngắn, mô hình này đã sinh ra văn bản độc hại: hướng dẫn phi tang xác chết, nội dung kỳ thị chủng tộc và phát ngôn ủng hộ Hitler. Dự án bị gỡ bỏ ngay lập tức khỏi internet.
Meta phản hồi: Công nghệ không phải vấn đề – kênh phân phối mới là điểm mấu chốt.
Yann LeCun phản bác rằng nội dung độc hại luôn tồn tại – không cần đến AI mới tạo ra được. Theo ông, vấn đề không phải là ngăn chặn mô hình hoạt động, mà là kiểm soát kênh lan truyền thông tin độc hại, như các mạng xã hội.
“Bạn không thể ngăn người ta tạo ra nội dung nguy hiểm, nhưng bạn có thể ngăn nó lan truyền,” LeCun nói. Ông cũng đặt câu hỏi ngược lại: “Bạn có muốn tất cả hệ thống AI trên thế giới bị kiểm soát bởi vài công ty Mỹ không?”
Lịch sử lập lại: Android vs. iOS trong phiên bản AI
Chiến lược của Meta được ví như bước đi của Google năm 2008 khi phát hành hệ điều hành Android mã nguồn mở để cạnh tranh với iOS của Apple. Họ tin rằng càng nhiều nhà phát triển tham gia xây dựng trên nền LLaMA, Meta càng có khả năng trở thành “nền tảng mặc định” cho kỷ nguyên AI.
Meta hy vọng việc công khai mô hình sẽ:
- Tăng mức độ chấp nhận từ cộng đồng.
- Khuyến khích sáng tạo từ hàng triệu lập trình viên toàn cầu.
- Tạo ra hệ sinh thái AI mở, cạnh tranh với hệ thống khép kín của OpenAI và Microsoft.
Đầu tư mạnh vào hạ tầng AI
Song song với việc mở mã, Meta cũng đầu tư lớn vào cơ sở hạ tầng phục vụ AI, bao gồm:
- Thiết kế chip xử lý AI chuyên dụng.
- Xây dựng siêu máy tính thế hệ mới.
- Phát triển trung tâm dữ liệu tối ưu hóa cho khối lượng tính toán AI.
Mark Zuckerberg cho biết: “Chúng tôi đã đầu tư vào hạ tầng AI nhiều năm qua. Đây là nền tảng để tích hợp AI vào mọi sản phẩm.”
LLaMA: Hệ thống học từ hàng tỷ từ ngữ trên internet
LLaMA hoạt động bằng cách phân tích văn bản khổng lồ từ internet – bao gồm sách, Wikipedia, các diễn đàn và hội thoại – để học cách sử dụng ngôn ngữ giống con người. Mô hình có thể tạo ra:
- Đoạn hội thoại tự nhiên.
- Văn bản học thuật.
- Thơ, truyện, bài viết.
- Đoạn mã lập trình.
Giống như Chat GPT hay Bard, LLaMA là một dạng mô hình sinh ngôn ngữ tổng quát (LLM), nhưng khác ở chỗ: ai cũng có thể truy cập và chạy được nếu có đủ tài nguyên tối thiểu.
Cuộc tái cấu trúc toàn diện AI của Meta
Bên cạnh việc phát hành LLaMA, Meta cũng đang tái cấu trúc toàn bộ hoạt động AI nội bộ. Mark Zuckerberg hiện tổ chức họp chuyên đề AI mỗi tuần với đội ngũ điều hành, cho thấy AI đang là ưu tiên số một chiến lược.
Meta đã gom các nhóm nghiên cứu trước đây thành một hệ thống thống nhất: từ đội nghiên cứu của Yann LeCun cho đến nhóm sản phẩm do Ahmad Al-Dahle dẫn dắt, và gần đây là thành lập thêm một phòng lab AI mới với sự tham gia của Alexandr Wang – nhà sáng lập Scale AI.
Lựa chọn mạo hiểm, nhưng không đơn độc
Dù bị chỉ trích, Meta không phải là công ty duy nhất từng “mở cửa” công nghệ lõi. Trong lịch sử, Linux, Apache, TensorFlow đều là các nền tảng mã nguồn mở tạo ra sức ảnh hưởng sâu rộng. Meta đặt cược rằng AI cũng có thể phát triển theo hướng đó, và LLaMA sẽ là cốt lõi cho thế hệ công cụ phần mềm mới.
shared via nytimes,