Thụy Sĩ đã phát hành Apertus, một mô hình AI mã nguồn mở với thiết kế, dữ liệu huấn luyện và mã nguồn có sẵn cho công chúng sử dụng.
Một nhóm các tổ chức Thụy Sĩ đã phát hành một mô hình AI mã nguồn mở mới, được thiết kế để làm nền tảng cho các nghiên cứu và ứng dụng trong tương lai. Được xây dựng bởi EPFL, ETH Zurich và Trung tâm Siêu máy tính Quốc gia Thụy Sĩ (CSCS), mô hình này được đặt tên là Apertus – trong tiếng Latin có nghĩa là “mở.” Tên gọi này phản ánh nguyên tắc cốt lõi của nó: mọi phần trong thiết kế và quy trình huấn luyện đều có thể tiếp cận công khai.
Các nhà phát triển và tổ chức có thể sử dụng Apertus để tạo chatbot, công cụ dịch thuật hoặc ứng dụng tập trung vào giáo dục. Nó có thể được tải xuống trực tiếp từ Hugging Face hoặc truy cập thông qua Swisscom, một đối tác chiến lược của sáng kiến. Hai phiên bản có sẵn – một mô hình 8 tỷ tham số và một phiên bản lớn hơn 70 tỷ tham số. Cả hai đều được phát hành theo giấy phép mã nguồn mở tự do, cho phép sử dụng trong các dự án nghiên cứu, giáo dục và thương mại.
Không giống như các hệ thống AI khác chỉ tiết lộ một số chi tiết chọn lọc, Apertus là một mô hình AI hoàn toàn mở, với kiến trúc, dữ liệu huấn luyện và tài liệu có sẵn để kiểm tra.
“Với bản phát hành này, chúng tôi mong muốn cung cấp một lộ trình về cách một mô hình AI đáng tin cậy, tự chủ và toàn diện có thể được phát triển,” Martin Jaggi, Giáo sư Học máy tại EPFL và thành viên Ban chỉ đạo Sáng kiến AI Thụy Sĩ, cho biết. Ông nói rằng Apertus sẽ được cập nhật thường xuyên bởi một nhóm kỹ sư và nhà nghiên cứu từ CSCS, ETH Zurich và EPFL.
Thomas Schulthess, Giám đốc CSCS và Giáo sư tại ETH Zurich, mô tả Apertus là “một động lực đổi mới và là phương tiện để tăng cường chuyên môn AI trong nghiên cứu, xã hội và công nghiệp.” Ông cho biết dự án này không phải là một sự chuyển giao công nghệ điển hình từ nghiên cứu sang sản phẩm, mà là một nỗ lực xây dựng cơ sở hạ tầng để sử dụng lâu dài.
Quá trình huấn luyện bao gồm 15 nghìn tỷ token bằng hơn 1.000 ngôn ngữ, với khoảng 40% dữ liệu không phải tiếng Anh. Apertus bao gồm các ngôn ngữ thường bị bỏ qua trong các LLM, như tiếng Đức Thụy Sĩ và tiếng Romansh.
“Apertus được xây dựng vì lợi ích công cộng. Nó là một trong số ít LLM hoàn toàn mở ở quy mô này và là mô hình đầu tiên thuộc loại này thể hiện tính đa ngôn ngữ, minh bạch và tuân thủ như các nguyên tắc thiết kế nền tảng,” Imanol Schlag, trưởng nhóm kỹ thuật của dự án và Nhà khoa học nghiên cứu tại ETH Zurich, cho biết.
Swisscom đã triển khai Apertus trên nền tảng AI có chủ quyền của mình. “Điều này nhấn mạnh cam kết của chúng tôi trong việc định hình một hệ sinh thái AI an toàn và có trách nhiệm, phục vụ lợi ích công cộng và tăng cường chủ quyền kỹ thuật số của Thụy Sĩ,” Daniel Dobos, Giám đốc Nghiên cứu tại Swisscom, cho biết.
Mặc dù việc tải xuống Apertus rất đơn giản đối với người dùng có kinh nghiệm, việc sử dụng thực tế đòi hỏi máy chủ, tài nguyên đám mây hoặc các giao diện chuyên dụng. Các nhà phát triển sẽ có thể thử nghiệm Apertus trong Tuần lễ AI Thụy Sĩ (Swiss {ai} Weeks) kéo dài đến ngày 5 tháng 10 năm 2025. Những người tham gia Hackathon sẽ có quyền truy cập thông qua giao diện do Swisscom cung cấp. Khách hàng doanh nghiệp của Swisscom cũng có thể bắt đầu sử dụng mô hình này ngay hôm nay thông qua nền tảng AI của công ty. Đối với người dùng quốc tế, Apertus sẽ có sẵn thông qua Public AI Inference Utility.
“Hiện tại, Apertus là mô hình AI công cộng hàng đầu: một mô hình được xây dựng bởi các tổ chức công, vì lợi ích công cộng. Đây là bằng chứng tốt nhất của chúng tôi cho thấy AI có thể là một dạng cơ sở hạ tầng công cộng như đường cao tốc, nước hoặc điện,” Joshua Tan, Trưởng nhóm bảo trì của Public AI Inference Utility, cho biết.
Theo giấy phép mã nguồn mở, dữ liệu huấn luyện, trọng số mô hình và các điểm kiểm tra trung gian đều có sẵn. Quá trình huấn luyện mô hình tuân thủ các quy tắc bảo vệ dữ liệu của Thụy Sĩ, luật bản quyền của Thụy Sĩ và các yêu cầu minh bạch của Đạo luật AI của EU.
Tập dữ liệu được giới hạn trong các thông tin có sẵn công khai, được lọc để loại bỏ dữ liệu cá nhân và tôn trọng các yêu cầu từ chối của trang web. Các nguyên tắc đạo đức cũng được áp dụng để loại trừ các tài liệu không mong muốn trước khi bắt đầu huấn luyện.
“Apertus chứng minh rằng AI tạo sinh có thể vừa mạnh mẽ vừa mở,” Antoine Bosselut, Giáo sư tại EPFL và đồng Trưởng nhóm Sáng kiến AI Thụy Sĩ, cho biết. “Việc phát hành Apertus không phải là một bước cuối cùng, mà là sự khởi đầu của một hành trình, một cam kết dài hạn đối với các nền tảng AI mở, đáng tin cậy và có chủ quyền, vì lợi ích công cộng trên toàn thế giới.”
Các bản cập nhật trong tương lai nhằm mục đích mở rộng họ mô hình, cải thiện hiệu quả và phát triển các công cụ chuyên biệt cho các lĩnh vực như luật pháp, y tế, khí hậu và giáo dục – đồng thời tiếp tục duy trì các tiêu chuẩn minh bạch nghiêm ngặt.