Mô hình AI nghìn tỷ tham số của Ant Group nhắm đến các điểm chuẩn suy luận với chiến lược phát hành kép

Tin tức AI - 16/10/2025 19:00:00

Mô hình AI nghìn tỷ tham số Ling-1T của Ant Group đạt 70,42% trong điểm chuẩn toán học AIME, trong khi framework dInfer hứa hẹn tăng hiệu quả so với các đối thủ cạnh tranh.

Ant Group đã tham gia vào lĩnh vực mô hình AI nghìn tỷ tham số với Ling-1T, một mô hình ngôn ngữ mới được mã nguồn mở mà gã khổng lồ fintech Trung Quốc định vị là một bước đột phá trong việc cân bằng hiệu quả tính toán với khả năng suy luận tiên tiến.

Thông báo ngày 9 tháng 10 đánh dấu một cột mốc quan trọng đối với nhà điều hành Alipay, vốn đã nhanh chóng xây dựng cơ sở hạ tầng trí tuệ nhân tạo của mình trên nhiều kiến trúc mô hình.

Mô hình AI nghìn tỷ tham số thể hiện hiệu suất cạnh tranh trong các tác vụ suy luận toán học phức tạp, đạt độ chính xác 70,42% trên điểm chuẩn American Invitational Mathematics Examination (AIME) năm 2025—một tiêu chuẩn được sử dụng để đánh giá khả năng giải quyết vấn đề của các hệ thống AI.

Theo thông số kỹ thuật của Ant Group, Ling-1T duy trì mức hiệu suất này trong khi tiêu thụ trung bình hơn 4.000 token đầu ra cho mỗi vấn đề, xếp nó ngang hàng với những gì công ty mô tả là “các mô hình AI hàng đầu” về chất lượng kết quả.

Cách tiếp cận song song để phát triển AI

Việc phát hành mô hình AI nghìn tỷ tham số trùng với thời điểm Ant Group ra mắt dInfer, một framework suy luận chuyên biệt được thiết kế cho các mô hình ngôn ngữ diffusion. Chiến lược phát hành song song này phản ánh sự đặt cược của công ty vào nhiều phương pháp công nghệ thay vì một mô hình kiến trúc duy nhất.

Các mô hình ngôn ngữ diffusion thể hiện một sự khác biệt so với các hệ thống tự hồi quy (autoregressive) vốn là nền tảng của các chatbot được sử dụng rộng rãi như ChatGPT. Không giống như việc tạo văn bản tuần tự, các mô hình diffusion tạo ra đầu ra song song—một cách tiếp cận đã phổ biến trong các công cụ tạo ảnh và video nhưng ít phổ biến hơn trong xử lý ngôn ngữ.

Các số liệu hiệu suất của Ant Group đối với dInfer cho thấy mức tăng hiệu quả đáng kể. Thử nghiệm trên mô hình diffusion LLaDA-MoE của công ty đã cho tốc độ 1.011 token mỗi giây trên điểm chuẩn lập trình HumanEval, so với 91 token mỗi giây của framework Fast-dLLM của Nvidia và 294 của mô hình Qwen-2.5-3B của Alibaba chạy trên cơ sở hạ tầng vLLM.

“Chúng tôi tin rằng dInfer cung cấp cả một bộ công cụ thực tế và một nền tảng tiêu chuẩn hóa để đẩy nhanh nghiên cứu và phát triển trong lĩnh vực dLLMs đang phát triển nhanh chóng,” các nhà nghiên cứu tại Ant Group lưu ý trong tài liệu kỹ thuật đi kèm.

Mở rộng hệ sinh thái ngoài các mô hình ngôn ngữ

Mô hình AI nghìn tỷ tham số Ling-1T nằm trong một họ các hệ thống AI rộng lớn hơn mà Ant Group đã tập hợp trong những tháng gần đây.

Danh mục sản phẩm của công ty hiện bao gồm ba dòng chính: các mô hình Ling (không suy nghĩ) cho các tác vụ ngôn ngữ tiêu chuẩn, các mô hình Ring (suy nghĩ) được thiết kế cho suy luận phức tạp (bao gồm cả Ring-1T-preview đã phát hành trước đó), và các mô hình đa phương tiện Ming có khả năng xử lý hình ảnh, văn bản, âm thanh và video.

Cách tiếp cận đa dạng này mở rộng đến một mô hình thử nghiệm được gọi là LLaDA-MoE, sử dụng kiến trúc Mixture-of-Experts (MoE) – một kỹ thuật chỉ kích hoạt các phần liên quan của một mô hình lớn cho các tác vụ cụ thể, về lý thuyết giúp cải thiện hiệu quả.

He Zhengyu, giám đốc công nghệ tại Ant Group, đã trình bày định vị của công ty xung quanh các bản phát hành này. “Tại Ant Group, chúng tôi tin rằng Trí tuệ tổng hợp nhân tạo (AGI) nên là một lợi ích chung – một cột mốc chung cho tương lai thông minh của nhân loại,” ông He tuyên bố, đồng thời cho biết việc phát hành mã nguồn mở cả mô hình AI nghìn tỷ tham số và Ring-1T-preview đại diện cho các bước hướng tới “tiến bộ mở và hợp tác.”

Động lực cạnh tranh trong môi trường hạn chế

Thời điểm và bản chất của các bản phát hành của Ant Group làm sáng tỏ những tính toán chiến lược trong lĩnh vực AI của Trung Quốc. Với việc tiếp cận công nghệ bán dẫn tiên tiến bị hạn chế bởi các lệnh cấm xuất khẩu, các công ty công nghệ Trung Quốc ngày càng nhấn mạnh đổi mới thuật toán và tối ưu hóa phần mềm như những yếu tố khác biệt cạnh tranh.

ByteDance, công ty mẹ của TikTok, tương tự đã giới thiệu một mô hình ngôn ngữ diffusion có tên Seed Diffusion Preview vào tháng 7, tuyên bố cải thiện tốc độ gấp năm lần so với các kiến trúc tự hồi quy tương đương. Những nỗ lực song song này cho thấy sự quan tâm trên toàn ngành đối với các mô hình thay thế có thể mang lại lợi thế về hiệu quả.

Tuy nhiên, quỹ đạo áp dụng thực tế cho các mô hình ngôn ngữ diffusion vẫn còn không chắc chắn. Các hệ thống tự hồi quy tiếp tục thống trị các triển khai thương mại do hiệu suất đã được chứng minh trong việc hiểu và tạo ngôn ngữ tự nhiên—các yêu cầu cốt lõi cho các ứng dụng hướng tới khách hàng.

Chiến lược mã nguồn mở như một định vị thị trường

Bằng cách công khai mô hình AI nghìn tỷ tham số cùng với framework dInfer, Ant Group đang theo đuổi một mô hình phát triển hợp tác, trái ngược với cách tiếp cận đóng của một số đối thủ cạnh tranh.

Chiến lược này có khả năng thúc đẩy đổi mới đồng thời định vị các công nghệ của Ant là cơ sở hạ tầng nền tảng cho cộng đồng AI rộng lớn hơn.

Công ty đồng thời đang phát triển AWorld, một framework nhằm hỗ trợ học tập liên tục trong các tác nhân AI tự chủ—các hệ thống được thiết kế để hoàn thành các tác vụ độc lập thay mặt người dùng.

Liệu những nỗ lực kết hợp này có thể thiết lập Ant Group như một lực lượng đáng kể trong phát triển AI toàn cầu hay không phụ thuộc một phần vào việc xác nhận thực tế các tuyên bố về hiệu suất và một phần vào tỷ lệ chấp nhận của các nhà phát triển đang tìm kiếm các giải pháp thay thế cho các nền tảng đã có.

Bản chất mã nguồn mở của mô hình AI nghìn tỷ tham số có thể tạo điều kiện thuận lợi cho quá trình xác nhận này đồng thời xây dựng một cộng đồng người dùng quan tâm đến sự thành công của công nghệ.

Hiện tại, các bản phát hành cho thấy các công ty công nghệ lớn của Trung Quốc xem bối cảnh AI hiện tại đủ linh hoạt để tiếp nhận những người chơi mới sẵn sàng đổi mới trên nhiều khía cạnh cùng lúc.

Nguồn: Sưu tầm