Tencent ra mắt bốn mẫu Hunyuan mã nguồn mở nhỏ gọn với các tham số 0.5B, 1.8B, 4B và 7B

Tin tức AI - 04/08/2025 19:41:00

Tencent đã công khai mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ nhỏ gọn với các tham số 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ, có thể chạy trên một GPU tiêu dùng duy nhất.

Tencent đã mở mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ mã nguồn mở nhỏ gọn (Nguồn ảnh: Tencent)

Tencent đã công khai mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ nhỏ gọn với các tham số 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ, có thể chạy trên một GPU tiêu dùng duy nhất.

Tencent đã phát hành một bộ mô hình Hunyuan nhỏ gọn mới: 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ tham số; chúng hướng tới các triển khai năng lượng thấp và biên. Cả bốn cấu hình hiện đã có sẵn trên GitHub và Hugging Face, và mỗi cấu hình đều có thể chạy suy luận trên một card đồ họa tiêu dùng duy nhất, khiến chúng phù hợp cho máy tính xách tay, điện thoại thông minh, hệ thống khoang lái thông minh và các phần cứng bị hạn chế tài nguyên khác.

Mặc dù kích thước nhỏ, các mô hình này vẫn đạt được điểm số hàng đầu trong khả năng hiểu ngôn ngữ, toán học và lập luận trên nhiều điểm chuẩn công khai. Tencent cho rằng những kết quả này là nhờ kiến trúc "lập luận kết hợp" cho phép người dùng lựa chọn giữa chế độ suy nghĩ nhanh để có câu trả lời súc tích và chế độ suy nghĩ chậm để lập luận đa bước chi tiết hơn.

Một tính năng kỹ thuật quan trọng là cửa sổ ngữ cảnh 256K token gốc, đủ để nạp khoảng 500.000 từ tiếng Anh trong một lần. Tencent nhấn mạnh các ứng dụng nội bộ như Tencent Meeting và WeChat Reading, nơi các mô hình có thể phân tích toàn bộ bản ghi cuộc họp hoặc một cuốn sách đầy đủ ngay lập tức, duy trì mối quan hệ nhân vật và chi tiết cốt truyện cho các truy vấn tiếp theo.

Bốn LLM nhỏ gọn này tích hợp với các framework suy luận chính thống, bao gồm SGLang, vLLM và TensorRT-LLM, đồng thời hỗ trợ nhiều định dạng lượng tử hóa. Sự chứng thực ban đầu từ Arm, Qualcomm, Intel và MediaTek cho thấy các gói triển khai được tối ưu hóa cho bộ xử lý khách hàng tương ứng của họ sẽ sớm ra mắt.

Các trường hợp sử dụng ban đầu nhấn mạnh trọng tâm thực tế của bản phát hành. Tencent Mobile Manager báo cáo khả năng chặn thư rác ở cấp độ mili giây mà không cần chuyển dữ liệu ra ngoài thiết bị. Đồng thời, một lược đồ hai mô hình trong trợ lý khoang lái thông minh của Tencent cân bằng mức tiêu thụ điện năng trên bo mạch với độ sâu hội thoại. Tencent lập luận rằng những ví dụ này chứng minh rằng các mô hình nhỏ có thể mang lại khả năng tác nhân cấp doanh nghiệp khi được thiết kế một cách chu đáo.

Nguồn: Sưu tầm

Tin tức AI - 18/06/2025 07:39:16

Nghiên cứu đột phá tại Việt Nam kết hợp AI và viễn thám để giám sát chất lượng nước biển, nâng cao bảo vệ môi trường ven bờ.

Tin tức AI - 27/08/2025 18:49:58

AI đang làm thay đổi ngành ngân hàng, nhưng những lợi ích và khoản tiết kiệm được mong đợi đi kèm với cái giá nhân lực rất lớn cùng với tác động đến các công việc tài chính.

Tin tức AI - 19/12/2025 05:22:00

Hai kênh này đã sử dụng AI để tạo các đoạn trailer giả và có tổng cộng 2 triệu người đăng ký, theo Deadline.

Tin tức AI - 11/09/2025 21:19:15

Yext sẽ khám phá tác động lớn của AI đối với tìm kiếm và hành vi người dùng, cũng như cách Scout có thể cung cấp thông tin cho các chuyên gia tiếp thị tại một hội thảo trực tuyến vào tháng 10 năm 2025.

Tin tức AI - 20/08/2025 19:12:12

Vào tháng 3, Yext, nền tảng hàng đầu về khả năng hiển thị thương hiệu, đã ra mắt Yext Scout, một công cụ tìm kiếm AI và tình báo cạnh tranh được thiết kế để mang lại khả năng hiển thị và thông tin chi tiết có thể hành động cho các thương hiệu trên cả nền tảng tìm kiếm truyền thống và AI. Được tích hợp trong nền tảng Yext, Scout cung cấp thông tin chi tiết về khả năng hiển thị trên các nền tảng tìm kiếm truyền thống và AI, so sánh hiệu suất với các đối thủ cạnh tranh, và mang lại […]

Tin tức AI - 30/11/2025 18:30:35

Một công ty khởi nghiệp ở Bắc Carolina đang tận dụng AI để tạo ra các lá thư kháng cáo y tế được cá nhân hóa, có giá trị lâm sàng, giúp cải thiện kết quả cho bệnh nhân.

Tin tức AI - 14/01/2026 18:43:21

Đón đầu các mối đe dọa an ninh mạng bằng AI năm 2026 với các bước thực tế từ IBM. Cách nhận diện kỹ thuật thao túng tâm lý, giảm rủi ro gian lận và các bước thực tế đối với AI không được phê duyệt.

Tin tức AI - 26/08/2025 19:52:12

X và xAI của Elon Musk đang đối đầu với Apple và OpenAI, cáo buộc các gã khổng lồ công nghệ này tạo ra một thế độc quyền AI để triệt tiêu đối thủ cạnh tranh.

Tin tức AI - 11/09/2025 22:28:00

Dự luật này, nếu được thông qua, sẽ cho phép các công ty nộp đơn và nộp lại đơn để được miễn trừ khỏi các quy định về AI trong tối đa 10 năm.

Tin tức AI - 12/11/2025 22:38:00

Bình luận: Chúng ta đang tiến vào một thế giới bão hòa với AI. Với sự tự động hóa ở khắp mọi nơi, tôi tự hỏi điều gì sẽ trở thành nguồn chính cho bản sắc, mục đích và ý nghĩa của chúng ta.