Hãy quên đi các chatbot. Tiềm năng thực sự của AI là rẻ, nhanh và nằm ngay trên thiết bị của bạn
Tin tức AI - 26/12/2025 18:45:40
Các trung tâm dữ liệu đám mây xa xôi quá chậm đối với những loại tác vụ mà AI thực sự có thể hữu ích.
Khi tôi nhấn vào ứng dụng Claude AI của Anthropic trên điện thoại và đưa ra một câu lệnh -- ví dụ: "Hãy kể cho tôi nghe một câu chuyện về một chú mèo tinh nghịch" -- có rất nhiều việc xảy ra trước khi kết quả ("Vụ trộm cá ngừ vĩ đại") xuất hiện trên màn hình của tôi.
Yêu cầu của tôi được gửi lên đám mây -- một máy tính trong một trung tâm dữ liệu lớn ở đâu đó -- để được xử lý qua mô hình ngôn ngữ lớn Claude Sonnet 4.5. Mô hình lắp ghép một câu trả lời hợp lý bằng cách sử dụng văn bản dự đoán tiên tiến, dựa trên lượng dữ liệu khổng lồ mà nó đã được huấn luyện. Câu trả lời đó sau đó được định tuyến quay lại iPhone của tôi, xuất hiện từng chữ một, từng dòng một trên màn hình. Nó đã đi hàng trăm, nếu không muốn nói là hàng nghìn dặm và đi qua nhiều máy tính trong hành trình đến và đi từ chiếc điện thoại nhỏ bé của tôi. Và tất cả diễn ra trong vài giây.
Hệ thống này hoạt động tốt nếu việc bạn đang làm không quá quan trọng và tốc độ không thực sự là vấn đề. Tôi có thể đợi vài giây cho câu chuyện nhỏ về Whiskers và chuyến phiêu lưu mạo hiểm của chú trong tủ bếp. Nhưng không phải mọi tác vụ của trí tuệ nhân tạo đều như vậy. Một số yêu cầu tốc độ cực lớn. Nếu một thiết bị AI chuẩn bị cảnh báo ai đó về một vật thể đang chặn đường họ, nó không thể chờ đợi một hoặc hai giây.
Những yêu cầu khác đòi hỏi sự riêng tư hơn. Tôi không quan tâm liệu câu chuyện về chú mèo có đi qua hàng tá máy tính thuộc sở hữu của những người và công ty mà tôi không biết và có thể không tin tưởng hay không. Nhưng còn thông tin sức khỏe hoặc dữ liệu tài chính của tôi thì sao? Tôi có thể muốn giữ kín chúng hơn.
Tốc độ và quyền riêng tư là hai lý do chính khiến các nhà phát triển công nghệ ngày càng chuyển dịch việc xử lý AI ra khỏi các trung tâm dữ liệu lớn của doanh nghiệp và đưa lên các thiết bị cá nhân như điện thoại, máy tính xách tay hoặc đồng hồ thông minh của bạn. Việc này cũng giúp tiết kiệm chi phí: Không cần phải trả tiền cho một đơn vị vận hành trung tâm dữ liệu lớn. Ngoài ra, các mô hình trên thiết bị có thể hoạt động mà không cần kết nối internet.
Nhưng để sự chuyển dịch này khả thi, cần có phần cứng tốt hơn và các mô hình AI hiệu quả hơn -- thường là chuyên biệt hơn. Sự hội tụ của hai yếu tố đó cuối cùng sẽ định hình trải nghiệm của bạn trên các thiết bị như điện thoại nhanh và mượt mà đến mức nào.
Mahadev Satyanarayanan, thường được gọi là Satya, là giáo sư khoa học máy tính tại Đại học Carnegie Mellon. Ông đã nghiên cứu từ lâu về cái gọi là điện toán biên (edge computing) -- khái niệm xử lý và lưu trữ dữ liệu càng gần người dùng thực tế càng tốt. Ông cho biết mô hình lý tưởng cho điện toán biên thực thụ là bộ não con người, vốn không đẩy các tác vụ như thị giác, nhận diện, giọng nói hay trí thông minh lên bất kỳ loại "đám mây" nào. Tất cả đều diễn ra ngay tại đó, hoàn toàn "trên thiết bị".
"Vấn đề là ở đây: Thiên nhiên đã mất một tỷ năm để tiến hóa chúng ta," ông nói với tôi. "Chúng ta không có một tỷ năm để chờ đợi. Chúng ta đang cố gắng thực hiện điều này trong 5 năm hoặc tối đa là 10 năm. Làm thế nào để chúng ta đẩy nhanh quá trình tiến hóa?"
Bạn đẩy nhanh nó bằng AI tốt hơn, nhanh hơn, nhỏ hơn chạy trên phần cứng tốt hơn, nhanh hơn, nhỏ hơn. Và như chúng ta đã thấy với các ứng dụng và thiết bị mới nhất -- bao gồm cả những thiết bị dự kiến ra mắt tại CES 2026 -- quá trình này đang diễn ra tốt đẹp.
AI trên thiết bị không còn là điều mới mẻ. Bạn còn nhớ vào năm 2017, lần đầu tiên bạn có thể mở khóa iPhone bằng cách giữ nó trước mặt mình không? Công nghệ nhận dạng khuôn mặt đó đã sử dụng một công cụ thần kinh (neural engine) trên thiết bị – đó không phải là AI tạo sinh như Claude hay ChatGPT, nhưng nó là trí tuệ nhân tạo nền tảng.
Các dòng iPhone ngày nay sử dụng mô hình AI trên thiết bị mạnh mẽ và linh hoạt hơn nhiều. Nó có khoảng 3 tỷ tham số -- các phép tính riêng lẻ về trọng số được đưa vào một xác suất trong một mô hình ngôn ngữ. Con số này tương đối nhỏ so với các mô hình đa mục tiêu lớn mà hầu hết các chatbot AI đang chạy. Ví dụ, Deepseek-R1 có 671 tỷ tham số. Nhưng nó không được thiết kế để làm mọi thứ. Thay vào đó, nó được xây dựng cho các tác vụ cụ thể trên thiết bị như tóm tắt tin nhắn. Giống như công nghệ nhận dạng khuôn mặt để mở khóa điện thoại, đây là thứ không thể phụ thuộc vào kết nối internet để chạy một mô hình trên đám mây.
Apple đã tăng cường khả năng AI trên thiết bị của mình -- được gọi là Apple Intelligence -- để bao gồm các tính năng nhận dạng hình ảnh, như cho phép bạn tra cứu những thứ bạn đã chụp ảnh màn hình.
Các mô hình AI trên thiết bị có ở khắp mọi nơi. Điện thoại Pixel của Google chạy mô hình Gemini Nano của công ty trên chip Tensor G5 tùy chỉnh. Mô hình đó cung cấp sức mạnh cho các tính năng như Magic Cue, giúp hiển thị thông tin từ email, tin nhắn và nhiều thứ khác của bạn -- ngay khi bạn cần -- mà không cần bạn phải tìm kiếm thủ công.
Các nhà phát triển điện thoại, máy tính xách tay, máy tính bảng và phần cứng bên trong chúng đang xây dựng các thiết bị có tính đến AI. Nhưng nó không chỉ dừng lại ở đó. Hãy nghĩ về những chiếc đồng hồ và kính thông minh, vốn có không gian hạn chế hơn nhiều so với cả chiếc điện thoại mỏng nhất?
"Các thách thức về hệ thống là rất khác nhau," Vinesh Sukumar, trưởng bộ phận AI tạo sinh và học máy tại Qualcomm cho biết. "Liệu tôi có thể thực hiện tất cả điều đó trên mọi thiết bị không?"
Hiện tại, câu trả lời thường là không. Giải pháp khá đơn giản. Khi một yêu cầu vượt quá khả năng của mô hình, nó sẽ chuyển tác vụ sang một mô hình dựa trên đám mây. Nhưng tùy thuộc vào cách quản lý quá trình bàn giao đó, nó có thể làm giảm đi một trong những lợi ích chính của AI trên thiết bị: giữ toàn bộ dữ liệu trong tay bạn.
Các chuyên gia liên tục chỉ ra quyền riêng tư và bảo mật là những ưu điểm then chốt của AI trên thiết bị. Trong tình huống đám mây, dữ liệu bay khắp nơi và đối mặt với nhiều khoảnh khắc dễ bị tổn thương hơn. Nếu nó nằm trên ổ đĩa điện thoại hoặc máy tính xách tay được mã hóa, nó sẽ dễ dàng bảo mật hơn nhiều.
Dữ liệu được các mô hình AI của thiết bị sử dụng có thể bao gồm những thứ như sở thích, lịch sử duyệt web hoặc thông tin vị trí của bạn. Mặc dù tất cả những điều đó đều cần thiết để AI cá nhân hóa trải nghiệm dựa trên sở thích của bạn, nhưng đó cũng là loại thông tin mà bạn có thể không muốn rơi vào tay kẻ xấu.
"Những gì chúng tôi đang nỗ lực thực hiện là đảm bảo người dùng có quyền truy cập và là chủ sở hữu duy nhất của dữ liệu đó," Sukumar nói.

Apple Intelligence đã mang đến cho Siri một diện mạo mới trên iPhone. Numi Prasarn/CNET
Có một vài cách khác nhau để xử lý việc chuyển giao thông tin nhằm bảo vệ quyền riêng tư của bạn. Một yếu tố quan trọng là bạn phải cấp quyền để việc đó xảy ra. Sukumar cho biết mục tiêu của Qualcomm là đảm bảo mọi người được thông tin và có khả năng từ chối khi một mô hình đạt đến giới hạn cần chuyển giao lên đám mây.
Một cách tiếp cận khác -- và là cách có thể hoạt động song song với yêu cầu cấp quyền của người dùng -- là đảm bảo mọi dữ liệu gửi lên đám mây đều được xử lý an toàn, nhanh chóng và tạm thời. Ví dụ, Apple sử dụng công nghệ mà họ gọi là Private Cloud Compute. Dữ liệu được chuyển giao chỉ được xử lý trên các máy chủ của riêng Apple, chỉ những dữ liệu tối thiểu cần thiết cho tác vụ mới được gửi đi và không có dữ liệu nào được lưu trữ hoặc cho phép Apple truy cập.
Các mô hình AI chạy trên thiết bị đi kèm với một lợi thế cho cả nhà phát triển ứng dụng và người dùng ở chỗ chi phí duy trì việc vận hành chúng về cơ bản là bằng không. Không có công ty dịch vụ đám mây nào để chi trả cho năng lượng và sức mạnh tính toán. Tất cả đều nằm trong điện thoại của bạn. Túi của bạn chính là trung tâm dữ liệu.
Đó là điều đã thu hút Charlie Chapman, nhà phát triển ứng dụng tạo tiếng ồn có tên Dark Noise, sử dụng Foundation Models Framework của Apple cho một công cụ cho phép bạn tạo ra một bản phối âm thanh. Mô hình AI trên thiết bị không tạo ra âm thanh mới, chỉ chọn các âm thanh hiện có và mức âm lượng khác nhau để tạo thành một bản phối.
Vì AI đang chạy trên thiết bị, nên không có chi phí duy trì khi bạn tạo các bản phối của mình. Đối với một nhà phát triển nhỏ như Chapman, điều đó có nghĩa là có ít rủi ro hơn liên quan đến quy mô cơ sở người dùng của ứng dụng. "Nếu một người có sức ảnh hưởng nào đó ngẫu nhiên đăng bài về nó và tôi nhận được một lượng người dùng miễn phí khổng lồ, điều đó không có nghĩa là tôi sẽ đột ngột phá sản," Chapman nói.
Việc AI trên thiết bị thiếu đi các chi phí duy trì cho phép các tác vụ nhỏ, lặp đi lặp lại như nhập dữ liệu được tự động hóa mà không tốn kém chi phí lớn hay các hợp đồng tính toán, Chapman cho biết. Nhược điểm là các mô hình trên thiết bị khác nhau tùy thuộc vào thiết bị, vì vậy các nhà phát triển sẽ phải nỗ lực nhiều hơn nữa để đảm bảo ứng dụng của họ hoạt động trên các phần cứng khác nhau.
Càng nhiều tác vụ AI được xử lý trên các thiết bị tiêu dùng, các công ty AI càng ít phải chi tiêu cho việc xây dựng các trung tâm dữ liệu khổng lồ vốn đang khiến mọi công ty công nghệ lớn phải tranh giành tiền mặt và chip máy tính. "Chi phí cơ sở hạ tầng là rất lớn," Sukumar nói. "Nếu bạn thực sự muốn thúc đẩy quy mô, bạn sẽ không muốn đẩy gánh nặng chi phí đó đi."
Đặc biệt là khi nói đến các chức năng trên các thiết bị như kính, đồng hồ và điện thoại, phần lớn tính hữu ích thực sự của AI và học máy không giống như chatbot mà tôi đã sử dụng để tạo câu chuyện về mèo ở đầu bài viết này. Đó là những thứ như nhận dạng vật thể, điều hướng và dịch thuật. Những thứ đó đòi hỏi các mô hình và phần cứng chuyên dụng hơn -- nhưng chúng cũng đòi hỏi tốc độ cao hơn.
Satya, giáo sư trường Carnegie Mellon, đã nghiên cứu các mục đích sử dụng khác nhau của mô hình AI và liệu chúng có thể hoạt động chính xác và đủ nhanh bằng cách sử dụng các mô hình trên thiết bị hay không. Khi nói đến phân loại hình ảnh vật thể, công nghệ ngày nay đang hoạt động khá tốt -- nó có thể đưa ra kết quả chính xác trong vòng 100 mili giây. "Năm năm trước, chúng ta chưa thể đạt được độ chính xác và tốc độ như vậy," ông nói.

Ảnh chụp màn hình cắt từ cảnh quay video được ghi lại bằng kính AI Oakley Meta Vanguard này cho thấy các chỉ số tập luyện được lấy từ đồng hồ Garmin đi kèm. Vanessa Hand Orellana/CNET
Nhưng đối với bốn tác vụ khác -- phát hiện vật thể, phân đoạn tức thời (khả năng nhận diện vật thể và hình dạng của chúng), nhận diện hoạt động và theo dõi vật thể -- các thiết bị vẫn cần chuyển giao cho một máy tính mạnh hơn ở nơi khác.
"Tôi nghĩ trong vài năm tới, khoảng 5 năm nữa, sẽ rất thú vị khi các nhà cung cấp phần cứng tiếp tục cố gắng điều chỉnh các thiết bị di động tốt hơn cho AI," Satya nói. "Đồng thời, chúng ta cũng có chính các thuật toán AI đang trở nên mạnh mẽ hơn, chính xác hơn và đòi hỏi nhiều khả năng tính toán hơn."
Cơ hội là vô cùng lớn. Satya cho biết các thiết bị trong tương lai có thể sử dụng thị giác máy tính để cảnh báo trước khi bạn vấp phải chỗ thanh toán không bằng phẳng hoặc nhắc nhở bạn đang nói chuyện với ai và cung cấp bối cảnh xung quanh các cuộc trao đổi trước đây của bạn với họ. Những loại hình này sẽ yêu cầu AI chuyên biệt hơn và phần cứng chuyên dụng hơn.
"Những điều này sẽ xuất hiện," Satya nói. "Chúng ta có thể thấy chúng ở phía chân trời, nhưng chúng vẫn chưa xuất hiện ở đây."
"