Loại mô hình AI này sẽ quan trọng hơn LLM vào năm 2026

Tin tức AI - 14/01/2026 01:12:00

Các nhà lãnh đạo AI đang tập trung vào việc xây dựng các mô hình AI bám sát hơn vào thế giới vật lý và thực tại của chúng ta.

Đa số các sản phẩm AI hiện nay đều được vận hành bởi mô hình ngôn ngữ lớn (LLM). Chúng là nền tảng công nghệ cho các chatbot như ChatGPT và Gemini, giúp tạo ra văn bản tự nhiên như người nói mà bạn thấy trên màn hình. Nhưng đó có thể không phải là công nghệ AI quan trọng nhất.

Sự tiến hóa của AI đã trải qua nhiều giai đoạn, và giai đoạn tiếp theo này sẽ ít tập trung vào việc tạo ra từ ngữ hơn mà chú trọng hơn vào việc thấu hiểu thế giới tự nhiên của chúng ta. Các mô hình thế giới (world models) được xây dựng để chuyển đổi thế giới vật lý của chúng ta -- chẳng hạn như các định luật vật lý, nhận diện vật thể và chuyển động -- thành một bản thiết kế kỹ thuật số mà AI có thể hiểu được.

Bạn có thể sẽ không tương tác với các mô hình thế giới theo cách giống như với công nghệ sử dụng LLM, chẳng hạn như thông qua chatbot. Tuy nhiên, các mô hình thế giới sẽ chứng minh cách AI có thể tạo ra các video thực tế, hướng dẫn robot phẫu thuật và nâng cao khả năng lái xe của các phương tiện tự hành. Chúng là những khối xây dựng quan trọng trong việc phát triển cái gọi là AI vật lý (physical AI) -- công nghệ không chỉ hiểu thế giới của chúng ta mà còn có thể thực hiện các hành động trong đó.

Nhiều người tiên phong trong lĩnh vực AI đã ra dấu hiệu về một sự chuyển dịch sang việc xây dựng mô hình thế giới. Yann LeCun, một chuyên gia AI hàng đầu, gần đây đã rời bỏ vai trò lãnh đạo các nỗ lực AI của Meta để gia nhập một startup tập trung vào việc xây dựng các mô hình thế giới. Fei-Fei Li, người được mệnh danh là mẹ đỡ đầu của AI, đã nói rằng trí tuệ không gian (spatial intelligence) -- khả năng thấu hiểu môi trường vật lý xung quanh -- là ranh giới tiếp theo cho sự đổi mới công nghệ. 

"Trí tuệ không gian sẽ thay đổi cách chúng ta tạo ra và tương tác với thế giới thực và ảo -- cách mạng hóa việc kể chuyện, sáng tạo, robot, khám phá khoa học và hơn thế nữa," bà viết trong một bài đăng trên blog vào tháng 11.

Giám đốc điều hành Nvidia, Jensen Huang, cũng đã dành một phần trong bài phát biểu chính tại CES 2026 của mình cho các nỗ lực của công ty trong lĩnh vực mô hình thế giới. Việc xây dựng một mô hình AI dựa trên các định luật vật lý và thực tế khách quan (ground truth) bắt đầu từ dữ liệu được sử dụng để đào tạo, ông Huang cho biết. 

Các mô hình AI thuộc mọi loại hình đều yêu cầu lượng dữ liệu khổng lồ để xây dựng và tinh chỉnh kết quả đầu ra. Thông thường, các công ty AI dựa vào nội dung do con người thực sự tạo ra -- dù có hoặc không có sự cho phép -- điều này đã dẫn đến các cuộc đối đầu pháp lý lớn. Các mô hình thế giới có thể được xây dựng bằng dữ liệu con người, bao gồm cả các mô phỏng. Dữ liệu đó là thiết yếu để xây dựng các mô hình thế giới có thể lập luận và đưa ra các phán đoán nhân quả.

Mô hình thế giới Cosmos của Nvidia sử dụng văn bản, hình ảnh và video để thấu hiểu thế giới vật lý. Nvidia/Ảnh chụp màn hình bởi CNET

Một lĩnh vực mà Nvidia đang sử dụng các mô hình thế giới là xe tự lái. Trong một buổi demo trực tiếp, Nvidia đã trình diễn cách mô hình thế giới của mình, Cosmos, sử dụng các cảm biến của ô tô để hiểu vị trí của chính nó và của mọi ô tô khác gần đó trên đường để tạo ra video trực tiếp về môi trường xung quanh. Các nhà phát triển có thể sử dụng thông tin đó để chạy các kịch bản, như tai nạn xe hơi, để xem phương tiện sẽ phản ứng như thế nào và thực hiện các cải tiến an toàn cần thiết. Dữ liệu tổng hợp (synthetic data), hay dữ liệu không do con người tạo ra, cũng có thể hữu ích khi kết hợp với các mô hình thế giới để giúp dự đoán các "trường hợp biên" hiếm gặp.

Khi AI tiếp tục được tích hợp vào mọi phần trong cuộc sống trực tuyến của chúng ta, điều quan trọng là nó có thể hiểu thế giới vật lý của chúng ta, thay vì tiếp tục ảo tưởng và mắc lỗi. Những nghiên cứu và đầu tư mới từ các nhà lãnh đạo trong ngành vào trí tuệ không gian, mô hình thế giới và AI vật lý cho thấy ngành công nghiệp này không chỉ đơn thuần là xây dựng thêm các chatbot -- mà đang nỗ lực xây dựng AI bám sát thực tại của chúng ta hơn, thay vì ngược lại.

Nguồn: cnet.com

Tin tức AI

Xem tất cả