Tại sao mô hình thế giới là bước tiến lớn tiếp theo của AI

Tin tức AI - 25/01/2026 00:09:36

Từ CES đến Davos, các nhà lãnh đạo công nghệ đều đang thảo luận về mô hình thế giới như là giai đoạn phát triển tiếp theo của AI.

LLM, hay các mô hình ngôn ngữ lớn, là nền tảng công nghệ của AI ngày nay. Các chatbot như ChatGPT và Gemini sử dụng LLM để tạo ra văn bản có âm hưởng tự nhiên mà bạn thấy trên màn hình. Nhưng LLM có thể không phải là công nghệ AI mang lại tầm ảnh hưởng lớn nhất.

"Những LLM này sẽ là một thành phần cực kỳ quan trọng của hệ thống AI hoàn chỉnh," CEO của Google DeepMind, Demis Hassabis, chia sẻ với Bloomberg tại Diễn đàn Kinh tế Thế giới. "Câu hỏi duy nhất trong đầu tôi là, liệu đó có phải là thành phần duy nhất?"

Hassabis tiếp tục nói về việc các đột phá khác sẽ xuất hiện để đảm bảo thế hệ hệ thống AI tiếp theo hoạt động cùng nhau một cách liền mạch. Một trong những đột phá "rất quan trọng" đó là các mô hình thế giới. Các mô hình thế giới được xây dựng để chuyển đổi thế giới vật lý của chúng ta -- chẳng hạn như các định luật vật lý, nhận diện vật thể và chuyển động -- thành một bản thiết kế kỹ thuật số mà AI có thể hiểu được. Nó ít quan tâm đến việc tạo ra câu chữ mà tập trung nhiều hơn vào việc thấu hiểu thế giới tự nhiên của chúng ta, một điều mà các mô hình AI hiện nay vẫn còn hạn chế.

Bạn có thể sẽ không tương tác với các mô hình thế giới theo cùng cách bạn làm với công nghệ dựa trên LLM, như thông qua chatbot. Tuy nhiên, các mô hình thế giới sẽ chứng minh cách AI có thể tạo ra các video thực tế, dẫn đường cho robot phẫu thuật và nâng cao khả năng lái của các phương tiện tự hành. Chúng là những viên gạch quan trọng trong việc phát triển cái gọi là AI vật lý -- loại công nghệ không chỉ hiểu thế giới của chúng ta mà còn có thể thực hiện các hành động trong đó.

Nhiều người tiên phong trong lĩnh vực AI đã ra dấu hiệu về một sự chuyển dịch hướng tới việc xây dựng mô hình thế giới. Yann LeCun, một người tiên phong hàng đầu về AI, gần đây đã rời bỏ vai trò lãnh đạo các nỗ lực AI của Meta để gia nhập một startup tập trung vào việc xây dựng các mô hình thế giới. Fei-Fei Li, người thường được gọi là mẹ đỡ đầu của AI, đã nói rằng trí tuệ không gian -- khả năng thấu hiểu môi trường vật lý của bạn -- là ranh giới tiếp theo cho sự đổi mới công nghệ. 

"Trí tuệ không gian sẽ thay đổi cách chúng ta tạo ra và tương tác với thế giới thực và ảo -- cách mạng hóa việc kể chuyện, sáng tạo, robot, khám phá khoa học và hơn thế nữa," bà đã viết trong một bài đăng trên blog vào tháng 11.

CEO của Nvidia, Jensen Huang, cũng dành một phần bài thuyết trình chính tại CES 2026 cho những nỗ lực của công ty trong lĩnh vực mô hình thế giới. Việc xây dựng một mô hình AI dựa trên các định luật vật lý và thực tế khách quan bắt đầu từ dữ liệu được sử dụng để đào tạo, Huang cho biết. 

Các mô hình AI thuộc mọi loại hình đều yêu cầu lượng dữ liệu khổng lồ để xây dựng và tinh chỉnh kết quả đầu ra. Thông thường, các công ty AI dựa vào nội dung do con người tạo ra -- dù có hoặc không có sự cho phép của họ -- điều này đã dẫn đến những cuộc đối đầu pháp lý lớn. Các mô hình thế giới có thể được xây dựng bằng dữ liệu của con người, bao gồm cả các mô phỏng. Dữ liệu đó rất cần thiết để xây dựng các mô hình thế giới có khả năng suy luận và đưa ra các phán đoán về nguyên nhân - kết quả.

Mô hình thế giới Cosmos của Nvidia sử dụng văn bản, hình ảnh và video để thấu hiểu thế giới vật lý. Nvidia/Ảnh chụp màn hình bởi CNET

Một lĩnh vực mà Nvidia đang sử dụng mô hình thế giới là xe tự lái. Trong một buổi trình diễn trực tiếp, Nvidia đã trình bày cách mô hình thế giới Cosmos sử dụng các cảm biến của xe để hiểu vị trí của chính nó và của mọi chiếc xe khác gần đó trên đường để tạo ra một video trực tiếp về môi trường xung quanh. Các nhà phát triển có thể sử dụng thông tin đó để chạy các kịch bản, như tai nạn xe hơi, để xem phương tiện sẽ phản ứng như thế nào và thực hiện các cải tiến an toàn cần thiết. Dữ liệu tổng hợp (synthetic data), hay dữ liệu không do con người tạo ra, cũng có thể hữu ích khi kết hợp với các mô hình thế giới để giúp dự đoán các "trường hợp biên" hiếm gặp.

Khi AI tiếp tục được tích hợp vào mọi phần của cuộc sống trực tuyến, điều thiết yếu là nó có thể hiểu được thế giới vật lý của chúng ta, thay vì tiếp tục ảo giác và mắc lỗi. Những nghiên cứu và khoản đầu tư mới từ các nhà lãnh đạo trong ngành vào trí tuệ không gian, mô hình thế giới và AI vật lý cho thấy ngành này không chỉ dừng lại ở việc xây dựng thêm nhiều chatbot -- họ đang nỗ lực xây dựng AI bám rễ sâu hơn vào thực tế của chúng ta, chứ không phải ngược lại.

Nguồn: cnet.com

Tin tức AI

Xem tất cả