GPT-5.2 vừa đạt 75% trên ARC AGI: Hệ thống phân lớp đưa GPT-5.2 vượt mức trung bình của con người

Tin tức AI - 29/12/2025 18:00:46

GPT-5.2 đạt 75% trên ARC AGI2 bằng cách sử dụng hệ thống meta của Poetic với tính năng tự kiểm tra, cho người đọc thấy các vòng lặp cấu trúc có thể thúc đẩy kết quả suy luận như thế nào.

Biểu đồ cho thấy GPT-5.2 đạt 75% trên ARC AGI2 khi hệ thống meta của Poetic hướng dẫn suy luận lặp lại.

Làm thế nào mà GPT-5.2, một mô hình ngôn ngữ, lại đạt được điều mà nhiều người nghĩ rằng phải mất nhiều năm nữa mới có thể? Với số điểm 75% chưa từng có trên điểm chuẩn ARC AGI2, cột mốc này đã tạo ra làn sóng chấn động trong cộng đồng AI. Dưới đây, Universe of AI sẽ phân tích cách một nhóm nhỏ các nhà nghiên cứu tại Poetic thực hiện được kỳ tích này, không phải bằng cách đào tạo GPT-5.2 cho các nhiệm vụ cụ thể, mà bằng cách đưa vào một hệ thống meta mới nhằm thay đổi cách AI tiếp cận chính việc suy luận. Đây không chỉ là một bước nhảy vọt; đó là sự định nghĩa lại về những gì có thể thực hiện được trong trí tuệ nhân tạo. Với hiệu suất trung bình của con người trên điểm chuẩn này là khoảng 60%, thành tựu của GPT-5.2 đặt ra những câu hỏi sâu sắc về tương lai của suy luận máy móc và tiềm năng vượt qua nhận thức của con người trong việc giải quyết các vấn đề phức tạp.

Chúng tôi sẽ khám phá hệ thống meta đổi mới đã giúp tạo ra bước đột phá này. Từ việc giải quyết vấn đề lặp lại đến cơ chế tự kiểm tra, cách tiếp cận của Poetic chuyển trọng tâm từ sức mạnh tính toán thô sang các chiến lược suy luận thông minh hơn, dễ thích nghi hơn. Điều này có ý nghĩa gì đối với khả năng mở rộng của các hệ thống AI? Nó định hình lại quỹ đạo nghiên cứu AI như thế nào? Và có lẽ điều thú vị nhất là, những tác động rộng lớn hơn đối với cách chúng ta định nghĩa về chính trí tuệ là gì? Những câu hỏi này nằm ở trung tâm của thành tựu này, mang đến cái nhìn thoáng qua về một tương lai nơi AI không chỉ bắt chước suy nghĩ của con người mà còn tái hình dung về nó.

GPT-5.2 đạt 75% ARC

Tóm tắt các điểm chính:

  • GPT-5.2 đã đạt được số điểm 75% mới trên điểm chuẩn ARC AGI2, vượt qua mức tiên tiến nhất trước đó 15 điểm phần trăm mà không cần đào tạo hoặc tối ưu hóa theo mô hình cụ thể.
  • Điểm chuẩn ARC AGI kiểm tra trí tuệ tổng quát, yêu cầu giải quyết vấn đề linh hoạt và sáng tạo, trong đó GPT-5.2 vượt xa mức trung bình 60% của con người.
  • Hệ thống meta đổi mới của Poetic tăng cường khả năng suy luận của AI thông qua việc giải quyết vấn đề lặp lại, lựa chọn mô hình động, tự kiểm tra và suy luận có cấu trúc, giúp cải thiện độ chính xác và hiệu quả.
  • Hệ thống meta có khả năng mở rộng và thích ứng, cho phép suy luận nâng cao trên nhiều mô hình AI khác nhau mà không tiêu tốn quá nhiều tài nguyên tính toán hoặc phải đào tạo lại.
  • Thành tựu này báo hiệu một sự thay đổi mô hình trong phát triển AI, tập trung vào việc tối ưu hóa các quy trình suy luận thay vì chỉ tăng kích thước mô hình, mở đường cho những tiến bộ AI hiệu quả và thiết thực hơn.

Tìm hiểu về điểm chuẩn ARC AGI

Các điểm chuẩn ARC AGI được thiết kế để đánh giá khả năng suy luận, trừu tượng hóa và thích ứng của một hệ thống AI, những kỹ năng vượt xa khả năng truy xuất dữ liệu cơ bản hoặc nhận dạng mẫu. Không giống như các điểm chuẩn truyền thống, ARC AGI nhấn mạnh vào trí tuệ tổng quát, yêu cầu các mô hình giải quyết các vấn đề đòi hỏi tư duy linh hoạt và sáng tạo.

Phiên bản thứ hai, ARC AGI2, nâng độ khó cao hơn nữa bằng cách loại bỏ các đường tắt và tập trung vào khả năng thích ứng. Hiệu suất của con người trên các điểm chuẩn này đạt trung bình khoảng 60%, khiến điểm số 75% của GPT-5.2 trở thành một bước tiến đáng kinh ngạc. Hầu hết các hệ thống AI đều gặp khó khăn để vượt qua hiệu suất cấp độ con người trong các nhiệm vụ này, điều này nhấn mạnh tính phức tạp của các thử thách và tầm quan trọng của thành tựu này.

Hệ thống meta của Poetic thay đổi suy luận AI như thế nào

Cốt lõi của sự thành công của Poetic là hệ thống meta đổi mới, hoạt động như một lớp trí tuệ giúp tăng cường khả năng của các mô hình ngôn ngữ lớn (LLM) hiện có như GPT-5.2. Hệ thống meta này tổ chức quá trình suy luận thành một quy trình có cấu trúc và lặp lại, cho phép AI tiếp cận các vấn đề một cách có phương pháp và hiệu quả. Các thành phần chính của hệ thống meta bao gồm:

  • Giải quyết vấn đề lặp lại: Các nhiệm vụ phức tạp được chia thành các bước nhỏ hơn, dễ quản lý hơn, với các giải pháp được tinh chỉnh qua nhiều lần lặp lại để đảm bảo độ chính xác.
  • Lựa chọn mô hình linh hoạt: Hệ thống xác định và lựa chọn mô hình phù hợp nhất cho từng nhiệm vụ, tối ưu hóa hiệu suất mà không yêu cầu đào tạo lại.
  • Cơ chế tự kiểm tra: AI liên tục đánh giá tiến trình của mình, xác định các lỗi và thực hiện điều chỉnh để cải thiện độ chính xác và tính nhất quán.
  • Suy luận có cấu trúc: Các vấn đề được tiếp cận với một khung logic rõ ràng, giảm thiểu sự kém hiệu quả và đảm bảo tính nhất quán trong quá trình suy luận.

Bằng cách coi LLM là công cụ trong một khung suy luận rộng lớn hơn, hệ thống meta chuyển trọng tâm từ việc tạo ra các phản hồi đơn lẻ sang việc tinh chỉnh các câu trả lời thông qua các vòng lặp. Cách tiếp cận này không chỉ tăng cường độ chính xác mà còn đảm bảo sử dụng hiệu quả tài nguyên tính toán, biến nó thành một giải pháp thực tế và có khả năng mở rộng để giải quyết các vấn đề phức tạp.

GPT-5.2 vừa đạt 75% trên ARC-AGI! Làm sao điều này có thể xảy ra?

Khả năng mở rộng và hiệu quả: Một mô hình mới

Một trong những khía cạnh nổi bật nhất của hệ thống meta của Poetic là khả năng mở rộng của nó. Khi tài nguyên tính toán tăng lên, khả năng suy luận của hệ thống cải thiện theo tỷ lệ thuận, cho phép nó xử lý các nhiệm vụ phức tạp hơn mà không yêu cầu tối ưu hóa theo mô hình cụ thể. Khả năng thích ứng này làm cho hệ thống meta có thể áp dụng trên nhiều mô hình AI và nhiệm vụ khác nhau, mang lại một giải pháp linh hoạt để nâng cao suy luận AI.

Ngoài ra, khả năng tự giám sát của hệ thống meta đóng một vai trò quan trọng trong việc tối ưu hóa việc sử dụng tài nguyên. Bằng cách xác định khi nào một giải pháp đã đạt được mức độ chính xác chấp nhận được, hệ thống sẽ tránh các lần lặp lại không cần thiết, tiết kiệm cả thời gian và sức mạnh tính toán. Sự cân bằng giữa độ chính xác và hiệu quả này thiết lập một tiêu chuẩn mới cho việc tối ưu hóa hiệu suất AI, chứng minh rằng suy luận nâng cao có thể đạt được mà không tiêu tốn quá nhiều tài nguyên.

Những đổi mới then chốt thúc đẩy thành công của Poetic

Một số đổi mới mới làm nền tảng cho thành tựu của Poetic, định nghĩa lại cách các hệ thống AI tiếp cận suy luận và giải quyết vấn đề:

  • Chiến lược suy luận có thể khái quát hóa: Hệ thống meta tránh dựa vào các tối ưu hóa cụ thể cho điểm chuẩn, thay vào đó tập trung vào các phương pháp có thể áp dụng phổ biến trên các nhiệm vụ và mô hình khác nhau.
  • Tinh chỉnh lặp lại: Các giải pháp liên tục được cải thiện thông qua các chu kỳ đánh giá và điều chỉnh lặp đi lặp lại, đảm bảo độ chính xác và độ tin cậy cao hơn theo thời gian.
  • Tự giám sát: Khả năng đánh giá tiến trình của hệ thống ở từng bước giúp giảm thiểu sai sót và tối ưu hóa việc sử dụng tài nguyên tính toán.
  • Giải quyết vấn đề có cấu trúc: Một cách tiếp cận logic và có tổ chức đối với suy luận làm giảm khả năng sai sót và đảm bảo tính nhất quán trong việc giải quyết các thách thức phức tạp.

Những đổi mới này đại diện cho một sự thay đổi mô hình trong phát triển AI, vượt xa sự tập trung truyền thống vào kiến trúc mô hình để ưu tiên tăng cường các quy trình suy luận. Bằng cách sử dụng các LLM hiện có làm thành phần trong một khung lớn hơn, Poetic đã chứng minh một cách tiếp cận hiệu quả và hiệu quả hơn để thúc đẩy các khả năng của AI.

Tác động đến tương lai của AI

Thành công của GPT-5.2 trên điểm chuẩn ARC AGI2 có ý nghĩa sâu sắc đối với tương lai của trí tuệ nhân tạo. Bằng cách chứng minh rằng khả năng suy luận có thể được tăng cường đáng kể mà không cần đào tạo lại hoặc tinh chỉnh các mô hình, hệ thống meta của Poetic mang lại một con đường có khả năng mở rộng và tiết kiệm chi phí cho sự phát triển AI. Cách tiếp cận này gợi ý rằng những tiến bộ trong tương lai của AI có thể tập trung nhiều hơn vào việc tổ chức và tối ưu hóa các quy trình suy luận thay vì chỉ tạo ra các mô hình lớn hơn hoặc phức tạp hơn.

Hơn nữa, hiệu suất của GPT-5.2 làm nổi bật tiềm năng của những cải tiến trí tuệ tích lũy khi các mô hình phát triển. Bằng cách tích hợp các hệ thống như hệ thống meta của Poetic, AI có thể đạt được mức hiệu suất cao hơn bằng cách sử dụng các công nghệ hiện có, thúc đẩy tiến bộ trong lĩnh vực này. Sự chuyển dịch trọng tâm từ kích thước mô hình sang hiệu quả suy luận có thể định hình lại quỹ đạo nghiên cứu AI, nhấn mạnh vào các ứng dụng thực tế và tối ưu hóa tài nguyên.

Khi AI tiếp tục phát triển, các nguyên tắc được thể hiện bởi hệ thống meta của Poetic có thể sẽ đóng một vai trò trung tâm trong việc hình thành thế hệ hệ thống thông minh tiếp theo. Bằng cách ưu tiên suy luận có cấu trúc, tinh chỉnh lặp lại và khả năng mở rộng, các nhà nghiên cứu có thể mở ra những khả năng mới cho AI, mở đường cho những giải pháp tiên tiến và hiệu quả hơn cho các vấn đề phức tạp.

Tin tức AI

Xem tất cả