Số liệu sử dụng của Anthropic phác họa bức tranh chi tiết về thành công của AI
Tin tức AI - 23/01/2026 21:21:20
Báo cáo của Anthropic, Chỉ số Kinh tế năm 2026, phác họa một bức tranh đa sắc thái về việc các nhà lãnh đạo có thể triển khai AI trong tổ chức ở đâu và như thế nào.
Chỉ số Kinh tế của Anthropic mang đến cái nhìn về cách các tổ chức và cá nhân thực sự sử dụng các mô hình ngôn ngữ lớn. Báo cáo bao gồm phân tích của công ty về một triệu lượt tương tác của người dùng trên Claude.ai, cộng với một triệu lượt gọi API doanh nghiệp, tất cả đều tính từ tháng 11 năm 2025. Báo cáo lưu ý rằng các số liệu của họ dựa trên các quan sát, thay vì, ví dụ, một mẫu từ những người ra quyết định kinh doanh hoặc khảo sát chung chung.
Việc sử dụng AI của Anthropic có xu hướng tập trung vào một số lượng nhiệm vụ tương đối nhỏ, với mười nhiệm vụ được thực hiện thường xuyên nhất chiếm gần một phần tư số lượt tương tác của người tiêu dùng và gần một phần ba lưu lượng API doanh nghiệp. Có một sự tập trung vào việc sử dụng Claude để tạo và sửa đổi mã nguồn, đúng như kỳ vọng của độc giả.
Sự tập trung sử dụng AI như một công cụ phát triển phần mềm này vẫn khá ổn định theo thời gian, cho thấy giá trị của mô hình phần lớn dựa trên các loại nhiệm vụ này, mà không có việc sử dụng Claude mới nổi nào cho các mục đích khác có ý nghĩa thực nghiệm. Điều này cho thấy rằng các đợt triển khai AI trên diện rộng và chung chung ít có khả năng thành công hơn so với các đợt triển khai tập trung vào các nhiệm vụ mà các mô hình ngôn ngữ lớn đã được chứng minh là hiệu quả.
Trên các nền tảng người tiêu dùng, việc sử dụng cộng tác – nơi người dùng lặp lại các truy vấn với AI trong suốt một cuộc hội thoại ảo – phổ biến hơn so với việc sử dụng AI để tạo ra các quy trình làm việc tự động. Việc sử dụng API doanh nghiệp cho thấy điều ngược lại, khi các doanh nghiệp cố gắng tiết kiệm chi phí thông qua việc tự động hóa các nhiệm vụ. Tuy nhiên, trong khi Claude thành công ở các nhiệm vụ ngắn hơn, chất lượng kết quả quan sát được sẽ giảm đi khi nhiệm vụ (hoặc chuỗi nhiệm vụ) càng phức tạp và "thời gian suy nghĩ" cần thiết càng dài.
Điều này ngụ ý rằng tự động hóa hiệu quả nhất đối với các nhiệm vụ định kỳ, được xác định rõ ràng, đơn giản hơn, yêu cầu ít bước logic hơn và nơi phản hồi cho các truy vấn có thể nhanh chóng. Các nhiệm vụ được ước tính mất vài giờ đối với con người cho thấy tỷ lệ hoàn thành thấp hơn đáng kể so với các nhiệm vụ ngắn hơn. Để các nhiệm vụ dài hơn thành công, người dùng phải lặp lại và chỉnh sửa các kết quả đầu ra.
Những người dùng chia nhỏ các nhiệm vụ lớn thành các bước dễ quản lý và đặt câu hỏi riêng biệt cho từng bước (tương tác trực tiếp hoặc qua API) có tỷ lệ thành công cải thiện hơn.
Các quan sát của công ty cho thấy hầu hết các truy vấn gửi đến LLM đều liên quan đến các vai trò văn phòng (mặc dù các quốc gia nghèo hơn có xu hướng sử dụng Claude trong môi trường học thuật thường xuyên hơn, ví dụ như so với Mỹ). Ví dụ, các đại lý du lịch có thể chuyển giao các nhiệm vụ lập kế hoạch phức tạp cho LLM và giữ lại các phần việc mang tính giao dịch nhiều hơn của họ, trong khi một số vai trò, chẳng hạn như quản lý tài sản, lại cho thấy điều ngược lại: các nhiệm vụ hành chính định kỳ có thể do AI xử lý và các nhiệm vụ cần phán đoán cao hơn vẫn thuộc về con người chuyên nghiệp.
Báo cáo lưu ý rằng các tuyên bố về việc AI thúc đẩy năng suất lao động hàng năm thêm 1,8% (trong một thập kỷ) có khả năng tốt nhất là nên giảm xuống còn 1-1,2%, do nhu cầu tính toán thêm chi phí và lao động bổ sung. Mặc dù mức tăng hiệu quả 1% trong một thập kỷ vẫn có ý nghĩa về mặt kinh tế, nhưng nhu cầu cho các hoạt động như xác thực, xử lý lỗi và làm lại sẽ làm giảm tỷ lệ thành công, và do đó, những người ra quyết định của doanh nghiệp cũng nên có sự điều chỉnh tương tự trong suy nghĩ.
Lợi ích tiềm năng đối với một tổ chức triển khai AI cũng phụ thuộc vào việc các nhiệm vụ giao cho LLM là bổ trợ hay thay thế công việc. Trong trường hợp sau, sự thành công của việc thay thế AI cho các nhiệm vụ thường do con người thực hiện phụ thuộc vào độ phức tạp của công việc đó.
Điều đáng chú ý là báo cáo tìm thấy mối tương quan gần như hoàn hảo giữa sự tinh vi trong các câu lệnh (prompt) của người dùng đối với LLM và kết quả thành công. Vì vậy, cách mọi người sử dụng AI sẽ định hình những gì nó mang lại.