Microsoft, Anthropic và NVIDIA đang thiết lập một tiêu chuẩn mới cho đầu tư cơ sở hạ tầng đám mây và khả dụng mô hình AI với một liên minh điện toán mới.
Microsoft, Anthropic và NVIDIA đang thiết lập một tiêu chuẩn mới cho đầu tư cơ sở hạ tầng đám mây và khả dụng mô hình AI với một liên minh điện toán mới. Thỏa thuận này báo hiệu sự chuyển dịch từ phụ thuộc vào một mô hình duy nhất sang một hệ sinh thái đa dạng, tối ưu hóa phần cứng, thay đổi bối cảnh quản trị cho các nhà lãnh đạo công nghệ cấp cao.
CEO của Microsoft, Satya Nadella, cho biết mối quan hệ này là một sự tích hợp tương hỗ, nơi các công ty “ngày càng trở thành khách hàng của nhau”. Trong khi Anthropic tận dụng cơ sở hạ tầng Azure, Microsoft sẽ tích hợp các mô hình của Anthropic vào toàn bộ hệ thống sản phẩm của mình.
Anthropic đã cam kết mua 30 tỷ USD dung lượng điện toán Azure. Con số này cho thấy yêu cầu tính toán khổng lồ cần thiết để đào tạo và triển khai thế hệ mô hình tiên tiến tiếp theo. Sự hợp tác này liên quan đến một lộ trình phần cứng cụ thể, bắt đầu với các hệ thống Grace Blackwell của NVIDIA và tiến tới kiến trúc Vera Rubin.
CEO của NVIDIA, Jensen Huang, kỳ vọng kiến trúc Grace Blackwell với NVLink sẽ mang lại “tốc độ nhanh hơn đáng kể,” một bước nhảy vọt cần thiết để giảm chi phí token.
Đối với những người giám sát chiến lược cơ sở hạ tầng, mô tả của Huang về phương pháp kỹ thuật “shift-left” – nơi công nghệ của NVIDIA xuất hiện trên Azure ngay lập tức khi phát hành – cho thấy các doanh nghiệp chạy Claude trên Azure sẽ tiếp cận các đặc tính hiệu suất khác biệt so với các phiên bản tiêu chuẩn. Sự tích hợp sâu sắc này có thể ảnh hưởng đến các quyết định kiến trúc liên quan đến các ứng dụng nhạy cảm với độ trễ hoặc xử lý hàng loạt thông lượng cao.
Kế hoạch tài chính giờ đây phải tính đến ba quy luật mở rộng đồng thời mà Huang đã xác định: mở rộng quy mô tiền huấn luyện (pre-training), hậu huấn luyện (post-training) và mở rộng quy mô thời gian suy luận (inference-time scaling).
Theo truyền thống, chi phí điện toán AI tập trung nhiều vào việc huấn luyện. Tuy nhiên, Huang lưu ý rằng với việc mở rộng quy mô thời gian thử nghiệm – nơi mô hình “suy nghĩ” lâu hơn để tạo ra câu trả lời chất lượng cao hơn – chi phí suy luận đang tăng lên.
Do đó, chi phí vận hành AI (OpEx) sẽ không phải là một mức giá cố định trên mỗi token mà sẽ tương quan với độ phức tạp của lý luận yêu cầu. Dự báo ngân sách cho các quy trình làm việc tác tử (agentic workflows) do đó phải trở nên linh hoạt hơn.
Việc tích hợp vào các quy trình làm việc doanh nghiệp hiện có vẫn là một trở ngại chính cho việc áp dụng. Để giải quyết vấn đề này, Microsoft đã cam kết tiếp tục cung cấp quyền truy cập cho Claude trong toàn bộ dòng sản phẩm Copilot.
Trọng tâm hoạt động đổ dồn vào các khả năng tác tử. Huang đã nhấn mạnh Giao thức Ngữ cảnh Mô hình (MCP) của Anthropic như một sự phát triển đã “cách mạng hóa bối cảnh AI tác tử”. Các nhà lãnh đạo kỹ thuật phần mềm nên lưu ý rằng các kỹ sư NVIDIA đã và đang sử dụng Claude Code để tái cấu trúc các cơ sở mã cũ.
Từ góc độ bảo mật, sự tích hợp này đơn giản hóa ranh giới bảo mật. Các nhà lãnh đạo bảo mật kiểm tra các điểm cuối API của bên thứ ba giờ đây có thể cung cấp khả năng của Claude trong ranh giới tuân thủ Microsoft 365 hiện có. Điều này hợp lý hóa quản trị dữ liệu, vì nhật ký tương tác và xử lý dữ liệu vẫn nằm trong các thỏa thuận thuê bao Microsoft đã thiết lập.
Sự phụ thuộc vào nhà cung cấp vẫn là một điểm gây tranh cãi đối với các CDO và chuyên viên quản lý rủi ro. Quan hệ đối tác điện toán AI này làm giảm bớt mối lo ngại đó bằng cách biến Claude trở thành mô hình tiên tiến duy nhất có sẵn trên cả ba dịch vụ đám mây toàn cầu nổi bật. Nadella nhấn mạnh rằng cách tiếp cận đa mô hình này xây dựng dựa trên, chứ không thay thế, quan hệ đối tác hiện có của Microsoft với OpenAI, vốn vẫn là một thành phần cốt lõi trong chiến lược của họ.
Đối với Anthropic, liên minh này giải quyết thách thức về “tiếp cận thị trường doanh nghiệp”. Huang lưu ý rằng việc xây dựng một hoạt động bán hàng cho doanh nghiệp phải mất hàng thập kỷ. Bằng cách tận dụng các kênh đã có của Microsoft, Anthropic đã vượt qua được đường cong chấp nhận này.
Thỏa thuận ba bên này làm thay đổi bối cảnh mua sắm. Nadella thúc giục ngành công nghiệp vượt ra khỏi “câu chuyện tổng bằng không,” gợi ý về một tương lai với các khả năng rộng lớn và bền vững.
Các tổ chức nên xem xét danh mục mô hình hiện tại của họ. Việc Claude Sonnet 4.5 và Opus 4.1 có mặt trên Azure đòi hỏi một phân tích TCO so sánh với các triển khai hiện có. Hơn nữa, cam kết về “gigawatt dung lượng” báo hiệu rằng các hạn chế về dung lượng cho các mô hình cụ thể này có thể ít nghiêm trọng hơn so với các chu kỳ phần cứng trước đây.
Sau quan hệ đối tác điện toán AI này, trọng tâm của các doanh nghiệp giờ đây phải chuyển từ việc truy cập sang tối ưu hóa; đó là khớp phiên bản mô hình phù hợp với quy trình kinh doanh cụ thể để tối đa hóa lợi nhuận từ cơ sở hạ tầng mở rộng này.