AI tác nhân (AI agent) đang chuyển từ công cụ tuân theo lệnh người dùng sang hệ thống tự động có khả năng tự suy nghĩ và hành động. Sự thay đổi này đẩy mạnh vai trò của suy luận (reasoning) – cốt lõi của tư duy – thay vì chỉ dựa vào học tập (training) như trước. Theo dự báo, thị trường AI tác nhân toàn cầu sẽ tăng từ 98 tỷ USD hiện nay lên 2209 tỷ USD vào năm 2035, với tốc độ tăng trưởng kép hàng năm (CAGR) 36,55% (theo Global Information).
Chi tiêu cho hạ tầng đám mây tăng mạnh nhờ AI
Kể từ khi ChatGPT ra mắt năm 2022, các hệ thống AI tạo sinh đã chiếm hơn một nửa mức tăng doanh thu đám mây. Các nhà cung cấp đám mây lớn như Amazon, Microsoft và Google ghi nhận nhu cầu GPU là động lực chính cho tăng trưởng. Trong quý I/2026, chi tiêu của doanh nghiệp cho dịch vụ hạ tầng đám mây tăng hơn 35 tỷ USD so với cùng kỳ năm trước, đạt 1290 tỷ USD. Đây là quý tăng trưởng thứ 9 liên tiếp với tốc độ 35% (theo Synergy Research Group). Thị phần đám mây thuộc về Amazon (28%), Microsoft (21%) và Google (14%).
Neo cloud – nền tảng GPU chuyên dụng cho AI bùng nổ
Các trung tâm dữ liệu chuyên cung cấp GPU hiệu năng cao cho AI, được gọi là “neo cloud”, cũng tăng trưởng vượt bậc. Doanh thu ngành neo cloud đạt 9 tỷ USD trong quý IV/2025, tăng 223% so với cùng kỳ. Cả năm 2025, doanh thu vượt 25 tỷ USD và dự kiến đạt gần 400 tỷ USD vào năm 2031 (theo Synergy). Các nhà cung cấp neo cloud tiêu biểu gồm CoreWeave (Mỹ), Lambda Lab (Mỹ), Crusoe (Mỹ) và Nebius (Hà Lan). Riêng CoreWeave đạt doanh thu đám mây hơn 1,5 tỷ USD mỗi quý, lọt vào top 10 nhà cung cấp đám mây toàn cầu.
AI tác nhân tự động: từ học tập sang suy luận
Trước đây, GPU chủ yếu được dùng để huấn luyện các mô hình ngôn ngữ lớn (LLM). Nhưng xu hướng đang chuyển sang sử dụng GPU làm nền tảng cho các hệ thống AI tự động, thực thi tác vụ phức tạp theo thời gian thực mà không cần can thiệp của con người. AI tác nhân là đại diện tiêu biểu cho sự chuyển dịch này. Các hệ thống này lặp lại vòng lặp: hiểu mục tiêu, quan sát dữ liệu và công cụ bên ngoài, phân tích, lập kế hoạch và hành động tự động. Trong đó, suy luận đóng vai trò then chốt, cho phép xử lý từng bước các vấn đề phức tạp, đưa ra phán đoán chuyên sâu và kết hợp nhiều tác nhân để thực hiện nhiệm vụ cao cấp.
Lợi ích thực tế từ AI tác nhân
AI tác nhân đã mang lại kết quả cụ thể. Ví dụ, Walmart triển khai “mua sắm agent” giúp tối ưu đề xuất sản phẩm và mở rộng cơ hội mua sắm, vượt qua các phương thức gợi ý truyền thống về doanh thu. Trong tương lai, suy luận kết hợp với LLM sẽ mở ra khả năng: tìm kiếm thông tin dạng RAG có giải thích căn cứ, tự động hóa quy trình nghiệp vụ có hiểu ngữ cảnh, tạo văn bản thông minh, hỗ trợ ra quyết định với kịch bản và kiểm tra tính nhất quán. Các ứng dụng bao gồm sinh mã và gỡ lỗi, giải toán và khoa học, phân tích tài liệu y tế/pháp lý, tự động hóa đa bước, hỗ trợ nghiên cứu, giáo dục cá nhân hóa, phát hiện lỗi thiết kế sản xuất.
Ảnh: MART PRODUCTION / Pexels
