Google đã thông báo với Meta vào tháng 3/2026 rằng họ không thể cung cấp đủ năng lực tính toán cho mô hình Gemini theo yêu cầu, do lượng API request tăng gấp đôi từ tháng 3 đến tháng 8/2025, buộc Google phải áp dụng giới hạn sử dụng dựa trên hạn mức tính toán từ ngày 17/5/2026.

Nguyên nhân: Nhu cầu AI tăng vọt gây áp lực lên hạ tầng

Theo các nguồn tin, lượng yêu cầu API Gemini đã tăng gấp đôi trong giai đoạn từ tháng 3 đến tháng 8/2025, khiến Google phải xem xét lại cách phân bổ một trong những tài nguyên khan hiếm nhất trong lĩnh vực công nghệ: sức mạnh tính toán AI thô. Sự gia tăng này đến từ các nhà phát triển, doanh nghiệp và cả những gã khổng lồ công nghệ, đe dọa vượt quá công suất hiện có.

Meta chịu ảnh hưởng nặng nề nhất

Các nguồn tin tiết lộ rằng Google đã thông báo cho Meta vào khoảng tháng 3/2026 rằng họ không thể đáp ứng đủ hạn mức năng lực tính toán cho mô hình Gemini mà Meta yêu cầu. Do nhu cầu của Meta đối với mô hình của Google cao hơn nhiều so với các khách hàng khác, Meta là bên chịu ảnh hưởng rõ rệt nhất. Điều này đã làm gián đoạn và trì hoãn tiến độ của nhiều dự án AI nội bộ tại Meta. Cùng với chiến lược cắt giảm chi phí AI tổng thể, Meta đã yêu cầu nhân viên tiết kiệm việc gọi token AI và nâng cao hiệu quả sử dụng.

Google áp dụng giới hạn sử dụng kiểu 'gói cước'

Kể từ ngày 17/5/2026, Google đã áp dụng giới hạn sử dụng dựa trên hạn mức tính toán cho ứng dụng Gemini. Cơ chế này tương tự như gói cước dữ liệu di động: người dùng không còn được gửi yêu cầu không giới hạn, mà phải sử dụng trong một khung thời gian làm mới 5 giờ, cập nhật hàng tuần, và có giới hạn sử dụng hàng tuần. Các giới hạn này áp dụng trên diện rộng, không chỉ riêng một công ty nào. Google đã ghi nhận các mức giới hạn tốc độ và bậc chi tiêu nhằm đảm bảo tất cả khách hàng đều có thể sử dụng API một cách công bằng trong giai đoạn tăng trưởng nhanh chóng.

Vì sao Google không mở rộng hạ tầng?

Việc Google chọn áp dụng giới hạn sử dụng thay vì mở rộng cơ sở hạ tầng cho thấy những cân nhắc về kinh tế. Ngay cả đối với một công ty có nguồn lực như Google, chi phí đầu tư cần thiết để đáp ứng nhu cầu AI không bị giới hạn là rất lớn, khiến việc quản lý nhu cầu trong ngắn hạn là cần thiết. Sự kiện này một lần nữa nhấn mạnh rằng, mặc dù các gã khổng lồ công nghệ toàn cầu liên tục đầu tư hàng tỷ USD vào trung tâm dữ liệu và chip AI, cơ sở hạ tầng tổng thể vẫn khó theo kịp tốc độ mở rộng nhanh chóng của AI tạo sinh, và nguồn cung năng lực tính toán vẫn là nút thắt quan trọng cho sự phát triển của ngành.

Tác động đến Google Cloud

Báo cáo tài chính mới nhất của Google Cloud cũng phản ánh vấn đề tương tự. Trong quý đầu tiên của năm tài chính 2026 (kết thúc vào tháng 3/2026), doanh thu Google Cloud đạt 20 tỷ USD, nhưng CEO Alphabet Sundar Pichai cho biết hạn chế về năng lực tính toán đã khiến Google Cloud không thể đáp ứng thêm nhu cầu của khách hàng, và khiến lượng đơn hàng tồn đọng của bộ phận này tăng gần gấp đôi so với quý trước.

Ảnh: Akela999 / Pixabay