AI đang trở thành động lực chính cho sự mở rộng trung tâm dữ liệu trên toàn cầu, đặc biệt tại châu Âu, Trung Đông và châu Phi. Theo dự báo, công suất trung tâm dữ liệu tại châu Âu sẽ tăng trưởng kép 25% mỗi năm đến năm 2030, vượt xa tác động của quá trình chuyển đổi sang hạ tầng đám mây công cộng trong thập kỷ qua.

Khối lượng công việc AI thay đổi thiết kế trung tâm dữ liệu như thế nào?

Các mô hình ngôn ngữ lớn (LLM) và hệ thống AI tiêu thụ nhiều điện năng hơn và sinh nhiệt lớn hơn so với khối lượng công việc doanh nghiệp thông thường. Các cơ sở được thiết kế cho mật độ rack thấp (khoảng 5-10kW) nay phải đối mặt với yêu cầu vượt quá giả định ban đầu, khi một số rack AI đã vượt 100kW và dự kiến đạt 1,2MW vào năm 2028. Điều này tạo ra các vấn đề về kỹ thuật, triển khai và chi phí cho các nhà cung cấp colocation, công ty đám mây và nhà vận hành trung tâm dữ liệu.

Thiết kế grid-to-chip: Giải pháp tích hợp cho năng lượng và làm mát

Cách tiếp cận grid-to-chip (từ lưới điện đến chip) kết nối chuyển đổi điện năng, phân phối và làm mát trong một thiết kế thống nhất, thay vì xử lý từng lớp như các hệ thống riêng biệt. Ở mật độ cao, tổn thất nhỏ trong chuyển đổi có thể dẫn đến thất thoát năng lượng lớn và nhiệt tăng thêm, làm tăng nhu cầu làm mát. Mô hình hiệu quả tập trung giảm tổn thất giữa lưới điện và bộ xử lý, kết hợp phân phối điện áp cao hơn, chuyển đổi điện năng và hệ thống làm mát được thiết kế cho tính toán dày đặc. Phân phối điện áp cao hơn giúp giảm dòng điện và tổn thất điện trở, trong khi ít bước chuyển đổi hơn cải thiện hiệu suất.

Vai trò của AI trong vận hành trung tâm dữ liệu

Hệ thống AI và học máy nhúng được sử dụng để điều chỉnh làm mát, giám sát bộ nguồn liên tục (UPS) và pin, hỗ trợ điều phối năng lượng. Các triển khai lớn tuân theo quy tắc đơn giản có thể tiết kiệm vài triệu USD mỗi năm cho điện năng, tùy thuộc vào quy mô, giá năng lượng, hồ sơ tải và bản chất hệ thống được thay thế.

Xây dựng mô-đun: Giải pháp linh hoạt cho AI

Trung tâm dữ liệu mô-đun đang trở nên phù hợp cho các dự án AI, từ hệ thống một rack đến các đơn vị container hóa. Ưu điểm chính là tốc độ: các đơn vị mô-đun được chế tạo sẵn và kiểm tra trước khi đến hiện trường, giảm công việc xây dựng tại chỗ. Một nhà khai thác viễn thông châu Âu dự kiến mất khoảng 2,5 năm để xây dựng mở rộng mạng 5G edge, nhưng triển khai mô-đun có thể hoạt động trong vòng 16 tháng, đồng thời giảm chi phí vận hành nhờ hiệu quả năng lượng và cải thiện uptime.

Những thách thức còn lại và tương lai

Mặc dù mô-đun mang lại lợi ích, một số địa điểm vẫn gặp giới hạn quy hoạch hoặc quy định ngay cả với hạ tầng container hóa. Khi hệ thống GPU phát triển, khả năng tiếp cận lưới điện, hiệu quả năng lượng và tốc độ triển khai có thể vẫn là những rào cản đối với tăng trưởng công suất AI. Các nhà vận hành trung tâm dữ liệu cần quyết định: điều chỉnh thiết kế hiện tại hay lên kế hoạch cho hạ tầng tích hợp, mật độ cao ngay từ đầu.

Theo Cloud Computing News

Ảnh: Elchinator / Pixabay