Vào ngày 11/6/2026, Anthropic xin lỗi sau khi mô hình AI mới nhất của hãng, Fable 5, bị phát hiện âm thầm hạn chế phản hồi đối với người dùng bị nghi ngờ cố gắng sao chép công nghệ này. Mô hình này cũng bị chỉ trích vì từ chối trả lời các truy vấn liên quan đến an ninh mạng, chuyển hướng người dùng sang các mô hình kém năng lực hơn. Hai ngày sau, chính quyền Tổng thống Donald Trump cấm công dân nước ngoài truy cập hai mô hình tiên tiến nhất của Anthropic là Fable 5 và Mythos 5, với lý do an ninh quốc gia. Không thể sàng lọc người dùng theo quốc tịch, Anthropic thông báo đã vô hiệu hóa cả hai mô hình trên toàn thế giới.
Chính sách AI thiếu nhất quán gây tổn hại an ninh mạng
Sự kiện này cho thấy cả quan chức chính quyền và nhà phát triển mô hình tiên tiến đều nhận thức rõ rủi ro an ninh mạng nghiêm trọng do AI tiên tiến gây ra. Đối với những người sáng lập Anthropic, an toàn và bảo mật AI từ lâu đã là trọng tâm trong sứ mệnh của họ. Đối với Nhà Trắng, sự xuất hiện của Mythos hồi đầu năm nay đã tạo ra một bước ngoặt đáng chú ý, buộc chính quyền phải chuyển từ chương trình nghị sự bãi bỏ quy định mạnh mẽ sang một chương trình thận trọng hơn về rủi ro.
Mặc dù sự tập trung chung vào AI và an ninh mạng là một bước phát triển tích cực, nhưng việc quá chú trọng vào rủi ro và không thống nhất được hướng đi rõ ràng có thể khiến Hoa Kỳ bỏ lỡ cơ hội thế hệ để cải thiện khả năng phòng thủ mạng quốc gia.
Cơ hội phòng thủ mạng bị bỏ lỡ
Chiến lược hậu Mythos của chính quyền tập trung vào một 'cửa sổ cơ hội' trên không gian mạng. Nhà Trắng tin rằng các công ty và cơ quan Mỹ có thể tận dụng các công cụ AI tiên tiến để sửa càng nhiều lỗ hổng phần mềm càng tốt trước khi đối thủ có được và vũ khí hóa các khả năng tương tự. Các phòng thí nghiệm tiên tiến đã hiện thực hóa cách tiếp cận này bằng cách cung cấp—và đôi khi tài trợ—quyền truy cập hạn chế vào các mô hình có khả năng an ninh mạng tiên tiến.
Tuy nhiên, hai diễn biến gần đây được cho là đã khiến Nhà Trắng đột ngột đảo ngược chính sách: thứ nhất, các mô hình bị hạn chế đã bị các bên trái phép truy cập; thứ hai, các rào cản trong mô hình công khai có thể bị vượt qua trong một số trường hợp hạn chế. Các hạn chế đối với mô hình của Anthropic hiện đang gây ra sự bất ổn lan rộng trên thị trường an ninh mạng và có nguy cơ lãng phí cơ hội mong manh để củng cố mạng lưới Mỹ.
Các công cụ AI hứa hẹn sẽ thay đổi động lực phòng thủ và khai thác mạng theo hướng có lợi cho người phòng thủ. Để đạt được kết quả này, cần đưa những khả năng này vào tay càng nhiều người phòng thủ càng tốt, ngay cả khi các tác nhân độc hại cũng có quyền truy cập. Minh bạch từ lâu đã là nguyên tắc nền tảng của an ninh thông tin. Phần mềm mã nguồn mở và chương trình săn lỗi (bug bounty) mang lại khả năng phục hồi chung, ngay cả khi chúng phát hiện ra lỗ hổng.
Các đối thủ cuối cùng sẽ có được khả năng AI tiên tiến của riêng họ. Điều đó có thể đến từ việc vượt rào (jailbreak) các mô hình tiên tiến công khai, truy cập bất hợp pháp vào các mô hình Mỹ bị kiểm soát, hoặc tự phát triển. Các ước tính cho thấy các mô hình hàng đầu của Trung Quốc chậm hơn khoảng ba đến tám tháng so với các mô hình Mỹ tiên tiến nhất. Ngay cả khi các phòng thí nghiệm Mỹ duy trì lợi thế tương đối, khả năng tấn công mạng của Trung Quốc sẽ tiếp tục hoàn thiện.
Khi Trung Quốc có được khả năng giống Mythos của riêng mình, Hoa Kỳ sẽ cần phải sẵn sàng. Điều đó có nghĩa là tối đa hóa cửa sổ cơ hội này để mở rộng quyền truy cập vào các công cụ phòng thủ và tăng tốc độ cũng như quy mô vá lỗi phần mềm.
Các chương trình truy cập có kiểm soát như Project Glasswing là một khởi đầu tốt, nhưng các phòng thí nghiệm tiên tiến muốn trở thành công ty đại chúng có thể sớm thấy rằng nghĩa vụ ủy thác của họ làm suy yếu khả năng tài trợ cho việc nâng cấp an ninh mạng ở quy mô lớn. Khi chi phí cung cấp quyền truy cập vào các mô hình AI xung đột với lợi nhuận doanh nghiệp, chính phủ Mỹ nên can thiệp bằng cách cung cấp tài trợ có mục tiêu và tạo điều kiện phối hợp giữa các phòng thí nghiệm cũng như nâng cao hiệu quả. Chính phủ Mỹ cũng nên tạo điều kiện kiểm tra an ninh mạng đối với các dự án mã nguồn mở được sử dụng rộng rãi và các hệ thống điều khiển công nghiệp quan trọng hiện đang nhận được quá ít sự chú ý.
Khi các mô hình đa năng trở nên có khả năng hơn trong các chức năng an ninh mạng thông qua cải thiện khả năng suy luận cơ bản, chúng sẽ trở thành một phần tiêu chuẩn trong cấu hình công nghệ thông tin (IT) của hầu hết các tổ chức. Chính phủ liên bang nên thiết lập các tiêu chuẩn đánh giá (benchmark) cho các công cụ an ninh mạng AI, cho phép khách hàng lựa chọn mô hình dựa trên các tuyên bố về hiệu suất có thể kiểm chứng và tạo ra sự cạnh tranh lành mạnh trên thị trường mới nổi cho các dịch vụ an ninh mạng hỗ trợ AI.
Điều này không loại trừ các biện pháp có mục tiêu nhằm hạn chế khả năng tiếp cận các khả năng mạng tiên tiến của Trung Quốc. Hoa Kỳ có cả lợi ích an ninh quốc gia và thương mại trong việc ngăn chặn Trung Quốc 'chưng cất' (tức đánh cắp) tài sản trí tuệ của các phòng thí nghiệm tiên tiến. Bộ Thương mại nên tối đa hóa thẩm quyền hiện có để hạn chế khả năng tiếp cận của Trung Quốc đối với chất bán dẫn tiên tiến do Mỹ thiết kế mà các công ty Trung Quốc hiện có thể tiếp cận thông qua các lỗ hổng được bảo vệ kém.
Các phòng thí nghiệm tiên tiến và chính phủ Mỹ nên hợp tác với nhau—không phải chống lại nhau—để quyết định thời điểm hạn chế khả năng. Nhưng những quyết định đó nên được đưa ra một cách minh bạch và nhất quán, không phải thông qua các chỉ thị phản ứng.
Đồng minh mất niềm tin vào hệ sinh thái AI Mỹ
Cách tiếp cận thất thường này đối với việc giảm thiểu rủi ro AI đang làm suy yếu uy tín của hệ sinh thái AI Mỹ ở nước ngoài. Thủ tướng Canada Mark Carney được cho là đã cảnh báo các nhà lãnh đạo Nhóm Bảy (G7) rằng lệnh cấm xuất khẩu cho thấy sự nguy hiểm của việc phụ thuộc vào các mô hình Mỹ. Nếu các nhà hoạch định chính sách Mỹ muốn các đối tác nước ngoài áp dụng hệ sinh thái AI Mỹ—và từ bỏ hệ sinh thái của Trung Quốc—các quốc gia đó phải có thể tin tưởng vào nó. Các đồng minh sẽ không áp dụng một mô hình nếu hiệu suất của nó có thể bị nhà phát triển bóp nghẹt một cách âm thầm, hoặc nếu chính phủ Mỹ tiếp tục hạn chế quyền truy cập mà không có cảnh báo hoặc phối hợp.
Hoa Kỳ có lợi ích mạnh mẽ trong việc áp dụng rộng rãi các công cụ AI tiên tiến của mình. Từ góc độ an ninh mạng, Hoa Kỳ nên muốn các đồng minh củng cố cơ sở hạ tầng quan trọng của họ chống lại sự xâm nhập của đối thủ—đặc biệt là ở những nơi như Nhật Bản, nơi các căn cứ quân sự Mỹ phụ thuộc vào điện, nước và thông tin liên lạc địa phương. Rộng hơn, sáng kiến Pax Silica—nỗ lực hàng đầu của Bộ Ngoại giao về AI và an ninh chuỗi cung ứng—nhấn mạnh tầm nhìn của chính quyền về một hệ sinh thái AI toàn cầu do Mỹ dẫn dắt, được hỗ trợ bởi chuỗi cung ứng linh hoạt.
Để hiện thực hóa tầm nhìn này, cần có một cách tiếp cận minh bạch và nhất quán để quản lý các rủi ro mô hình AI nghiêm trọng, kết nối các phòng thí nghiệm tiên tiến và các nhà hoạch định chính sách liên bang. Nếu không có một chiến lược mạch lạc thu hút các đồng minh, Washington có nguy cơ đóng lại cánh cửa cơ hội an ninh mạng mà chính quyền hy vọng sẽ giữ mở.
Theo Council on Foreign Relations
Ảnh: Matheus Bertelli / Pexels
