GLM-5.2 của Trung Quốc có thực sự ngang bằng Anthropic Mythos về an ninh mạng không?

Các điểm chuẩn độc lập từ Semgrep và Graphistry cho thấy GLM-5.2 đạt hiệu suất ngang Mythos trong các tác vụ phát hiện lỗ hổng cụ thể, với điểm F1 39% so với 32–37% của Claude Code, nhưng vẫn thua trên các chuẩn tổng quát.

Tulongfeng của 360 Security là gì?

Tulongfeng là công cụ phát hiện lỗ hổng dựa trên AI do 360 Security Technology phát triển, sử dụng kiến trúc đa tác tử kết hợp với cơ sở dữ liệu lỗ hổng độc quyền. Công ty tuyên bố đã tìm thấy 3.432 lỗ hổng phần mềm.

AI Trung Quốc bắt kịp Anthropic Mythos về an ninh mạng: rẻ hơn 6 lần, mở hoàn toàn

Q: Luật Trung Quốc có yêu cầu báo cáo lỗ hổng AI cho chính phủ không?

Có. Các quy định từ 2017–2021 yêu cầu mọi lỗi phần mềm mới phát hiện phải được báo cáo cho Bộ Công nghiệp và Công nghệ thông tin trong vòng 48 giờ, trước khi thông báo cho nhà cung cấp.

📰 Tham khảo: nguồn quốc tế — Biên tập & phân tích bởi Hỏa Tốc 24h

Hai hệ thống AI Trung Quốc – GLM-5.2 của Zhipu AI và Tulongfeng của 360 Security – đã đạt hiệu suất phát hiện lỗ hổng bảo mật ngang bằng với mô hình Mythos của Anthropic, theo các đánh giá độc lập. GLM-5.2 có chi phí phát hiện mỗi lỗi chỉ khoảng 0,17 USD, thấp hơn 6 lần so với các công cụ dựa trên Claude.

Hai hệ thống AI Trung Quốc đang hoạt động ngang bằng với mô hình Mythos bị hạn chế của Anthropic trong phát hiện lỗ hổng an ninh mạng, theo các đánh giá độc lập được The Wall Street Journal đưa tin. Zhipu AI phát hành GLM-5.2 dạng open-weight vào ngày 13/6 theo giấy phép MIT, đạt hoặc vượt các mô hình hàng đầu của Mỹ trong các tác vụ bảo mật cụ thể. Riêng 360 Security Technology công bố công cụ dựa trên tác tử (agent) có tên Tulongfeng tại hội nghị ISC.AI 2026 ở Bắc Kinh, tuyên bố có khả năng tương đương thông qua một cách tiếp cận hoàn toàn khác.

Điểm chuẩn cho thấy gì?

Thử nghiệm độc lập của công ty an ninh mạng Semgrep cho thấy GLM-5.2 đạt điểm F1 là 39% trong phát hiện lỗ hổng IDOR, vượt qua Claude Code với 32–37% trên cùng bài đánh giá, theo Axios. Một đánh giá riêng của Graphistry cho thấy GLM-5.2 ngang bằng Claude Opus 4.8 trên một chuẩn bảo mật kiểu capture-the-flag. Graphistry gọi đây là mô hình open-weight đầu tiên phù hợp với trải nghiệm an ninh mạng 'kiểu tiên phong'. Chênh lệch chi phí cũng đáng kể: GLM-5.2 phát hiện lỗ hổng với giá khoảng 0,17 USD mỗi lỗi, chỉ bằng một phần sáu chi phí của các quy trình dựa trên Claude.

Tuy nhiên, những kết quả này có những lưu ý quan trọng. GLM-5.2 vẫn thua kém các hệ thống của Anthropic và OpenAI trên các chuẩn tổng quát. Sự tương đương về an ninh mạng chỉ áp dụng cho các tác vụ phát hiện lỗ hổng cụ thể, không phải suy luận AI rộng. Các nhà nghiên cứu của Semgrep lưu ý đánh giá của họ chỉ bao gồm một tập dữ liệu và một tác vụ. Nhưng trong một lĩnh vực mà cải thiện hiệu suất từng bước quyết định liệu lỗ hổng có được tìm thấy trước hay sau khi kẻ tấn công khai thác, sự tương đương theo miền có trọng lượng đáng kể.

Hai con đường, một kết quả

Điều làm cho sự phát triển này có ý nghĩa về mặt cấu trúc là hai tổ chức Trung Quốc đã đạt được hiệu suất an ninh mạng ngang Mythos thông qua các phương pháp khác nhau cơ bản. Zhipu AI xây dựng GLM-5.2 như một mô hình đa năng 753 tỷ tham số với khả năng lập trình và suy luận mạnh mẽ. Hiệu suất an ninh mạng của nó dường như là sản phẩm phụ của quy mô và chất lượng huấn luyện, chứ không phải tối ưu hóa theo miền. Mô hình hoàn toàn open-weight, nghĩa là bất kỳ ai cũng có thể tải xuống, sửa đổi và chạy mà không bị hạn chế API.

360 Security đi theo hướng ngược lại. Nhà sáng lập Chu Hồng Nghị (Zhou Hongyi) nói với Reuters rằng công ty thừa nhận khoảng cách 20–30% về khả năng mô hình nền so với hệ thống Mỹ. Thay vì thu hẹp khoảng cách đó trực tiếp, 360 đã xếp AI lên trên các cơ sở dữ liệu lỗ hổng độc quyền, hai thập kỷ chuyên môn bảo mật và các quy trình tấn công-phòng thủ tự động. Công cụ kết quả, Tulongfeng, hoạt động như một bầy các tác tử chuyên biệt thay vì một mô hình đa năng duy nhất. Chu Hồng Nghị nói: 'Nếu con đường của Mỹ là đào tạo một hacker thiên tài, thì con đường của 360 là tổ chức một đội tấn công-phòng thủ chuyên nghiệp.'

360 tuyên bố Tulongfeng đã tìm thấy 3.432 lỗ hổng phần mềm, trong đó 105 lỗi được chính phủ Trung Quốc xác nhận. Reuters lưu ý những con số đó không thể được xác minh độc lập. Một phân tích tháng 4/2026 của Eugenio Benincasa tại Trung tâm Nghiên cứu An ninh ETH Zurich kết luận rằng khả năng AI của 360 là đáng kể nhưng chưa đạt đến suy luận tự trị như Mythos. Benincasa cho rằng sự so sánh gần hơn là với Google Big Sleep, vốn tăng tốc các giai đoạn cụ thể của nghiên cứu lỗ hổng thay vì hoạt động hoàn toàn tự động.

Điều này cho thấy sự tương đương AI an ninh mạng có thể dễ đạt được về mặt cấu trúc hơn so với AI đa năng. Phát hiện lỗ hổng là một miền có ranh giới, nơi kiến trúc chuyên biệt và dữ liệu được tuyển chọn có thể bù đắp cho các mô hình nền yếu hơn. Nếu đánh giá đó đúng, các kiểm soát xuất khẩu nhằm hạn chế khả năng mô hình đa năng có thể không ngăn được sự hội tụ đặc thù an ninh mạng.

Kiểm soát xuất khẩu của Mỹ làm vấn đề tồi tệ hơn

Thời điểm kể câu chuyện của riêng nó. Bộ Thương mại Mỹ cấm xuất khẩu Fable 5 và Mythos 5 vào ngày 12/6, viện lý do an ninh quốc gia về một lỗ hổng jailbreak. GLM-5.2 ra mắt vào ngày hôm sau, có thể tải xuống miễn phí bởi bất kỳ ai trên Trái đất. Lệnh cấm hạn chế các nhà phòng thủ Mỹ trong khi một giải pháp thay thế tương đương của Trung Quốc trở nên có sẵn toàn cầu. NSA mất quyền truy cập Mythos trong khoảng hai tuần trong thời gian hạn chế, mặc dù cơ quan này đã thử nghiệm công cụ và thấy nó hiệu quả trong các thử nghiệm bảo mật.

Saif Khan, nghiên cứu viên công nghệ tại Institute for Progress, người từng làm việc về các hạn chế xuất khẩu dưới thời chính quyền Biden, nói thẳng với The Wall Street Journal: 'Cấm Fable trong khi bán chip mà Trung Quốc cần để phát triển phiên bản của riêng họ là một món quà cho Trung Quốc.' Mâu thuẫn khó có thể bỏ qua: Mỹ hạn chế mô hình an ninh mạng tiên phong của chính mình trong khi tiếp tục phê duyệt xuất khẩu chip giúp các phòng thí nghiệm Trung Quốc huấn luyện các giải pháp thay thế cạnh tranh. Khan lập luận rằng Mỹ nên tối đa hóa việc triển khai Mythos để củng cố phòng thủ mạng trong nước khi vẫn còn lợi thế AI rộng hơn, thay vì hạn chế truy cập.

Sự bất đối xứng trong tiết lộ mà hầu hết báo cáo bỏ qua

Một yếu tố ít được thảo luận nhưng quan trọng hơn điểm chuẩn là điều gì xảy ra sau khi lỗ hổng được tìm thấy. Các quy định tiết lộ lỗ hổng của Trung Quốc, ban hành từ năm 2017 đến 2021, yêu cầu tất cả các lỗi phần mềm được phát hiện phải được báo cáo cho Bộ Công nghiệp và Công nghệ thông tin trong vòng 48 giờ kể từ khi phát hiện, trước khi nhà cung cấp bị ảnh hưởng được thông báo. Nghĩa vụ này áp dụng cho tất cả các công ty và nhà nghiên cứu Trung Quốc, bao gồm cả những người sử dụng công cụ hỗ trợ AI, theo Tech Times.

Mọi lỗ hổng zero-day được xác nhận mà Tulongfeng tìm thấy đều phải trở thành tài sản của chính phủ Trung Quốc trong vòng hai ngày. Chính phủ sau đó quyết định liệu nó có được tiết lộ cho nhà sản xuất phần mềm, giữ lại cho mục đích tình báo hay sử dụng cho các hoạt động tấn công. Chu Hồng Nghị đã đóng khung công cụ của mình bằng logic răn đe hạt nhân, lập luận rằng khả năng phát hiện lỗ hổng lẫn nhau ngăn chặn xung đột. Nhưng răn đe hạt nhân dựa trên sự đối xứng, nơi không bên nào tiết lộ vũ khí của mình. Việc tiết lộ lỗ hổng bắt buộc cho chính phủ trước tạo ra một sự bất đối xứng cố hữu mà khung răn đe không giải quyết được. Mô hình Mỹ tìm lỗi và vá chúng. Mô hình Trung Quốc tìm lỗi và, theo luật, báo cáo chúng cho Bắc Kinh trước.

Điều gì tiếp theo?

Liên minh tình báo Five Eyes cảnh báo trong tháng này rằng các mối đe dọa mạng do AI điều khiển có thể thành hiện thực trong vòng vài tháng, không phải vài năm. Các mô hình có sẵn miễn phí ngang bằng với khả năng phát hiện lỗ hổng cấp Mythos làm cho mốc thời gian đó cụ thể hơn. Một số yếu tố sẽ định hình những gì xảy ra tiếp theo: liệu chính phủ Mỹ có khôi phục toàn bộ quyền truy cập Mythos cho các nhà phòng thủ hay duy trì các hạn chế làm suy yếu các đội an ninh mạng trong nước; tốc độ các mô hình open-weight Trung Quốc khác với chuyên môn an ninh mạng theo sau GLM-5.2; liệu kết quả điểm chuẩn của Semgrep và Graphistry có được giữ vững dưới đánh giá độc lập rộng hơn; và cách Washington dung hòa việc hạn chế xuất khẩu mô hình AI trong khi tiếp tục phê duyệt doanh số chip giúp Trung Quốc xây dựng các giải pháp thay thế cạnh tranh.

Cuộc đua AI an ninh mạng không còn được xác định bởi lợi thế thoải mái của Mỹ. Cả hai hệ thống tiên phong của Trung Quốc và Mỹ đều có thể tìm thấy cùng các loại lỗi. Câu hỏi bây giờ là ai vá những lỗ hổng đó trước và ai khai thác chúng trước, và khuôn khổ chính sách hiện tại của Mỹ không có câu trả lời rõ ràng cho cả hai.

Theo Memeburn

Ảnh: Mohamed_hassan / Pixabay

ℹ️ Lưu ý: Bài tổng hợp & dịch từ báo chí quốc tế, có hỗ trợ AI và biên tập viên kiểm tra (quy trình) · theo dõi độ chính xác trích dẫn. Nội dung tham khảo — độc giả nên đối chiếu nguồn gốc cho quyết định quan trọng. Phát hiện sai lệch? Báo cho chúng tôi.