Ngày 26/6/2026, OpenAI công bố bản xem trước giới hạn của dòng mô hình GPT-5.6 với ba phiên bản Sol, Terra và Luna, trong đó Sol là mô hình hàng đầu sở hữu năng lực an ninh mạng tiên tiến nhất và kiến trúc an toàn mạnh mẽ nhất từ trước đến nay.
Hiệu suất vượt trội trên các chuẩn đánh giá an ninh mạng
Trên ExploitBench, GPT-5.6 Sol đạt hiệu suất tương đương với Mythos Preview của Anthropic nhưng chỉ tiêu thụ khoảng một phần ba số token đầu ra, mang lại hiệu quả lớn cho các tác vụ bảo mật dài hạn như nghiên cứu lỗ hổng và phân tích khai thác.
Trên ExploitGym – chuẩn đánh giá do các nhà nghiên cứu của UC Berkeley phát triển hợp tác với OpenAI và các phòng thí nghiệm AI tiên tiến khác – cả ba mô hình GPT-5.6 đều cho thấy cải thiện có thể đo lường được trong hiệu suất tác vụ mạng khi độ sâu suy luận tăng lên.
Trên TerminalBench 2.1, GPT-5.6 Sol đạt điểm 88,8% trong các quy trình dòng lệnh yêu cầu lập kế hoạch, lặp lại và phối hợp công cụ, trong khi phiên bản Sol Ultra nâng con số này lên 91,9%.
Cải thiện trong lĩnh vực sinh học và chế độ siêu tốc mới
GPT-5.6 Sol cũng cho thấy cải thiện mạnh mẽ trong các quy trình sinh học trên GeneBench v1, đạt kết quả tốt hơn GPT-5.5 trong khi sử dụng ít token đầu ra hơn.
OpenAI giới thiệu chế độ ultra mới, vượt xa khả năng của tác tử đơn lẻ bằng cách tận dụng các tác tử phụ (subagents) để tăng tốc các công việc phức tạp, dài hạn.
An toàn nhiều lớp và hợp tác với chính phủ Mỹ
OpenAI xác nhận GPT-5.6 Sol không vượt ngưỡng “Cyber Critical” theo Khung chuẩn bị sẵn sàng (Preparedness Framework) của họ. Dù thử nghiệm trên Chromium và Firefox cho thấy mô hình có thể xác định lỗi và các nguyên thủy khai thác (building blocks của một exploit), nó không tự động tạo ra một chuỗi khai thác hoàn chỉnh có chức năng trong điều kiện có kiểm soát.
Để đối phó với rủi ro lưỡng dụng, OpenAI triển khai một lớp bảo vệ đa tầng được thiết kế riêng cho GPT-5.6. Ở cấp độ mô hình, GPT-5.6 Sol được huấn luyện để từ chối các yêu cầu hỗ trợ mạng bị cấm, bao gồm các nỗ lực ngụy trang ý định hoặc phá vỡ hệ thống. Các bộ phân loại lạm dụng thời gian thực đánh giá đầu ra khi nó được tạo ra; đối với các trường hợp rủi ro cao, quá trình tạo bị tạm dừng trong khi một mô hình suy luận lớn hơn xem xét toàn bộ ngữ cảnh hội thoại trước khi quyết định phát hành hay giữ lại đầu ra. Phân tích hành vi ở cấp tài khoản giúp phân biệt các mẫu độc hại dai dẳng với nghiên cứu bảo mật lưỡng dụng hợp pháp. Kiểm soát truy cập phân biệt đảm bảo các khả năng nhạy cảm nhất không được phổ biến rộng rãi theo mặc định.
Để kiểm tra các biện pháp bảo vệ này, OpenAI đã dành hơn 700.000 giờ GPU tương đương A100 cho red-teaming tự động, tập trung vào các cuộc tấn công jailbreak phổ quát. Red-teaming chuyên gia của con người tiếp tục song song trong suốt thời gian xem trước.
Trong một bước đi bất thường, OpenAI đã phối hợp với chính phủ Mỹ trước khi ra mắt, chia sẻ khả năng mô hình và kế hoạch phát hành trước. Theo yêu cầu của chính phủ, GPT-5.6 được phát hành trước tiên cho một nhóm đối tác đáng tin cậy hạn chế, những người tham gia đã được tiết lộ cho chính quyền liên bang, khi OpenAI làm việc cùng chính quyền để phát triển một khuôn khổ Sắc lệnh hành pháp về an ninh mạng và một quy trình có thể lặp lại cho các bản phát hành mô hình trong tương lai.
Giá cả và tính khả dụng
GPT-5.6 hiện có sẵn qua API và Codex cho một nhóm đối tác đáng tin cậy được chọn lọc, với quyền truy cập rộng rãi hơn qua ChatGPT và API dự kiến trong vài tuần tới. Sol có giá $5 đầu vào / $30 đầu ra trên 1 triệu token, Terra $2,50 đầu vào / $15 đầu ra, và Luna $1 đầu vào / $6 đầu ra. Đọc bộ nhớ đệm (cache reads) được giảm 90%, trong khi ghi bộ nhớ đệm (cache writes) được tính phí 1,25 lần tỷ lệ đầu vào không lưu cache với thời gian sống tối thiểu 30 phút.
OpenAI cũng công bố quan hệ đối tác với Cerebras, nhắm mục tiêu lên tới 750 token mỗi giây cho Sol bắt đầu từ tháng 7 năm 2026.
Theo Cyber Security News
Ảnh: Magda Ehlers / Pexels
