OpenAI đã bắt đầu phát hành bản xem trước giới hạn của GPT-5.6, giới thiệu ba mô hình Sol, Terra và Luna nhằm đáp ứng các nhu cầu khác nhau về hiệu năng, tốc độ và chi phí. Các mô hình này ban đầu chỉ khả dụng qua API và Codex cho một nhóm nhỏ đối tác tin cậy, và dự kiến sẽ được mở rộng ra ChatGPT, Codex và API trong những tuần tới.

Ba mô hình với ba mức giá và hiệu năng khác nhau

GPT-5.6 Sol là mô hình hàng đầu, được thiết kế cho các tác vụ phức tạp như lập trình, nghiên cứu, sinh học và an ninh mạng. Sol có thêm chế độ suy luận tối đa và chế độ Ultra sử dụng nhiều tác nhân phụ để xử lý các tác vụ phức tạp hơn. Terra được định vị là lựa chọn chi phí thấp hơn cho công việc hàng ngày, với hiệu năng cạnh tranh với GPT-5.5 nhưng giá API chỉ bằng khoảng một nửa. Luna là mô hình rẻ nhất, phù hợp cho các khối lượng công việc ưu tiên tốc độ và số lượng lớn.

Giá API cụ thể như sau: Luna có giá 1 USD cho mỗi triệu token đầu vào và 6 USD cho mỗi triệu token đầu ra; Terra có giá 2,50 USD cho đầu vào và 15 USD cho đầu ra; Sol có giá 5 USD cho đầu vào và 30 USD cho đầu ra.

Hiệu năng vượt trội trên Terminal-Bench và cải thiện trong sinh học

Trên Terminal-Bench 2.1, một bài kiểm tra đo lường quy trình làm việc lập trình dòng lệnh, GPT-5.6 Sol đạt 88,8% và Sol Ultra đạt 91,9%. OpenAI cho biết Sol cũng cải thiện so với GPT-5.5 trong lĩnh vực genomics và sinh học định lượng, đồng thời sử dụng ít token đầu ra hơn. Tuy nhiên, OpenAI chưa công bố đầy đủ kết quả đánh giá GPT-5.6; bộ đánh giá mở rộng dự kiến sẽ được phát hành khi các mô hình được phổ biến rộng rãi hơn.

An ninh mạng và các biện pháp bảo vệ bổ sung

OpenAI mô tả GPT-5.6 Sol là mô hình an ninh mạng mạnh nhất từ trước đến nay, với hiệu năng vượt trội trong nghiên cứu lỗ hổng và các tác vụ liên quan đến khai thác. Tuy nhiên, Sol không vượt qua ngưỡng Cyber Critical theo Khung chuẩn bị của OpenAI. Trong các thử nghiệm với Chromium và Firefox, mô hình đã xác định được các lỗ hổng và thành phần có thể góp phần tạo ra khai thác, nhưng không tự tạo ra được một khai thác hoàn chỉnh độc lập trong điều kiện thử nghiệm.

Do năng lực an ninh mạng tăng lên, OpenAI đã bổ sung các biện pháp bảo vệ bao gồm từ chối ở cấp độ mô hình, bộ phân loại thời gian thực cho các yêu cầu về an ninh mạng và sinh học, giám sát cấp tài khoản, kiểm soát truy cập phân biệt và xem xét thêm các đầu ra có rủi ro cao. Một số thế hệ có thể bị tạm dừng trong khi một mô hình suy luận lớn hơn xem xét cuộc hội thoại. OpenAI cho biết người dùng trong bản xem trước có thể gặp các yêu cầu bị chặn hoặc phản hồi chậm hơn khi các biện pháp bảo vệ can thiệp, kể cả trong các công việc bảo mật hợp pháp.

OpenAI đã dành hơn 700.000 giờ xử lý trên chip đồ họa tương đương A100 cho red-teaming tự động tập trung vào các cuộc tấn công vượt rào phổ quát. Các chuyên gia bên thứ ba cũng đang thử nghiệm các mô hình trong giai đoạn xem trước.

Kế hoạch phát hành rộng rãi và thay đổi về bộ nhớ đệm

OpenAI cho biết việc triển khai theo giai đoạn nhằm có thêm thời gian thử nghiệm các mô hình và biện pháp bảo vệ trước khi phát hành chính thức. Công ty cũng đã thay đổi chính sách bộ nhớ đệm: ghi bộ nhớ đệm cho GPT-5.6 và các mô hình tương lai sẽ có giá gấp 1,25 lần tỷ lệ đầu vào không lưu cache, trong khi đọc bộ nhớ đệm vẫn được giảm 90%.

Greg Brockman, Chủ tịch kiêm Đồng sáng lập OpenAI, cho biết: "Bằng cách tự thiết kế nhiều phần hơn của ngăn xếp, chúng tôi có thể cung cấp nhiều trí thông minh hơn với hiệu quả cao hơn và tiếp tục thúc đẩy AI tiên tiến hướng tới tiếp cận rộng rãi hơn."

GPT-5.6 Sol cũng dự kiến ra mắt trên Cerebras vào tháng 7 với tốc độ lên tới 750 token mỗi giây. Quyền truy cập ban đầu sẽ bị giới hạn cho các khách hàng được chọn trong khi mở rộng năng lực.

Theo EdTech Innovation Hub

Ảnh: demelomacedom / Pixabay