OpenAI đã chính thức giới thiệu GPT-5.6, thế hệ mô hình ngôn ngữ lớn (LLM) mới nhất, chỉ hai tháng sau khi phát hành GPT-5.5. Tuy nhiên, việc triển khai đến người dùng sẽ không đơn giản như các bản cập nhật trước đây cho ChatGPT và Codex.

Ba mô hình GPT-5.6: Sol, Terra và Luna

OpenAI công bố GPT-5.6 bao gồm ba phiên bản, lấy cảm hứng từ Mặt Trời, Trái Đất và Mặt Trăng. Cụ thể: Sol là mô hình chủ lực (flagship), Terra là mô hình cân bằng cho công việc hàng ngày, và Luna là mô hình nhanh và giá rẻ. Công ty giải thích rằng với hệ thống đặt tên mới, số hiệu (5.6) xác định thế hệ, trong khi Sol, Terra, Luna xác định các bậc năng lực bền vững có thể tiến hóa theo nhịp riêng.

Triển khai giới hạn theo yêu cầu của chính phủ Mỹ

OpenAI cho biết họ đang bắt đầu một bản xem trước giới hạn (limited preview) cho dòng GPT-5.6. Việc phát hành theo từng đợt là do phối hợp với chính phủ Mỹ. Công ty nêu rõ: 'Chúng tôi tin vào khả năng tiếp cận rộng rãi và dự định phát hành công khai GPT-5.6 Sol, Terra và Luna trong vài tuần tới. Là một phần trong quá trình hợp tác liên tục với chính phủ Mỹ, chúng tôi đã xem xét trước các kế hoạch và khả năng của mô hình trước khi ra mắt. Theo yêu cầu của họ, chúng tôi bắt đầu với bản xem trước giới hạn cho một nhóm nhỏ các đối tác đáng tin cậy, trước khi phát hành rộng rãi hơn.'

Khả năng vượt trội: lý luận max và ultra

GPT-5.6 Sol giới thiệu các tùy chọn lý luận 'max' và 'ultra' mới. OpenAI cho biết: 'Với GPT-5.6, chúng tôi giới thiệu một nỗ lực lý luận tối đa (max reasoning effort) mới để Sol có nhiều thời gian nhất suy luận sâu. Ngoài ra, chúng tôi giới thiệu chế độ ultra vượt xa khả năng của một tác nhân đơn lẻ bằng cách tận dụng các tác nhân phụ (subagents) để tăng tốc các công việc phức tạp.' Mô hình mới thể hiện sự tiến bộ trong lĩnh vực lập trình, sinh học và an ninh mạng.

Giá sử dụng theo token

OpenAI công bố giá cho GPT-5.6 tính trên 1 triệu token, với ba mức: Sol: $5 đầu vào / $30 đầu ra; Terra: $2.50 đầu vào / $15 đầu ra; Luna: $1 đầu vào / $6 đầu ra. GPT-5.6 cũng giới thiệu cơ chế lưu đệm (prompt caching) dễ dự đoán hơn, bao gồm hỗ trợ điểm ngắt bộ đệm rõ ràng và thời gian sống tối thiểu 30 phút. Đối với GPT-5.6 và các mô hình sau, ghi vào bộ đệm được tính phí gấp 1.25 lần tỷ lệ đầu vào không lưu đệm, trong khi đọc từ bộ đệm vẫn được giảm 90%.

An toàn và bảo mật

Về an ninh mạng, OpenAI cho biết họ đã phát triển GPT-5.6 Sol, Terra và Luna với các biện pháp bảo vệ mạnh mẽ nhất từ trước đến nay, với cấu hình phù hợp với khả năng của từng mô hình. Trong giai đoạn xem trước giới hạn, chỉ một nhóm đối tác và tổ chức đáng tin cậy được chọn mới có quyền truy cập.

Theo 9to5Mac

Ảnh: 2857440 / Pixabay