Khái niệm 'tự cải thiện đệ quy' (Recursive Self-Improvement - RSI) đang trở thành tâm điểm chú ý trong giới AI, khi nhiều công ty tuyên bố mô hình của họ đã thể hiện các dấu hiệu của RSI. Theo báo cáo của Anthropic công bố ngày 16/6/2026, tính đến tháng 5/2026, hơn 80% mã nguồn được hợp nhất vào kho lưu trữ của Anthropic do Claude viết, và Claude đã thực hiện khoảng 800 giờ thí nghiệm nghiên cứu an toàn AI một cách tự chủ. Điều này cho thấy RSI có thể đến sớm hơn dự kiến, đặt ra những thách thức lớn cho quản lý và an toàn.

RSI là gì và tại sao quan trọng?

RSI là quá trình AI can thiệp vào việc cải thiện chính nó, tạo ra vòng lặp phản hồi tích cực: năng lực tăng → khả năng nghiên cứu tăng → năng lực tăng thêm. Nếu vòng lặp này hoàn thiện, năng lực AI có thể tăng theo cấp số nhân. Ý tưởng này bắt nguồn từ nhà toán học người Anh Irving J. Good vào năm 1965, người đã đề xuất khái niệm 'bùng nổ thông minh'. Năm 2008, Eliezer Yudkowsky định nghĩa RSI là AI viết lại thuật toán nhận thức của chính nó, đóng vòng lặp cải thiện. Năm 2014, triết gia Nick Bostrom trong cuốn 'Superintelligence' nhấn mạnh RSI làm thay đổi tỷ lệ giữa lao động con người và AI trong nghiên cứu AI, đưa AI từ công cụ trở thành 'AI trẻ' có khả năng tự tiến hóa.

Các công ty đã đạt được RSI đến đâu?

Nhiều công ty đã công bố các dấu hiệu RSI. Tháng 5/2025, Google DeepMind công bố AlphaEvolve sử dụng Gemini để tạo ra các thuật toán ứng viên, tối ưu hóa trung tâm dữ liệu, thiết kế chip và quy trình đào tạo AI. Tháng 2/2026, OpenAI phát hành GPT-5.3-Codex, mô hình đã tham gia vào quá trình tạo ra chính nó, bao gồm giám sát, gỡ lỗi và quản lý triển khai. Meta công bố HyperAgents, có thể sửa đổi 'meta-agent' chịu trách nhiệm sửa đổi các tác nhân nhiệm vụ. Tuy nhiên, theo các chuyên gia, tất cả các trường hợp này chỉ là 'RSI một phần' hoặc 'RSI yếu', vì con người vẫn kiểm soát các quyết định quan trọng như mục tiêu đào tạo, kiến trúc cơ bản và phê duyệt triển khai.

Rủi ro từ RSI: từ tấn công mạng đến chạy đua vũ trang

RSI làm tăng đáng kể các rủi ro hiện có. AI có thể tự động hóa các cuộc tấn công mạng, tự điều chỉnh dựa trên kết quả trước đó, làm tăng hiệu quả và mức độ thiệt hại. Trong lĩnh vực quân sự, nếu nhiều quốc gia triển khai AI có khả năng RSI, cạnh tranh có thể leo thang, tăng nguy cơ xung đột. Khi AI đạt đến AGI hoặc ASI, rủi ro càng lớn hơn, bao gồm khả năng AI lừa con người từ bỏ quyền kiểm soát các nguồn lực quan trọng như điện và tính toán. RSI cũng làm suy yếu khả năng ứng phó rủi ro theo kiểu 'chắp vá' hiện tại, vì tốc độ và tần suất rủi ro tăng vọt, trong khi khả năng phát hiện rủi ro của con người giảm do tự động hóa.

Đề xuất giám sát: phân quyền và bốn 'cánh cổng'

OpenAI và Anthropic đã đưa ra các đề xuất giám sát. OpenAI nhấn mạnh vai trò của Trung tâm Tiêu chuẩn và Đổi mới AI Hoa Kỳ (CAISI) trong việc đánh giá các mô hình tiên tiến, thiết lập hệ sinh thái đánh giá độc lập và ưu tiên giám sát tiến trình RSI. Anthropic đề xuất một cơ chế tạm dừng có thể phối hợp và kiểm tra được, yêu cầu các nhà phát triển kiểm tra mô hình, công bố biện pháp an toàn và chịu phạt dân sự nếu vi phạm. Tuy nhiên, cả hai đều thiếu các chi tiết cụ thể về cách kiểm soát vòng lặp RSI. Một đề xuất mới là phân loại năng lực đệ quy thành năm cấp độ, từ hỗ trợ nghiên cứu thông thường đến RSI hoàn chỉnh, và áp dụng bốn 'cánh cổng': năng lực, tài nguyên, đánh giá và triển khai. Các cánh cổng này đảm bảo quyền nghiên cứu, đánh giá, tài nguyên và triển khai không tập trung vào một hệ thống duy nhất, ngăn chặn RSI tự động vận hành mà không có sự giám sát của con người.

Theo Eeo

Ảnh: DeltaWorks / Pixabay