AI coding tools có thực sự tăng năng suất lập trình viên không?

Có, nghiên cứu cho thấy autocomplete tăng commit 40%, sync agents nâng lên 140%, và async agents đạt 180% so với không dùng AI.

Tại sao năng suất viết code tăng mạnh nhưng số bản phát hành phần mềm chỉ tăng 30%?

Do các khâu hạ nguồn như review, tích hợp, kiểm thử vẫn do con người thực hiện, tạo thành nút thắt khiến đầu ra cuối cùng bị giới hạn.

Nghiên cứu này dựa trên dữ liệu nào?

Nghiên cứu kết hợp lịch sử GitHub của hơn 100.000 lập trình viên với dữ liệu sử dụng nội bộ từ Microsoft, áp dụng phương pháp matched event-study.

AI coding tools tăng 180% năng suất viết code nhưng chỉ ship thêm 30%: 'Nút thắt' trong sản xuất phần mềm

Nghiên cứu mới từ CEPR chỉ ra rằng các công cụ AI coding thế hệ mới giúp lập trình viên viết code nhanh hơn tới 180%, nhưng số lượng bản phát hành phần mềm chỉ tăng 30% do 'nút thắt' ở các khâu kiểm thử, tích hợp và phát hành do con người thực hiện.

Một nghiên cứu mới của các nhà kinh tế M. Demirer, L. Musolff và L. Yang (2026) đã đo lường tác động của ba thế hệ công cụ AI hỗ trợ lập trình lên năng suất ở từng tầng trong quy trình sản xuất phần mềm. Kết quả cho thấy: dù năng suất viết code (đo bằng số commit) tăng vọt tới 180% khi kết hợp cả ba thế hệ, số dự án hoàn thành chỉ tăng 50% và số bản phát hành (release) chỉ tăng 30%. Nguyên nhân là do các khâu hạ nguồn như review, tích hợp, kiểm thử vẫn do con người đảm nhiệm và trở thành 'nút thắt' (bottleneck) trong dây chuyền sản xuất.

Ba thế hệ công cụ AI coding và mức tăng năng suất theo từng thế hệ

Nghiên cứu phân tích ba thế hệ công cụ AI coding đã được áp dụng rộng rãi: autocomplete (gợi ý code khi gõ, có từ 2021), sync agents (viết và chỉnh sửa code theo thời gian thực, như Claude Code) và async agents (làm việc tự động không cần giám sát, như GitHub Coding Agent hay OpenAI Codex). Sử dụng dữ liệu từ hơn 100.000 lập trình viên trên GitHub kết hợp với hồ sơ sử dụng nội bộ của Microsoft, các tác giả áp dụng phương pháp matched event-study để so sánh năng suất của người dùng AI với nhóm đối chứng có hoạt động tương tự một năm trước đó.

Kết quả cho thấy mỗi thế hệ công cụ đều mang lại mức tăng năng suất lớn hơn thế hệ trước. Cụ thể, autocomplete giúp tăng số commit (thước đo hoạt động coding) khoảng 40%. Khi kết hợp thêm sync agents, mức tăng tích lũy lên khoảng 140%. Và khi thêm async agents, con số này đạt khoảng 180%. Mức tăng này lớn hơn ở những lập trình viên ít hoạt động, nhưng vẫn đáng kể trên toàn bộ phân phối hoạt động, và tăng dần theo thời gian cùng với các bản phát hành mô hình lớn.

Từ code đến sản phẩm: 'Nút thắt' ở khâu hạ nguồn

Mặc dù năng suất viết code tăng mạnh, nhưng khi nhìn lên các tầng cao hơn trong hệ thống phân cấp sản xuất phần mềm, mức tăng này suy giảm đáng kể. Kết hợp cả ba thế hệ công cụ, số commit tăng gấp ba lần, số dòng code tăng nhiều hơn thế, nhưng số dự án chỉ tăng khoảng 50% và số bản phát hành chỉ tăng khoảng 30%. Riêng với sync agents, số dòng code tăng hơn bảy lần kéo theo số pull request tăng 65%, nhưng số release chỉ tăng 20%.

Sự suy giảm này phù hợp với giả thuyết 'weak links' (mắt xích yếu) trong sản xuất: khi các công đoạn bổ trợ mạnh cho nhau, việc tự động hóa một công đoạn sẽ chỉ mang lại lợi ích có giới hạn cho đầu ra cuối cùng. Trong mô hình của nghiên cứu, code do AI viết vẫn cần được con người review, tích hợp, kiểm thử và phát hành. Nút thắt đang chuyển từ việc viết code sang các công đoạn hạ nguồn do con người thực hiện.

Tác động ở cấp độ tổng hợp: Nhiều ứng dụng hơn nhưng không nhiều người dùng hơn

Trên GitHub, số lượng thay đổi code hoàn thành (merged pull requests) và số dự án mới (repository) đều tăng tốc từ đầu năm 2025, trùng với sự gia tăng của các commit do agent tạo ra. Đến đầu năm 2026, hơn 5% commit công khai đến từ một công cụ duy nhất là Claude Code, một con số ước tính thấp hơn thực tế vì hầu hết việc sử dụng AI không để lại dấu vết.

Tuy nhiên, khi xem xét dữ liệu từ bốn chợ ứng dụng lớn (Apple App Store, Google Play, Chrome Web Store và SourceForge), số lượng ứng dụng mới phát hành có tăng nhưng không đồng đều. Ví dụ, số ứng dụng iOS mới hàng tháng tăng gần gấp đôi từ đầu 2025 đến tháng 4/2026, Chrome extensions cũng tăng tốc, Google Play phá vỡ xu hướng giảm kéo dài nhiều năm, trong khi SourceForge hầu như không thay đổi. Dù nguồn cung ứng dụng tăng, tổng mức tương tác (engagement) của mỗi nhóm ứng dụng mới trong ba tháng đầu lại không tăng hoặc giảm trên tất cả các chợ. Tỷ lệ ứng dụng mới không đạt được lượng người dùng khiêm tốn cũng tăng lên.

Có hai cách giải thích cho hiện tượng này: hoặc các ứng dụng mới có chất lượng thấp hơn do chi phí gia nhập giảm, hoặc sự chú ý của người tiêu dùng là một nút thắt khác không mở rộng theo số lượng ứng dụng. Dù theo cách nào, sự mở rộng nguồn cung vẫn chưa chuyển thành mức tiêu thụ phần mềm cao hơn.

Hàm ý cho tương lai: Cần tập trung vào các khâu hạ nguồn

Kết quả nghiên cứu có hàm ý trực tiếp cho cuộc tranh luận về năng suất AI: khi các công đoạn sản xuất bổ trợ cho nhau, không thể ngoại suy trực tiếp mức tăng năng suất ở cấp độ tác vụ thành đầu ra tổng hợp. Trong lĩnh vực phần mềm – lĩnh vực ứng dụng AI tiên tiến nhất – mức tăng 180% trong hoạt động coding chỉ trở thành mức tăng 30% trong số bản phát hành và chưa có tác động đo lường được đến mức sử dụng. Các dự báo tăng trưởng áp dụng ước tính cấp tác vụ mà không điều chỉnh cho các nút thắt hạ nguồn sẽ đánh giá quá cao tác động ngắn hạn của AI.

Tuy nhiên, mức tăng 50% số dự án và 30% số bản phát hành vẫn là hiệu quả đáng kể đối với bất kỳ công nghệ nơi làm việc nào. Các nhà cung cấp công cụ đang tích cực làm việc để dịch chuyển các nút thắt, chẳng hạn như phát triển AI cho code review. Các công cụ agent mạnh mẽ mới chỉ phổ biến từ năm 2025, và tác động ước tính tăng lên theo mỗi bản phát hành mô hình lớn, do đó tác động đến đầu ra cuối cùng có thể tăng lên khi công nghệ trưởng thành và lan tỏa. Lịch sử các công nghệ đa năng cho thấy các nút thắt cuối cùng cũng sẽ dịch chuyển. Cho đến lúc đó, câu nói của Solow vẫn còn nguyên giá trị: người ta thấy kỷ nguyên AI ở khắp mọi nơi trong code, nhưng chỉ một phần trong thống kê sản phẩm.

Theo CEPR

Ảnh: Innovalabs / Pixabay