Apple đã chính thức giới thiệu Siri AI tại WWDC 2026 vào ngày 8/6 (giờ Mỹ), nhưng không phải theo cách thường thấy. Thay vì một đoạn video được biên tập hoàn hảo, Apple cố tình để lại những khoảng chờ xử lý và độ trễ – thứ từng bị cắt bỏ trong các năm trước – nhằm chứng minh một điều: sản phẩm này thực sự hoạt động, dù chưa hoàn hảo. Đây là tuyên bố ngầm về sự trung thực sau thất bại năm 2024, khi Apple hứa hẹn một Siri hiểu ngữ cảnh cá nhân nhưng không kịp ra mắt đúng hạn vào năm 2025.
Chiến lược 'không mạnh nhất' – Apple chọn trò chơi riêng
Không giống như các đối thủ đang chạy đua phát triển các tác nhân AI tự trị (autonomous agent) tiên tiến nhất, Apple chọn một hướng đi khác. Siri AI tập trung vào các tác vụ hàng ngày: tóm tắt thông tin, tìm kiếm xuyên suốt tin nhắn, email và ảnh, cũng như hiểu ngữ cảnh trên màn hình. Về cơ bản, đây là những việc mà các chatbot miễn phí hiện nay vẫn làm. Tuy nhiên, thay vì tách thành một dịch vụ riêng, Apple nhúng chúng trực tiếp vào iOS 27 và macOS 27 như một tính năng hệ thống, sẽ được phát hành dưới dạng bản cập nhật miễn phí vào mùa thu năm nay.
Động thái này gợi nhớ đến cách Apple từng 'Sherlock' các ứng dụng của bên thứ ba – tức tích hợp chức năng của chúng vào hệ điều hành, khiến thị trường ứng dụng đó biến mất. Lần này, Apple đang làm điều tương tự với toàn bộ lĩnh vực AI tạo sinh. Câu hỏi đặt ra: nếu 'trí thông minh' của các mô hình ngôn ngữ lớn (LLM) hàng đầu chỉ còn là một tính năng tích hợp sẵn trong OS, thì lợi thế của những mô hình khổng lồ sẽ kéo dài được bao lâu?
Từ bỏ thành quả gần hoàn thiện – Apple 'xóa sổ' Siri cũ để xây lại từ đầu
Mike Rockwell, người đứng đầu bộ phận Siri, tiết lộ trong một buổi kỹ thuật sau bài phát biểu rằng: đến năm 2025, Apple đã hoàn thiện một phiên bản Siri cải tiến dần dần bằng cách thêm tính năng 'gọi công cụ' (tool calling). Tuy nhiên, họ nhận ra rằng phiên bản đó không thực sự mang lại trải nghiệm mong muốn. Quyết định được đưa ra là triệt để: 'Chúng tôi đã quay lại, xây dựng lại Siri từ đầu. Theo nghĩa đen, chúng tôi đã tháo rời hoàn toàn và dựng lại từ nền móng.'
Đây không phải lần đầu Apple chọn 'đứt gãy' thay vì kế thừa. Năm 2001, hãng từ bỏ Mac OS 9 để chuyển sang Mac OS X dựa trên Unix, một quyết định mạo hiểm nhưng đã thay đổi lịch sử. Liệu việc tái cấu trúc Siri có mang lại kết quả tương tự? Câu trả lời chỉ có sau khi người dùng thực sự trải nghiệm.
Siri AI có 'phụ thuộc vào Google Gemini' không? Câu trả lời là không
Một trong những hiểu lầm lớn nhất sau thông báo hợp tác giữa Apple và Google vào tháng 1 là 'Siri mới dựa trên Gemini'. Craig Federighi, Phó chủ tịch cấp cao phụ trách kỹ thuật phần mềm của Apple, đã bác bỏ điều này một cách rõ ràng. Ông liệt kê: Siri AI không sử dụng ứng dụng Gemini, mã nguồn Gemini, mô hình hoặc cơ sở hạ tầng của Google dành cho khách hàng, cũng như không dùng Google Search làm nền tảng kiến thức. Kết luận: 'Lượng trợ giúp từ Google mà chúng tôi sử dụng là – con số không.'
Sơ đồ kiến trúc được trình bày trên sân khấu cho thấy hai lớp: 'on-device' (thiết bị) và 'cloud' (đám mây). Phần on-device có 'System Orchestrator' làm trung tâm, phối hợp với bộ công cụ thao tác ứng dụng, chỉ mục Spotlight và ngữ cảnh màn hình. Mô hình ngôn ngữ chạy hoàn toàn trên thiết bị. Phía cloud có 'Private Cloud Compute' – nền tảng AI bảo vệ quyền riêng tư, cùng nhiều mô hình đám mây và mô hình tạo hình ảnh. Một khu vực riêng mang nhãn 'World Knowledge' do Apple xây dựng.
Vậy 'dựa trên Gemini' nghĩa là gì? Thực tế, Apple sử dụng Gemini như một 'giáo viên' để huấn luyện và tinh chỉnh các mô hình nền tảng của mình, đồng thời hợp tác với Google và NVIDIA về cơ sở hạ tầng đám mây cho các mô hình cao cấp nhất. Đây là sự lựa chọn thiết kế, không phải sự phụ thuộc.
Những điều chưa được tiết lộ – và lời hứa về quyền riêng tư
Dù Apple minh bạch về kiến trúc, vẫn còn nhiều ẩn số. Ví dụ, dữ liệu nào được dùng để huấn luyện và chưng cất (distillation) mô hình nền tảng? Làm thế nào Siri xây dựng và cập nhật chỉ mục cho thông tin thời gian thực? Federighi khẳng định không dùng Google Search để xác minh sự kiện, nhưng không nói rõ nguồn gốc của chỉ mục đó. Ranh giới kỹ thuật giữa Apple, Google và NVIDIA cũng chưa được vạch rõ.
Về quyền riêng tư, Apple nhấn mạnh vào Private Cloud Compute – một kiến trúc được thiết kế để 'xóa mọi dấu vết dữ liệu ngay sau khi trả lời câu hỏi'. Federighi mô tả đây là 'một môi trường tính toán hoàn toàn kín', chỉ sử dụng tạm thời để đáp ứng yêu cầu. Tuy nhiên, điều này chỉ đảm bảo cách dữ liệu được xử lý, chứ không giải quyết vấn đề minh bạch về nguồn gốc của mô hình. Hai khía cạnh này cần được tách bạch để đánh giá công bằng.
Siri AI – bản beta tiếng Anh trong năm 2026, tiếng Nhật và các ngôn ngữ khác chưa có lịch cụ thể
Phiên bản beta của Siri AI sẽ bắt đầu bằng tiếng Anh trong năm 2026. Các ngôn ngữ khác, bao gồm tiếng Nhật, sẽ được mở rộng dần nhưng chưa có thời gian biểu cụ thể. Apple, vốn bị coi là 'chậm chân' trong cuộc đua AI, đã chọn cách tận dụng hệ sinh thái và sức mạnh thiết bị để tạo ra trải nghiệm AI thiết thực và an toàn nhất có thể. Họ không cố gắng trở lại – họ đã chọn lại trò chơi mà họ muốn thắng.
Theo Wired
Ảnh: Matheus Bertelli / Pexels
