Tại AWS Summit New York City, Amazon Web Services (AWS) công bố loạt cải tiến mang tên 'context intelligence' (trí thông minh ngữ cảnh), giúp các AI agent truy cập dữ liệu có quản trị, học từ cách sử dụng và hoạt động trên nền tảng mở. Trọng tâm là dịch vụ mới AWS Context (sắp ra mắt) tự động xây dựng đồ thị tri thức từ dữ liệu hiện có, cùng với các bản cập nhật cho AWS Glue Data Catalog và Amazon S3 Annotations.
AWS Context là gì và giải quyết vấn đề gì?
AWS Context là dịch vụ mới tự động ánh xạ mối quan hệ giữa các dữ liệu hiện có của khách hàng thành một đồ thị tri thức (knowledge graph) và cung cấp khả năng tìm kiếm tác tử (agentic search), cho phép AI agent trong tổ chức truy cập các mối quan hệ dữ liệu có quản trị, quy tắc kinh doanh và kiến thức miền tại thời điểm chạy (runtime). Dịch vụ này dựa trên công nghệ đồ thị tri thức tương tự đã vận hành trong Amazon Quick, nơi hàng trăm nghìn người dùng tương tác hàng ngày với đồ thị tri thức sản xuất, xử lý hàng triệu yêu cầu mỗi ngày. Với AWS Context, đồ thị tri thức cá nhân được mở rộng thành đồ thị tri thức tổ chức – một lớp ngữ cảnh dùng chung, có quản trị cho các agent và ứng dụng.
Người quản trị dữ liệu (data stewards) và người giám tuyển (curators) có thể quản lý đồ thị qua giao diện trực quan, xem xét các mối quan hệ được suy luận, đưa vào sản xuất và gắn kèm kiến thức miền như định nghĩa kinh doanh và quy tắc sử dụng. AWS Context tích hợp với AWS Glue Data Catalog, Amazon SageMaker Unified Studio và AWS Lake Formation, cho phép các nhóm quản trị đồ thị bằng quy tắc kinh doanh và quyền, đồng thời tự động thêm ngữ cảnh mới với sự hỗ trợ của AI hoặc thông qua giám tuyển thủ công.
Ba tính năng chính của AWS Context: Học từ cách dùng, mở và di động, nhận dạng danh tính
AWS Context có ba khả năng cốt lõi. Thứ nhất, ngữ cảnh học từ cách agent làm việc: khi agent truy vấn đồ thị, dịch vụ quan sát nguồn nào cho kết quả đúng, đường nối (join path) nào được dùng, quy tắc nào được áp dụng; nó xếp hạng nguồn theo mức sử dụng thực tế và chia sẻ thông tin học được trên toàn tổ chức, giúp các agent khác hưởng lợi mà không cần con người giám tuyển lại.
Thứ hai, AWS Context được thiết kế mở và di động: tất cả siêu dữ liệu chính từ nguồn có cấu trúc và phi cấu trúc được xuất bản sang định dạng Apache Iceberg trong Amazon S3 Tables. Khách hàng có thể truy vấn ngữ cảnh bằng Amazon Athena, Amazon Redshift, Apache Spark hoặc bất kỳ engine tương thích Iceberg nào, đồng thời xây dựng hệ thống hạ nguồn, kiểm toán hoặc di chuyển dữ liệu. Dịch vụ cũng kết nối với các catalog bên thứ ba, cho phép mang ngữ cảnh từ hệ thống ngoài AWS vào cùng một đồ thị. Agent truy vấn qua API tìm kiếm tác tử và công cụ MCP, bất kể chúng được xây dựng trên Amazon Bedrock AgentCore, triển khai trên Amazon EKS hay chạy trên framework tương thích MCP.
Thứ ba, AWS Context nhận dạng danh tính và quản trị mặc định: mỗi truy vấn kế thừa quyền IAM và Lake Formation của người dùng gọi, do đó agent chỉ có thể thấy và duyệt các mối quan hệ mà danh tính của nó được phép truy cập. Mọi tương tác đều có thể kiểm toán, giúp đội ngũ bảo mật và tuân thủ xác minh agent đã truy cập dữ liệu nào và dưới quyền hạn nào.
AWS Glue Data Catalog bổ sung ngữ cảnh kinh doanh và tìm kiếm ngữ nghĩa
Cũng tại sự kiện, AWS công bố bản xem trước (preview) của tính năng ngữ cảnh kinh doanh (business context) và tìm kiếm ngữ nghĩa (semantic search) cho AWS Glue Data Catalog. Khách hàng có thể làm giàu các bảng, view và cột Glue (bao gồm các bảng được hỗ trợ bởi S3 Tables) với mô tả kinh doanh, thuật ngữ chú giải, siêu dữ liệu tùy chỉnh và liên kết chúng với skill assets – một loại tài sản mới tham chiếu URI đến các tệp như kỹ năng AI, tệp markdown hướng dẫn, runbook nhóm, được lưu trữ ở S3, kho git hoặc wiki. Skill assets cung cấp cho AI agent ngữ cảnh và hướng dẫn bổ sung để làm việc với dữ liệu cụ thể mà không cần dạy lại từng agent.
Ví dụ, skill URI có thể trỏ đến kho lưu trữ của nhóm với tài liệu miền cụ thể, bao gồm chi tiết sử dụng dữ liệu như hạt (grain) và phạm vi (scope), các mẫu truy vấn phổ biến và quy tắc sử dụng. AWS Agent Toolkit hiện chứa các kỹ năng mặc định giúp AI agent làm việc với Glue Data Catalog, Amazon Athena và S3 Tables. Các nhà phát triển có thể kết nối agent tương thích MCP thông qua AWS MCP từ xa, được quản lý hoàn toàn, hoặc cài plugin aws-data-analytics cho Claude Code, Cursor và Amazon Kiro để yêu cầu agent tìm dữ liệu, phân tích hoặc xây dựng ứng dụng.
Amazon S3 Annotations: Gắn ngữ cảnh phong phú trực tiếp vào đối tượng S3
Amazon S3 Annotations chính thức có sẵn (generally available), cho phép khách hàng đính kèm ngữ cảnh kinh doanh phong phú, có thể truy vấn trực tiếp vào các đối tượng S3 và lưu trữ ngữ cảnh đó trong bảng S3 Iceberg. Mỗi đối tượng trong S3 có thể có tới 1 GB ngữ cảnh. Chú thích (annotations) có thể thay đổi (mutable), cho phép ngữ cảnh tiến hóa khi dữ liệu thay đổi. Chú thích tồn tại cùng với đối tượng S3 trong bộ nhớ S3, di chuyển theo đối tượng qua các thao tác sao chép và nhân bản, và bị xóa khi đối tượng bị xóa. Không cần xây dựng cơ sở dữ liệu siêu dữ liệu riêng biệt, đồng bộ hoặc tránh lệch lạc.
Chú thích có thể truy vấn thông qua S3 Metadata. Khi bật bảng chú thích trên một bucket, mọi chú thích tự động chảy vào bảng Iceberg được quản lý hoàn toàn. Khách hàng có thể truy vấn trên tất cả đối tượng bằng Amazon Athena, Amazon Redshift hoặc bất kỳ engine tương thích Iceberg nào, và agent có thể khám phá chú thích bằng ngôn ngữ tự nhiên thông qua máy chủ MCP của S3 Tables.
Mai-Lan Tomsen Bukovec, Phó Chủ tịch Công nghệ tại AWS, người đứng đầu các dịch vụ dữ liệu đám mây Amazon, cho biết: 'Ngữ cảnh là hồ dữ liệu cho AI agent. Với những cải tiến này, chúng tôi đang xây dựng nền tảng tri thức và trí thông minh cho AI agent tương tác với dữ liệu trên quy mô tổ chức và doanh nghiệp.'
Theo Amazon Web Services (AWS)
Ảnh: cottonbro studio / Pexels
