Nội dung bài viết
StrictlyVC đầu tiên của năm 2026 sẽ ra mắt SF vào ngày 30 tháng 4. Vé đang bán rất nhanh.
Đăng ký ngay bây giờ. Nhận khoản tiết kiệm từ chương trình Disrupt Early Bird lên tới 410 USD trước 11:59 tối ngày 29 tháng 5.
PT. Đăng ký ngay bây giờ.
Cơ sở hạ tầng đám mây từ lâu đã được thiết kế xoay quanh con người, những người tìm kiếm, nhấp chuột, cuộn và phát trực tuyến một cách ổn định và có thể dự đoán được. Các tác nhân AI hành xử khác nhau.
Họ có thể giải phóng một loạt hoạt động, tạo ra nhiều tác nhân phụ truy vấn hàng trăm cơ sở dữ liệu, tìm kiếm tài liệu và gọi API trong vài giây rồi biến mất ngay khi chúng đến. Với tiền đề đó, Amazon đang thiết kế lại phần cốt lõi của cơ sở hạ tầng đám mây của mình.
Vào thứ Năm, AWS đã ra mắt OpenSearch Serverless thế hệ tiếp theo, cơ sở dữ liệu vectơ và tìm kiếm được quản lý hoàn toàn — về cơ bản là một hệ thống lưu trữ và truy xuất thông tin trên quy mô lớn — được thiết kế dành riêng cho khối lượng công việc tổng đài.
AWS cho biết hệ thống mới có thể mở rộng quy mô ngay lập tức khi tác nhân kích hoạt tác vụ và giảm quy mô về 0 khi không hoạt động.
Sự ra mắt này phản ánh nhận thức ngày càng tăng trong toàn ngành công nghệ: Cơ sở hạ tầng ban đầu được thiết kế cho Internet do con người điều khiển không hoạt động tốt trong một thế giới ngày càng có nhiều đại lý.
Trong khi các tác nhân AI vẫn đại diện cho một phần tương đối nhỏ của hoạt động internet, lưu lượng truy cập do máy tạo ra đã rất đáng kể và sẵn sàng tăng trưởng. Cloudflare cho biết bot chiếm 31% tổng lưu lượng HTTP trong sáu tháng qua.
Trình thu thập dữ liệu AI, công cụ tìm kiếm và trợ lý chiếm khoảng 1/4 tổng số yêu cầu từ bot trong khoảng thời gian đó.
Lai Yi Ohlsen, giám đốc sản phẩm cấp cao tại Cloudflare, cho TechCrunch cho biết: “Lưu lượng truy cập không phải của con người sẽ vượt quá lưu lượng truy cập của con người vào nửa đầu năm 2027”.
Tại hội nghị nhà phát triển I/O của Google vào tuần trước, công ty cho biết người dùng sẽ có thể bắt đầu giao nhiệm vụ cho các hệ thống AI, như nghiên cứu hoạt động mua hàng, đặt chỗ du lịch, duyệt web và tương tác với các ứng dụng.
Nhưng vấn đề không dừng lại ở các đại lý AI tập trung vào người tiêu dùng. Các doanh nghiệp đang ngày càng triển khai các đại lý trong nội bộ và cho khách hàng của mình, tạo ra các loại lưu lượng truy cập mới do máy tạo ra ở hậu trường.
Do đó, các nhà cung cấp đám mây và các công ty cơ sở hạ tầng đã tính toán cách điều chỉnh các hệ thống được xây dựng cho con người với thế giới các tác nhân liên tục và tự động truy xuất thông tin, gọi công cụ và tạo lưu lượng truy cập từ máy này sang máy khác.
Đó là nơi tổ chức OpenSearch Serverless mới của AWS "Thời gian rất đơn giản. Các đại lý đang chuyển từ thử nghiệm sang sản xuất và họ tạo ra các mô hình lưu lượng truy cập mà cơ sở hạ tầng trước đó không được thiết kế cho", Tia White, tổng giám đốc của Dịch vụ tìm kiếm mở Amazon, nói với TechCrunch.
“Chúng tăng vọt mà không báo trước, ngừng hoạt động mà không báo trước và doanh nghiệp cần tìm kiếm liên tục mà không phải trả tiền cho những máy tính trống hoặc không hoạt động.” Thay đổi kỹ thuật quan trọng với thế hệ mới này là nó tách riêng điện toán khỏi bộ lưu trữ, cho phép điện toán tăng quy mô trong vài giây để đáp ứng sự bùng nổ lưu lượng của tổng đài viên và giảm quy mô xuống 0, do đó khách hàng chỉ phải trả 0 USD khi tổng đài viên không hoạt động.
“Trước đây, ngay cả trong phiên bản Serverless trước đây của chúng tôi, bạn phải có ít nhất một phiên bản hoạt động và đang chạy vì bộ nhớ và điện toán được kết hợp với nhau,” White nói.
“Bạn không thể tự động tăng tốc [điện toán] theo tốc độ bạn cần, vì vậy, bạn luôn có điện toán nhàn rỗi dành riêng cho khối lượng công việc của mình, cho dù bạn có sử dụng nó hay không.” Hãy nghĩ về nó giống như việc bạn luôn trả tiền cho một chỗ đậu xe, ngay cả khi bạn không sử dụng nó.
Với Serverless được nâng cấp của AWS, việc này giống như trả tiền cho một chỗ đỗ xe có đồng hồ tính giờ hơn.
Khi ra mắt, OpenSearch Serverless sẽ tích hợp nativ ely với các nền tảng phát triển AI như Vercel và Kiro, vì vậy các nhà phát triển có thể triển khai phần phụ trợ vectơ và tìm kiếm sẵn sàng sản xuất cho các đại lý mà không cần quản lý cơ sở hạ tầng.
Sự thay đổi đang nổi lên trong ngành công nghiệp đám mây. Databricks và Snowflake đang tái định vị mình là hệ thống truy xuất và bộ nhớ AI cho dữ liệu doanh nghiệp.
Microsoft đã tung ra các bản cập nhật cho Azure được thiết kế để xử lý các đợt tác nhân AI và chia sẻ bộ nhớ giữa các tác nhân. Cloudflare, tương tự như Amazon, vào tháng trước đã giới thiệu cơ sở hạ tầng nhằm cung cấp cho các đại lý môi trường ổn định và khả năng mở rộng tức thì.
Càng nhiều công ty triển khai các tác nhân AI thì áp lực phải thiết kế lại cơ sở hạ tầng xung quanh khối lượng công việc do máy tạo ra càng lớn, điều này có thể khiến các tác nhân trở nên rẻ hơn và dễ triển khai hơn ở quy mô lớn hơn.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.