Nội dung bài viết
Trong toàn ngành, các công ty đang bắt đầu chùn bước trước mức giá của AI. Uber đã tiêu hết toàn bộ ngân sách mã hóa AI năm 2026 vào tháng 4.
Microsoft đã thu hồi giấy phép Claude Code của các nhà phát triển vài tháng sau khi kích hoạt chúng. Một nhân viên của Priceline nói với TechCrunch rằng việc gia hạn hợp đồng Cursor định kỳ sẽ đắt hơn gấp 4-5 lần.
Mặc dù giá mỗi mã thông báo đã giảm nhưng việc thúc đẩy áp dụng AI nhiều hơn và các đại lý ngày càng tự chủ hơn đã thúc đẩy mức tiêu thụ mã thông báo ngày càng cao hơn.
Các công ty đã nỗ lực đăng ký ăn thỏa sức vào đầu năm 2025 hiện đang cố gắng tìm hiểu xem tiền của họ sẽ đi đâu, cắt giảm chi tiêu và tìm hiểu xem liệu họ có thể cứu vãn một số ROI từ đống đổ nát của ngân sách hay không. Trong khi đó, một thị trường đang hình thành để đáp ứng họ ở đó.
Các công ty khởi nghiệp, nhà cung cấp đã có uy tín và cơ quan tiêu chuẩn mới đều đang chạy đua để cung cấp cho các công ty các công cụ và ngôn ngữ để theo dõi những gì họ chi tiêu. "Sáu tháng trước, tôi có một cuộc trò chuyện với một khách hàng và tất cả chỉ là 'Nó có thể làm được gì?
Nó có đủ tốt không?'" Alexander Embiricos, giám đốc doanh nghiệp của OpenAI, nói với TechCrunch tại một sự kiện ở thành phố New York vào tuần này. “Các cuộc trò chuyện của chúng tôi bây giờ không bao giờ đề cập đến vấn đề đó nữa.
những cuộc trò chuyện xoay quanh việc, 'Này, chúng ta đang chi tiêu rất nhiều. Bạn có khả năng hiển thị gì?
Bạn có khả năng kiểm toán gì? Bạn có những biện pháp kiểm soát mã thông báo nào?
Hiệu quả của các mô hình của bạn là gì?'". Trong bối cảnh đó, Quỹ Linux tuần này đã tiết lộ kế hoạch cho Tokenomics Foundation, một cơ quan tiêu chuẩn mới nhằm mục đích áp dụng kỷ luật chi phí tương tự đối với các token AI mà FinOps đã áp dụng cho chi tiêu trên đám mây.
"Vào tháng 4 và tháng 5, tôi bắt đầu nghe từ các công ty: 'Ôi chúa ơi, chúng tôi đã sử dụng gấp 3 lần toàn bộ ngân sách cho token năm 2026 của mình và mới chỉ tháng 4 thôi'", J.R.
Storment, giám đốc điều hành của FinOps Foundation, một dự án trực thuộc Linux Foundation, nói với TechCrunch: "Chúng tôi bắt đầu nghe thấy những cuộc khủng hoảng hiện hữu và toàn bộ cuộc trò chuyện đã chuyển từ tokenmaxxing và 'đi nhanh' sang 'chúng tôi cần các rào chắn, làm cách nào để kiểm soát điều này?'" Những tiếng kêu vang lên khắp thế giới công nghệ đã theo sau những yêu cầu nhiệt thành từ các CEO đang thúc đẩy nhóm của họ sử dụng những mô hình tốt nhất và di chuyển nhanh chóng, chi phí sẽ rất cao.
những cải tiến đối với các công cụ đại lý, giúp tăng mức tiêu thụ lên gấp bội. Đó là cách một công ty cho biết đã tìm ra nó.
bản thân với hóa đơn Claude trị giá 500 triệu USD sau khi quên đặt giới hạn sử dụng cho nhân viên. Chris Reed, giám đốc cấp cao về tài chính CNTT tại Priceline, cho biết: “Nó giống như đại dịch cocaine,” đồng thời lưu ý rằng công ty đã bắt đầu đặt giới hạn mã thông báo cho một số nhóm nhất định.
“Họ cho phép bạn thử nó để khiến bạn say mê và bây giờ bạn gần như thích thú với nó.” Vitaly Gordon, Giám đốc điều hành của nền tảng hoạt động kỹ thuật Faros AI, cho biết gần đây ông đã nói chuyện với một CTO.
Người này đã nói với ông rằng: “Một trong những kỹ sư của tôi đã chi 40.000 đô la cho token vào tháng trước và tôi thực sự không biết liệu mình có nên ngăn anh ta lại hay tôi nên đi và nói với những người khác hãy làm như anh ấy”.
Một nghiên cứu kéo dài hai năm với 20.000 nhà phát triển mà Faros công bố vào tháng 4 cho thấy sản lượng đang tăng lên, nhưng lỗi và số lần viết lại cũng vậy.
Jellyfish, một nền tảng quản lý kỹ thuật, cũng cho thấy những kỹ sư sử dụng nhiều mã thông báo nhất có năng suất cao gấp đôi so với những người sử dụng ít AI hơn, nhưng họ đã chi số lượng mã thông báo gấp 10 lần để đạt được điều đó.
Nicholas Arcolano, người đứng đầu bộ phận nghiên cứu tại Jellyfish, nói với TechCrunch qua email rằng chi tiêu cho AI đang bùng nổ phần lớn là do các tính năng tác nhân, với mức tiêu thụ của mỗi nhà phát triển tăng khoảng 18,6 lần trong 9 tháng. Nói chung, những số l...
ake trường hợp năng suất âm u hơn mức chi tiêu cho thấy. Arcolano cho biết: “Việc chi tiêu quá mức có mang lại hiệu quả hay không phụ thuộc vào giá trị kinh doanh cuối cùng của mã được vận chuyển (ví dụ: doanh thu), điều mà hầu hết các công ty vẫn không thể đo lường được”.
Ít nhất một số vấn đề đo lường đó là quy mô tuyệt đối mà AI đang được sử dụng ngày nay. Storment cho biết: “Việc theo dõi chi phí trên đám mây là vấn đề về dữ liệu hàng trăm triệu hàng mỗi tháng”.
"Chi phí mã thông báo theo dõi là vấn đề về dữ liệu hàng nghìn tỷ hàng mỗi tháng. Bạn không thể chỉ dán dữ liệu đó vào bất kỳ bảng tính hoặc thậm chí công cụ cơ bản nào.
Bạn phải suy nghĩ lại về cơ bản về công cụ, thông số kỹ thuật và hệ thống kế toán của mình để thực hiện điều đó." Tại Priceline, Reed đã nhận thấy sự khác biệt. Ông lưu ý các vấn đề giữa việc sử dụng được báo cáo của nhà cung cấp và dữ liệu nội bộ của Priceline.
“Tôi bắt đầu sự nghiệp của mình trong lĩnh vực quản lý chi phí viễn thông và tôi nhận thấy tất cả những điểm tương đồng, từ viễn thông, đám mây đến AI,” anh nói.
“Bất cứ khi nào bạn giới thiệu điều gì đó mới, đó là lúc chín muồi để phát sinh các lỗi thanh toán cũng như các cơ hội kiểm tra và tối ưu hóa.” Một thị trường đang bắt đầu hình thành xung quanh vấn đề này.
Có những công ty thuần túy, như Pay-i, chuyên theo dõi, đo lường và tối ưu hóa chi phí cũng như hiệu suất của GenAI inv. ước tính.
Trong khi đó, trả phí cho phép các nhà phát triển theo dõi chi phí, đo lường mức sử dụng và lập hóa đơn cho người dùng dựa trên giá trị thực tế thay vì phí đăng ký.
Sau đó, có những công ty như Jellyfish, Waydev và Faros AI, tất cả đều cung cấp dịch vụ giám sát tác nhân AI để chứng minh ROI của các công cụ dành cho nhà phát triển. Storment cho biết hầu hết trong số 180 nhà cung cấp trong FinOps Foundation đang nghiêng về lĩnh vực này.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.