Nội dung bài viết
GitHub cho biết họ không còn có thể chịu được “chi phí suy luận ngày càng tăng” từ những người dùng AI nặng tính nhất. GitHub đã thông báo rằng họ sẽ chuyển sang mô hình thanh toán dựa trên mức sử dụng cho dịch vụ GitHub Copilot AI của mình bắt đầu từ ngày 1 tháng 6.
Động thái này được coi là một cách để “điều chỉnh giá tốt hơn với mức sử dụng thực tế” và là một bước cần thiết để giữ cho Copilot bền vững về mặt tài chính trong bối cảnh nhu cầu ngày càng tăng đối với tài nguyên máy tính AI hạn chế.
Những người đăng ký GitHub Copilot hiện nhận được sự phân bổ “yêu cầu” và “yêu cầu cao cấp” hàng tháng, được chi tiêu bất cứ khi nào họ yêu cầu Copilot trợ giúp từ mô hình AI.
Nhưng những danh mục rộng lớn đó bao gồm nhiều nhiệm vụ AI khác nhau với tổng chi phí tính toán phụ trợ rất đa dạng, GitHub cho biết.
Công ty thuộc sở hữu của Microsoft viết trong thông báo của mình: “Ngày nay, một câu hỏi trò chuyện nhanh và một phiên mã hóa tự động kéo dài nhiều giờ có thể khiến người dùng phải trả một khoản tiền tương đương”.
Và mặc dù GitHub cho biết họ đã “hấp thụ phần lớn chi phí suy luận ngày càng tăng đằng sau việc sử dụng đó” cho đến thời điểm này, nhưng việc gộp tất cả “các yêu cầu cao cấp” lại với nhau “không còn bền vững nữa”.
Theo hệ thống định giá mới, những người đăng ký GitHub Copilot sẽ nhận được khoản “Tín dụng AI” hàng tháng tương ứng với khoản thanh toán đăng ký hàng tháng... tâm trí.
Giá cho việc sử dụng AI bổ sung ngoài các khoản tín dụng đó “sẽ được tính toán dựa trên mức tiêu thụ mã thông báo, bao gồm mã thông báo đầu vào, đầu ra và mã thông báo được lưu trong bộ nhớ đệm, sử dụng tỷ lệ API được liệt kê cho từng mô hình”.
Các tỷ lệ API đó có thể khác nhau rất nhiều tùy thuộc vào mức độ phức tạp của mô hình đang được sử dụng; Ví dụ: giá cho các mô hình GPT cao cấp của OpenAI hiện dao động từ 4,50 USD trên một triệu mã thông báo đầu ra (GPT-5.4 Mini) đến 30 USD trên một triệu mã thông báo đầu ra (GPT-5.5).
Tổng số mã thông báo được sử dụng cho một lời nhắc AI riêng lẻ cũng có thể khác nhau rất nhiều tùy thuộc vào lượng thời gian “suy nghĩ” mà mô hình cần để tạo ra đầu ra của nó.
Người đăng ký GitHub Copilot vẫn có thể sử dụng các đề xuất AI đơn giản như hoàn thành mã và Chỉnh sửa tiếp theo mà không tiêu tốn tín dụng AI. Tuy nhiên, việc đánh giá mã Copilot sẽ đi kèm với một khoản chi phí bổ sung dưới dạng số phút Hành động của GitHub.
Trước khi cấu trúc giá mới có hiệu lực vào ngày 1 tháng 6, người dùng GitHub Copilot sẽ có thể sử dụng công cụ “xem trước hóa đơn” để giúp dự đoán mức sử dụng AI hiện tại của họ sẽ được tính theo mô hình định giá mới.
Tuần trước, nhà phê bình AI Ed Zitron đã trích dẫn “tài liệu nội bộ bị rò rỉ” trong báo cáo về những thay đổi thanh toán dựa trên mức sử dụng sắp tới. Những tài liệu đó lại được cho là chỉ ra rằng chi phí hàng tuần cho GitHub Copilot đã tăng gần gấp đôi kể từ tháng Giêng.
Thời điểm đó phù hợp với sự gia tăng của các trợ lý AI tác nhân như Openclaw, có thể tiêu thụ một lượng lớn mã thông báo AI thông qua quy trình làm việc đa tác nhân gần như luôn hoạt động của họ.
Việc trợ cấp mức độ sử dụng đó thông qua tỷ lệ đăng ký chiết khấu cao dường như đã trở nên không thể chấp nhận được đối với GitHub. GitHub cho biết mức giá dựa trên mức sử dụng mới của họ “làm giảm nhu cầu kiểm soát những người dùng nhiều”, những người tận dụng tối đa hệ thống định giá hiện tại.
Công ty viết trong Câu hỏi thường gặp: “Thay đổi này được thiết kế để mang lại trải nghiệm sản phẩm bền vững và đáng tin cậy hơn bằng cách điều chỉnh giá cả cho phù hợp với mức sử dụng và chi phí thực tế”.
Tuần trước, GitHub đã tạm dừng đăng ký mới cho các gói đăng ký của mình, thắt chặt giới hạn sử dụng và xóa các mẫu Opus của Claude khỏi các gói Pro cấp thấp hơn.
Vào thời điểm đó, GitHub cho biết những thay đổi đó là “cần thiết để đảm bảo chúng tôi có thể phục vụ khách hàng hiện tại với trải nghiệm có thể dự đoán được”.
Quyết định về giá của GitHub tuân theo một báo cáo Thông tin rằng Anthropic đã bắt đầu tính phí những người đăng ký Claude Enterprise lớn cho toàn bộ chi phí tài nguyên máy tính mà họ sử dụng thay vì cung cấp trợ cấp đăng ký. ed giảm giá cho token AI.
Tuần trước, Anthropic cũng đã thử nghiệm nhanh việc loại bỏ Mã Claude sử dụng nhiều tài nguyên khỏi gói đăng ký Pro 20 USD mỗi tháng.
Và Anthropic đã điều chỉnh giới hạn sử dụng trong “giờ cao điểm” từ 5 giờ sáng đến 11 giờ sáng theo giờ Thái Bình Dương nhằm nỗ lực hạn chế chi phí và cải thiện độ tin cậy cho người đăng ký.
Những động thái định giá này có thể trở nên phổ biến hơn khi các công ty AI lớn cố gắng chuyển doanh thu ngày càng tăng và nhu cầu cao đối với dịch vụ của họ thành các loại lợi nhuận mà cho đến nay vẫn là ảo tưởng.
Trong bối cảnh tình trạng thiếu tài nguyên máy tính đang diễn ra để đáp ứng nhu cầu đó, thời kỳ giảm giá sử dụng dựa trên đăng ký, được trợ cấp cho những người dùng phàm ăn nhất của AI có thể sắp kết thúc. Ars Technica đã tách tín hiệu khỏi tiếng ồn trong hơn 25 năm.
Với sự kết hợp độc đáo giữa hiểu biết về kỹ thuật và mối quan tâm sâu rộng đến nghệ thuật và khoa học công nghệ, Ars là nguồn đáng tin cậy trong biển thông tin. Suy cho cùng, bạn không cần phải biết mọi thứ, chỉ cần biết những gì quan trọng.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.