StrictlyVC đầu tiên của năm 2026 sẽ ra mắt SF vào ngày 30 tháng 4. Vé đang bán rất nhanh.
Đăng ký ngay bây giờ. Nhận khoản tiết kiệm từ chương trình Disrupt Early Bird lên tới 410 USD trước 11:59 tối ngày 29 tháng 5.
PT. Đăng ký ngay bây giờ.
Các công ty AI đã phát triển thành những thực thể đói dữ liệu vì mô hình của họ yêu cầu bộ dữ liệu ngày càng lớn hơn để đào tạo.
Để đáp ứng nhu cầu đó, nhiều công ty khởi nghiệp AI bất chấp các quy ước lâu đời trên Internet — như tôn trọng các tệp robots.txt, báo hiệu cho trình thu thập thông tin tự động biết phần nào của trang web bị cấm — và thu thập dữ liệu một cách mạnh mẽ.
Điều này đã buộc các trang web phải hạn chế quyền truy cập vào dữ liệu của họ và trong một số trường hợp, đạt được các thỏa thuận cấp phép với các công ty AI.
Công ty thể hình và điều hành xã hội Strava đang đi theo hướng này bằng cách hạn chế trang web của mình và đưa ra phí truy cập cho nhà phát triển.
Để ngừng thu thập dữ liệu, công ty đang tăng cường bảo mật trên trang web của mình và giờ đây sẽ chỉ cho phép người dùng được xác thực xem một số dữ liệu nhất định. Trước đó, người dùng có thể xem các chi tiết như hồ sơ công khai và danh sách câu lạc bộ thể dục mà không cần đăng nhập.
Công ty đang đặt tất cả dữ liệu đó vào quá trình xác thực để bảo vệ dữ liệu khỏi việc quét AI trái phép. Về mặt API, trước đây các nhà phát triển có thể bắt đầu xây dựng ứng dụng tr...
h một chương trình truy cập miễn phí, theo cấp độ, trước tiên hãy đăng ký quyền truy cập cơ bản, sau đó yêu cầu nhiều hơn khi ứng dụng của họ phát triển.
Hiện công ty đang bổ sung một khoản phí cố định 11,99 USD mỗi tháng cho tất cả các nhà phát triển, mặc dù họ lưu ý rằng mức giá có thể thay đổi tùy theo địa lý.
Strava cho biết cộng đồng nhà phát triển của họ đã tăng từ 185.000 thành viên vào năm ngoái lên 241.000 trong năm nay và công ty có kế hoạch tiếp tục hỗ trợ họ.
Là một phần trong đó, Strava cũng có kế hoạch bổ sung hỗ trợ cho Giao thức ngữ cảnh mô hình (MCP), một tiêu chuẩn mới nổi cho phép các ứng dụng và trợ lý AI truy cập dữ liệu bên ngoài theo cách có cấu trúc, giúp Strava kiểm soát nhiều hơn chính xác những gì được chia sẻ và cách thức chia sẻ.
Công ty cũng đang có kế hoạch ngừng sử dụng một số điểm cuối API — các điểm truy cập riêng biệt cho phép các ứng dụng bên ngoài lấy dữ liệu cụ thể, như thông tin chi tiết về câu lạc bộ — để bảo vệ dữ liệu người dùng.
Strava đã thắt chặt các quy tắc API vào năm 2024, cấm sử dụng nó cho mục đích đào tạo AI và hạn chế các ứng dụng của bên thứ ba hiển thị dữ liệu của người dùng khác. Những thay đổi đó đã thu hút phản ứng dữ dội từ các nhà phát triển, những người cho biết ứng dụng của họ sẽ bị ảnh hưởng nghiêm trọng.
Mặc dù một số nhà phát triển có thể chấp nhận trả phí đăng ký nhưng việc ngừng hoạt động một số điểm cuối API... khoảng thời gian trước khi thực hiện những thay đổi này.
Trong một cuộc phỏng vấn với TechCrunch, Michael Martin, Giám đốc điều hành của Strava, cho biết việc quét AI không được kiểm soát có thể là hồi chuông báo tử cho Internet công cộng.
Martin cho biết: “Các công ty AI đang loại bỏ một cách tàn nhẫn các trang web công cộng do nhu cầu vô tận về dữ liệu đào tạo, điều này đang làm giảm hiệu suất của trang web trên diện rộng”.
Trong vài tháng qua, chúng tôi đã gặp nhiều trường hợp mà hiệu suất bị giảm sút và trong một số trường hợp còn bị suy giảm.
Ngoài việc thu thập dữ liệu từ các trang web công cộng, họ còn cố gắng sử dụng API của chúng tôi để truy cập vào dữ liệu của chúng tôi, bỏ qua các điều khoản về API.” Ông lưu ý rằng Strava đã từ chối lời đề nghị từ các phòng thí nghiệm AI hàng đầu đang tìm kiếm các thỏa thuận cấp phép dữ liệu.
Ông đặc biệt chỉ ra Perplexity, nói rằng công ty khởi nghiệp tìm kiếm AI đã chuyển việc thu thập dữ liệu của mình thông qua các dịch vụ tổng hợp để che giấu nguồn gốc của nó mặc dù đã bị từ chối.
Điều này phù hợp với việc Perplexity từng bị cáo buộc có hành vi tương tự ở những nơi khác trong quá khứ.
Martin cũng đánh dấu tình trạng quá tải của máy chủ do các ứng dụng có mã rung cảm được xây dựng kém, có các lệnh gọi API thường có cấu trúc không hiệu quả và tạo ra tải không cân xứng trên hệ thống của Strava. Đó là một khuôn mẫu: khi Meta cấm c...
năm sau, nó đã đưa ra lập luận tương tự về chi phí hoạt động của hệ thống. Thời điểm có lẽ không phải ngẫu nhiên.
Strava đã bí mật nộp đơn xin IPO vào đầu năm nay và động thái bảo vệ dữ liệu của họ có thể nhằm mục đích báo hiệu kỷ luật dữ liệu đối với các nhà đầu tư tiềm năng. So sánh với cuộc đàn áp năm 2024 của Reddit đối với quyền truy cập API là một trong những điều Martin đã nhanh chóng giải quyết.
Không giống như Reddit, định giá quyền truy cập API theo số lượng lệnh gọi (khiến nhiều nhà phát triển ứng dụng không thể chấp nhận được), Strava đang đặt cược một khoản phí cố định sẽ giữ nguyên hệ sinh thái nhà phát triển.
Martin nói: "Chúng tôi muốn người dùng cảm thấy rằng họ sở hữu dữ liệu của mình và cảm thấy thoải mái với cách chúng tôi kiểm soát và bảo mật dữ liệu đó. Nhưng chúng tôi muốn các nhà phát triển tiếp tục phát triển và phát triển".
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Ivan đề cập đến sự phát triển công nghệ tiêu dùng toàn cầu tại TechCrunch. Anh ấy sống ở Ấn Độ và trước đây đã từng làm việc tại các ấn phẩm bao gồm Huffington Post và The Next Web.
Bạn có thể liên hệ hoặc xác minh khả năng tiếp cận của Ivan bằng cách gửi email tới
[email protected] hoặc qua tin nhắn được mã hóa tại ivan.42 trên Signal. Có được cá...
lãnh đạo rom tại Mach Industries, Founders Fund và Shinkei Systems. Thông qua các cuộc trò chuyện thẳng thắn bên lò sưởi và kết nối mạng có tác động cao, bạn sẽ có được những hiểu biết sâu sắc có giá trị và các kết nối mới.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.