Nội dung bài viết
Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn. Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn. Hàng triệu bản nhạc được cung cấp miễn phí trong các bộ dữ liệu, ngay cả khi chúng không được yêu cầu như vậy.
Hàng triệu bản nhạc được cung cấp miễn phí trong các bộ dữ liệu, ngay cả khi chúng không được yêu cầu như vậy. Các bài đăng của tác giả này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Các bài đăng của tác giả này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn. Phóng viên Alex Reisner của Atlantic gần đây đã phát hiện ra bốn bộ dữ liệu âm nhạc đang được sử dụng để đào tạo các mô hình AI và khiến chúng có thể được công chúng tìm kiếm hoàn toàn.
Hai trong số các bộ này cực kỳ khổng lồ với 12 triệu và 9 triệu bản nhạc. Hai cái còn lại nhỏ hơn nhiều nhưng vẫn chứa một lượng dữ liệu huấn luyện đáng kể với hơn 100.000 bài hát mỗi cái.
Theo Reisner, các bộ này đã được tải xuống hàng nghìn lần và mặc dù không thể biết chính xác ai đã sử dụng chúng, nhưng Google và Stability đều xác nhận rằng họ có trong các tài liệu nghiên cứu.
Một số nguồn, như Free Mu Bộ dữ liệu sic Archive được phát trực tuyến miễn phí cho mục đích sử dụng cá nhân nhưng yêu cầu cấp phép cho các ứng dụng thương mại.
Về mặt lý thuyết, mặc dù các bộ dữ liệu có sẵn miễn phí trên internet, nhưng việc sử dụng chúng làm dữ liệu đào tạo không đơn giản như tải xuống tệp ZIP và cung cấp cho mô hình AI.
Như Reisner giải thích: Ba trong số các tập dữ liệu tôi tìm thấy được phân phối dưới dạng danh sách các liên kết đến các bài hát trên YouTube hoặc Spotify.
Các nhà phát triển AI tải xuống âm thanh thực tế bằng cách sử dụng các công cụ tự động hóa công việc, một số trong đó cho phép nhà phát triển bỏ qua thông tin đăng nhập, quảng cáo và cơ chế có thể kiếm tiền hoặc người đăng ký cho người sáng tạo.
Những công cụ như vậy vi phạm điều khoản dịch vụ của các nền tảng này. Những cái tên xuất hiện trong tập dữ liệu bao gồm từ các ngôi sao nhạc pop như Lady Gaga và Fred Again.., đến Radiohead, Aphex Twin, Wu-Tang Clan, Bruce Springsteen và nhà soạn nhạc thử nghiệm Hainbach.
Bạn có thể truy cập trang web AI Watchdog của Atlantic và tìm kiếm qua các bài hát, sách và các phương tiện truyền thông khác đang được sử dụng để tự đào tạo các mô hình AI của thế giới. Các bài đăng của tác giả này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạ... ic sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn. Các bài đăng từ chủ đề này sẽ được thêm vào thông báo email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Đăng nhập để xem thông báo của bạn hoặc tạo tài khoản để tham gia cuộc trò chuyện.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.