technologyNguồn: techcrunch.com
Anthropic nói rằng những miêu tả 'xấu xa' về AI là nguyên nhân gây ra nỗ lực tống tiền của Claude
Theo Anthropic, những mô tả hư cấu về trí tuệ nhân tạo có thể có tác động thực sự đến các mô hình AI. Năm ngoái, công ty cho biết trong các cuộc thử nghiệm trước khi phát hành liên quan đến một công ty hư cấu, Claude Opus 4 thường cố gắng tống tiền các kỹ sư để tránh bị thay thế bởi một hệ thống khác. Anthropic sau đó đã công bố nghiên cứu cho thấy rằng các mô hình của các công ty khác cũng gặp vấn đề tương tự với “sự sai lệch tác nhân”. Rõ ràng Anthropic đã thực hiện nhiều công việc hơn xung quanh hành vi đó, tuyên bố trong một bài đăng trên X, “Chúng tôi tin rằng nguồn gốc ban đầu của hành vi này là văn bản trên internet miêu tả AI là ác quỷ và quan tâm đến việc tự bảo vệ bản thân”. Công ty đã đi sâu vào chi tiết hơn trong một bài đăng trên blog nói rằng kể từ Claude Haiku 4.5, các mô hình của Anthropic “không bao giờ tham gia vào hành vi tống tiền [trong quá trình thử nghiệm], tron...
khoảng 5 giờ trước1 lượt xem2 phút đọc