After spooking Trump into safety testing,...

Hoa Kỳ dỡ bỏ hạn chế đối với các mẫu Fable và Mythos tiên tiến của Anthropic. Hoa Kỳ đã dỡ bỏ hạn chế xuất khẩu đối với các mẫu Claude mới nhất của Anthropic, Fable 5 và Mythos 5, khoảng ba tuần sau khi chính quyền Trump cảnh báo các mẫu này là rủi ro an ninh quốc gia. Kể từ hôm nay, Anthropic đã xác nhận trong một bài đăng trên blog, Fable 5 sẽ có mặt trên toàn cầu và các tổ chức Hoa Kỳ đã khôi phục quyền truy cập vào Mythos 5 kể từ ngày 26 tháng 6. Anthropic cho biết họ hiện đang làm việc với chính phủ để mở rộng quyền truy cập của Mythos tới “nhóm đối tác trong nước và quốc tế rộng rãi hơn trong chương trình Glasswing”. Chương trình đó cho phép các nhà nghiên cứu an ninh mạng tại các công ty đáng tin cậy truy cập Mythos cho mục đích phòng thủ. Trong một bức thư gửi Anthropic được Reuters và The New York Times xem, Bộ trưởng Thương mại Howard Lutnick cho biết Anthropic sẽ “không cần giấy phép xuất khẩu hoặc chuyển nhượng trong nước các mô hình AI Claude Mythos và Claude Fable nữa”. Bức thư thừa nhận rằng Anthropic đã “thực hiện các bước phối hợp chặt chẽ với chính phủ Hoa Kỳ để giải quyết những rủi ro” do các mô hình gây ra. Đối mặt với sự chậm trễ lâu hơn trong việc phát hành các mô hình của mình, Lutnick nói rằng Anthropic đã đồng ý mở rộng quan hệ đối tác với chính phủ. Công ty viện trợ, họ cũng thiết lập một chương trình làm việc với tin tặc để lập nhóm lại cho các mô hình của mình và hiện có một nhóm nội bộ chuyên trách để theo dõi các báo cáo về các mối đe dọa bẻ khóa mới nổi 24/7. Trong thư, Lutnick nhắc nhở Anthropic rằng Mỹ “có quyền đánh giá lại các quyết định” và áp dụng lại các biện pháp hạn chế xuất khẩu vào bất kỳ thời điểm nào. Nhưng hiện tại, Lutnick đã cùng Chánh văn phòng Nhà Trắng Susie Wiles tổ chức lễ kỷ niệm việc triển khai lại Fable 5 trên X. “Trong hai tuần qua, chúng tôi đã hợp tác chặt chẽ với Anthropic để phân tích và phê duyệt Fable 5 nhằm đảm bảo sự nhất quán trong Chính phủ Hoa Kỳ và củng cố vai trò lãnh đạo của Hoa Kỳ trong lĩnh vực AI,” Lutnick nói. Wiles không trực tiếp đề cập đến Anthropic nhưng tuyên bố chiến thắng thuộc về Trump, viết rằng "chính phủ và khu vực tư nhân đã làm việc cùng nhau theo cách mà chúng tôi chưa từng thấy trước đây và nền tảng America First này là chưa từng có. Ưu tiên chung của chúng tôi vẫn là: triển khai công nghệ tốt nhất nhanh chóng và an toàn nhất có thể." Vào ngày 12 tháng 6, Bộ Thương mại đã ra lệnh cho Anthropic tắt quyền truy cập vào các mẫu tiên tiến nhất của mình đối với bất kỳ ai bên ngoài Hoa Kỳ. Lệnh này xuất phát từ lo ngại rằng Trung Quốc, Nga hoặc các quốc gia liên quan khác có thể khai thác các mô hình để tấn công cơ sở hạ tầng của Hoa Kỳ. như lưới điện hay hệ thống ngân hàng. Đáp lại, Anthropic đã tắt mọi quyền truy cập vì nó không có cách chặn người dùng theo quốc gia. Đặc biệt, Mythos được xem là “đặc biệt hấp dẫn đối với những kẻ độc hại muốn lạm dụng nó trong các cuộc tấn công mạng”, blog của Anthropic cho biết. Theo Anthropic, mô hình này “có thể được sử dụng để tìm và khai thác các lỗ hổng phần mềm hiệu quả hơn bất kỳ mô hình nào khác — và tất cả trừ những chuyên gia bảo mật con người lành nghề nhất” và “khả năng an ninh mạng phi thường” đó có thể được sử dụng để chống lại Hoa Kỳ. Fable 5 có chung “mô hình cơ bản”, Anthropic cho biết, nhưng không giống như Mythos 5, nó “không cung cấp khả năng tấn công độc đáo như vậy”. Được thiết kế cho công chúng, Fable 5 đã có các biện pháp bảo vệ mạnh nhất mà Anthropic từng áp dụng cho một mô hình và Anthropic cho biết những biện pháp bảo vệ đó giờ đây thậm chí còn mạnh mẽ hơn trước khi triển khai lại. Sau nhiều tuần thử nghiệm, Fable 5 không còn dễ bị tấn công bởi một phương pháp bỏ qua do các nhà nghiên cứu của Amazon phát hiện. Phương pháp này đã xác định được một số lỗ hổng phần mềm và kích hoạt các hạn chế xuất khẩu. Rắc rối nhất, Anthropic cho biết, là trường hợp mô hình bị thao túng để tạo ra mã chứng minh cách vu khả năng chịu đựng có thể bị khai thác. Theo Anthropic, thử nghiệm đã xác nhận rằng các mẫu đối thủ kém tiên tiến hơn trên thị trường, như GPT-5.5 và Kimi K2.7, “có thể xác định các lỗ hổng tương tự như Fable 5 đã làm trong báo cáo”. Điều đó xác nhận rằng “kỹ thuật được báo cáo không bộc lộ bất kỳ khả năng mạng độc đáo nào ở cấp độ Mythos”, Anthropic cho biết và “chỉ liên quan đến công việc an ninh mạng phòng thủ thông thường”. Anthropic viết: “Mặc dù vậy, chúng tôi đã nhanh chóng giải quyết vấn đề đường tránh được báo cáo”. Anthropic cho biết phương pháp bẻ khóa đó hiện bị chặn trong hơn 99% trường hợp. Tuy nhiên, công ty thừa nhận rằng việc thắt chặt các biện pháp bảo vệ đi kèm với một “sự đánh đổi” có thể khiến một số lời nhắc lành tính bị chặn “trong các tác vụ mã hóa và gỡ lỗi thông thường”. Anthropic cho biết: “Hợp tác chặt chẽ với chính phủ, chúng tôi đã đào tạo một bộ phân loại an toàn cải tiến nhằm nhắm mục tiêu và ngăn chặn hành vi được mô tả trong báo cáo”. “Người dùng sẽ được thông báo nếu yêu cầu tới Fable 5 bị chặn và thay vào đó, yêu cầu sẽ được gửi tới Opus 4.8.” Tất nhiên, bộ phân loại mới của Anthropic, giúp tránh các cuộc tấn công nguy hiểm đặc biệt vào các mô hình, có thể mắc “sai lầm”, Anthropic cho biết. Công ty từ lâu đã khẳng định rằng họ “có thể bị áp đặt ssible” để xây dựng một mô hình hoàn toàn “không thấm” vào các cuộc bẻ khóa, nhưng bằng cách tăng cường đội đỏ, Anthropic hy vọng “đảm bảo rằng chúng tôi và các đối tác an toàn của chúng tôi sẽ là những người đầu tiên tìm ra các bản bẻ khóa lớn và sửa chúng trước khi những kẻ độc hại có thể sử dụng chúng để gây hại.” Cuộc tấn công mà Amazon gắn cờ hiện chỉ hoạt động trong “một tỷ lệ rất nhỏ các trường hợp”, trong đó “mô hình có thể cung cấp thông tin không đủ chi tiết để trợ giúp kẻ tấn công mạng”, Anthropic cho biết. Bằng cách “thận trọng”, Anthropic nói rằng “phần lớn các cuộc bẻ khóa sẽ không thành công trong việc bỏ chặn các hành vi nguy hiểm” và sẽ “rất tốn kém và tốn nhiều công sức để thực hiện”. Gợi ý thực hành: 1. Theo dõi thông báo từ cơ quan địa phương tại California. 2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.

Sau khi khiến Trump phải thử nghiệm độ an toàn, các mô hình AI của con người được phát hành toàn cầu