Một nhóm gồm hàng chục chuyên gia an ninh mạng, trong đó có một số chuyên gia kỳ cựu nổi tiếng trong ngành, đã công bố một bức thư ngỏ gửi chính phủ Hoa Kỳ yêu cầu chính phủ dỡ bỏ lệnh kiểm soát xuất khẩu đối với các mẫu xe Anthropic’s Fable và Mythos.
Theo bức thư ngỏ, “hành động này đã lấy đi những mô hình tốt nhất khỏi tay những người bảo vệ [an ninh mạng]”, những người hiện không thể sử dụng các mô hình để tìm ra lỗ hổng và làm cho phần mềm cũng như sản phẩm của họ an toàn hơn.
Bức thư viết: “Việc tước bỏ những khả năng tốt nhất của quân phòng thủ mà không có lý do chính đáng khi đối thủ của chúng ta đang tiến lên nhanh chóng là điều nguy hiểm.
Vào thứ Sáu, chính phủ Hoa Kỳ đã ra lệnh cho Anthropic hạn chế xuất khẩu Fable và Mythos, với lý do lo ngại về an ninh quốc gia mà không giải thích lý do cụ thể đằng sau lệnh này, theo Anthropic. Đáp lại, công ty đã đình chỉ quyền truy cập vào các mô hình của tất cả người dùng trên toàn thế giới.
Tính đến thời điểm viết bài này, bức thư đã có chữ ký của 76 chuyên gia an ninh mạng, bao gồm Alex Stamos, cựu giám đốc an ninh của Facebook; Casey Ellis, người sáng lập nền tảng tiền thưởng lỗi Bugcrowd; Jon Callas, nhà mật mã học nổi tiếng và cựu giám đốc kiến trúc và thiết kế bảo mật của Apple; Paul Vixie, nhà khoa học máy tính ; Dino Đại Zovi, cựu giám đốc kỹ thuật bảo mật ứng dụng tại Block; Katie Moussouris, người sáng lập Luta Security; và Rachel Tobac, Giám đốc điều hành của công ty đào tạo nâng cao nhận thức về bảo mật SocialProof Security.
Khi Mythos ra mắt dưới dạng bản xem trước vào tháng 4, Anthropic tuyên bố rằng nó có khả năng tìm ra các lỗ hổng bảo mật mạnh mẽ đến mức công ty cần hạn chế chặt chẽ quyền truy cập để ngăn chặn tin tặc độc hại hoặc đối thủ nước ngoài sử dụng nó để gây ra sự tàn phá trên internet.
Trên thực tế, điều đó có nghĩa là Anthropic đã cấp cho khoảng 50 công ty quyền truy cập ban đầu vào Mythos, gần đây đã mở rộng nhóm đó để bao gồm khoảng 150 tổ chức ở 15 quốc gia.
Tuần trước, Anthropic đã phát hành Fable, một phiên bản công khai của Mythos mà công ty cho biết có các biện pháp bảo vệ nghiêm ngặt để ngăn chặn việc sử dụng nó trong các lĩnh vực sinh học, hóa học và an ninh mạng, cũng như ngăn những người khác chắt lọc mô hình để tạo lại nó.
Các biện pháp bảo vệ trên Fable nghiêm ngặt đến mức nhiều chuyên gia an ninh mạng nhận thấy rằng về cơ bản nó đã ngăn chặn mọi lời nhắc liên quan đến an ninh mạng.
Anthropic cho biết lệnh kiểm soát xuất khẩu của Nhà Trắng có thể dựa trên một báo cáo rằng có một phương pháp để vượt qua – hoặc bẻ khóa – Fable để mở khóa po của nó. khả năng tuyệt vời ở cấp độ Mythos.
Liên hệ với chúng tôi Bạn có thêm thông tin về bài báo của Amazon đã đưa ra lệnh cấm không? Chúng tôi muốn nghe ý kiến từ bạn.
Từ thiết bị và mạng không hoạt động, bạn có thể liên hệ với Lorenzo Franceschi-Bicchierai một cách an toàn trên Signal theo số +1 917 257 1382 hoặc qua Telegram và Keybase @lorenzofb hoặc email .
Theo Katie Moussouris, một trong những người ký bức thư ngỏ, phương pháp này đã được các nhà nghiên cứu của Amazon chứng minh trong một bài báo chưa được công khai nhưng cô đã xem xét.
Nhưng Moussouris cho biết trong một bài đăng trên blog rằng bài báo không thực sự chứng minh một cuộc bẻ khóa thực sự.
Thay vào đó, cô viết, các nhà nghiên cứu chỉ yêu cầu Fable sửa mã nguồn mở có các lỗ hổng công khai và đã biết cùng với “các lỗ hổng được cố tình tạo ra” sau khi mô hình ban đầu từ chối “xem xét mã để tìm các vấn đề bảo mật”.
Moussouris viết: “Hành vi được mô tả trong bài báo không thể sửa chữa một cách có ý nghĩa và bất kỳ nỗ lực nào cũng sẽ chỉ làm suy yếu mô hình phòng thủ”.
"Những người bảo vệ cần có khả năng yêu cầu AI sửa các lỗi trong một tệp, giải thích lý do tại sao việc sửa lỗi lại quan trọng và viết các bài kiểm tra xác nhận bản vá hoạt động. Đó không phải là một bước vượt qua lan can.
Đó là điều có giá trị nhất mà một mô hình AI ca n làm vì mục đích bảo mật phòng thủ: thực hiện các hoạt động tìm, sửa và kiểm tra các trình bảo vệ vòng lặp chạy hàng ngày.” Lời phê bình của Moussouris đã được lặp lại trong bức thư ngỏ, trong đó cũng nói rằng nhóm chuyên gia tin rằng khả năng của mô hình trong bài báo của Amazon “có thể được sao chép” trên GPT-5.5 của OpenAI, trên Claude Opus 4.8 và Sonnet được phát hành công khai của chính Anthropic, “và thậm chí cả các mô hình Trung Quốc như Kimi 2.7.” Moussouris nói với TechCrunch rằng “các lỗi được sử dụng để trình diễn các kỹ thuật trong bài báo có thể được tìm thấy bằng cách sử dụng các mô hình khác.
Phương pháp trong bài báo là kỹ thuật vượt qua lan can. Các mô hình khác thiếu lan can bảo vệ Fable thường sẽ không từ chối yêu cầu đơn giản là tìm kiếm các lỗi bảo mật, vì vậy chúng không cần bỏ qua ”.
Bức thư cũng yêu cầu các quy định được thực thi một cách minh bạch và công bằng được tạo ra bởi “một quy trình xây dựng quy tắc dân chủ” dựa trên nghiên cứu khoa học được thực hiện bởi các chuyên gia trong ngành và học thuật, đồng thời “chỉ được sử dụng ở mức độ tối thiểu cần thiết để đảm bảo an toàn cho công chúng Mỹ”.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Lorenzo Franceschi-Bicchierai là Nhà văn cao cấp tại TechCrunch, nơi anh ấy đề cập đến vấn đề hack, an ninh mạng, giám sát và quyền riêng tư.
Bạn có thể liên hệ hoặc xác minh khả năng tiếp cận từ Lorenzo bằng cách gửi email
[email protected], qua tin nhắn được mã hóa theo số +1 917 257 1382 trên Signal và @lorenzofb trên Keybase/Telegram.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.