Anthropic đã phát hành mô hình Fable mới nhất vào thứ Ba, coi đây là phiên bản công khai và giới hạn của mô hình an ninh mạng mạnh mẽ và được quảng cáo rầm rộ Mythos.
Nhưng không phải ai cũng hài lòng với những hạn chế này và một số nhà nghiên cứu và chuyên gia an ninh mạng đã đưa ra những lời phàn nàn trực tuyến.
Valentina “Chompie” Palmiotti, một nhà nghiên cứu bảo mật nổi tiếng làm việc tại IBM X-Force, cho biết: "[Fable] từ chối mọi yêu cầu có thể liên quan trực tiếp đến mạng. Ngay cả những nhiệm vụ vô hại như đọc một bài đăng trên blog".
Khi một lời nhắc kích hoạt các rào cản của nó, Fable sẽ tạm dừng cuộc trò chuyện và nói rằng “các biện pháp an toàn của nó đã gắn cờ thông báo này về các chủ đề an ninh mạng hoặc sinh học”.
Các biện pháp bảo vệ được đưa ra để hạn chế rủi ro Fable có thể được sử dụng để phát triển phần mềm độc hại hoặc xâm phạm phần mềm — mối lo ngại lâu nay của Anthropic. Những hạn chế về sinh học cũng xuất phát từ mối lo ngại tương tự xung quanh việc phát triển vũ khí sinh học.
Khi gã khổng lồ AI phát hành Mythos vào tháng 4, họ đã giới hạn mô hình này cho một số công ty và tổ chức có tên gọi Project Glasswing, một nỗ lực nhằm triển khai mô hình này để bảo mật cơ sở hạ tầng và phần mềm quan trọng.
Tuần trước, Anthropic đã mở rộng quyền truy cập vào Myth os cho hàng trăm tổ chức ở 15 quốc gia. Nhưng bất chấp những ý định tốt, nhiều chuyên gia an ninh mạng vẫn cảm thấy khó chịu trước tính chất bừa bãi của các hạn chế.
Matt Suiche, một chuyên gia an ninh mạng kỳ cựu, nói với TechCrunch rằng “nếu bạn yêu cầu nó viết mã bảo mật, nó sẽ cho rằng đó là công việc liên quan đến an ninh mạng thay vì các phương pháp hay nhất về kỹ thuật phần mềm và bạn sẽ bị hạ cấp”.
Fable được lập trình để quay trở lại Claude Opus 4.8 nếu nó chạm vào lan can. “Nó dường như dựa trên từ khóa, vì vậy bất kỳ điều gì trong lĩnh vực từ vựng của ‘an ninh mạng’ đều kích hoạt các rào cản.” Liên hệ với chúng tôi Bạn có thêm thông tin về cách tin tặc sử dụng AI không?
Hoặc các công ty an ninh mạng đang sử dụng AI như thế nào? Chúng tôi muốn nghe ý kiến từ bạn.
Từ thiết bị và mạng không hoạt động, bạn có thể liên hệ với Lorenzo Franceschi-Bicchierai một cách an toàn trên Signal theo số +1 917 257 1382 hoặc qua Telegram và Keybase @lorenzofb hoặc email .
"Nhưng điều đó có thể hiểu được vì chúng ta vẫn đang ở những ngày đầu và họ vẫn đang điều chỉnh các biện pháp bảo vệ của mình.
Tôi chắc chắn rằng họ sẽ phát triển theo thời gian khi Anthropic và các công ty có mô hình tiên tiến khác sẽ hợp tác nhiều hơn với thế hệ công ty an ninh mạng mới hiện tại", Suiche, thành viên của nhân viên kỹ thuật tại Tolmo, một công ty khởi nghiệp về an ninh mạng AI.
“Thà bắt được nhiều người hơn là không đủ khi bạn thực hiện việc thả như vậy và nới lỏng các rào chắn theo thời gian.” Một nhà nghiên cứu khác khẳng định với X rằng “thậm chí việc yêu cầu xem xét mã” sẽ kích hoạt các biện pháp bảo vệ của Fable.
Anthropic đã không trả lời ngay lập tức yêu cầu bình luận. Ngoài các rào chắn bên trong các mô hình của mình, Anthropic yêu cầu các chuyên gia an ninh mạng phải đăng ký Chương trình xác minh mạng.
Nếu được chấp thuận, người nộp đơn sẽ có ít hạn chế hơn trong việc sử dụng Claude cho công việc an ninh mạng. OpenAI có một chương trình tương tự có tên Trusted Access for Cyber.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Lorenzo Franceschi-Bicchierai là Nhà văn cấp cao tại TechCrunch, nơi ông đề cập đến vấn đề hack, an ninh mạng, giám sát và quyền riêng tư.
Bạn có thể liên hệ hoặc xác minh khả năng tiếp cận từ Lorenzo bằng cách gửi email
[email protected], qua tin nhắn được mã hóa theo số +1 917 257 1382 trên Signal và @lorenzofb trên Keybase/Telegram.
Tìm hiểu sâu hơn về những gì cần thiết để mở rộng quy mô và thành công từ các nhà lãnh đạo tại Mach Industries, Founders Fund và Shinkei Systems.
Bởi vì những cuộc trò chuyện thẳng thắn bên lò sưởi và kết nối mạng có tác động cao, bạn sẽ có được những hiểu biết sâu sắc có giá trị và những kết nối mới.
Google vừa bắn một phát súng cảnh báo trong cuộc chiến giá đăng ký AI Lucas Ropek Connie Loizos WWDC 2026: Mọi thứ được công bố trên Siri AI, iOS 27, Apple Intelligence, v.v. Morgan Little Aisha Malik
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.