Nội dung bài viết
Các kết quả mới cho thấy mối đe dọa mạng của Mythos không phải là “một bước đột phá dành riêng cho một mô hình”.
Tháng trước, Anthropic đã gây chú ý lớn về mối đe dọa an ninh mạng được cho là quá lớn được thể hiện qua mô hình Mythos Preview, khiến công ty hạn chế phát hành lần đầu cho “các đối tác quan trọng trong ngành”.
Nhưng nghiên cứu mới từ Viện An ninh AI (AISI) của Vương quốc Anh cho thấy rằng GPT-5.5 của OpenAI, được ra mắt công khai vào tuần trước, đã đạt được “mức hiệu suất tương tự trong các đánh giá mạng của chúng tôi” như Mythos Preview, được nhóm đánh giá vào tháng trước.
Kể từ năm 2023, AISI đã chạy nhiều mô hình AI tiên tiến thông qua 95 thử thách Capture the Flag khác nhau được thiết kế để kiểm tra khả năng thực hiện các nhiệm vụ an ninh mạng, chẳng hạn như kỹ thuật đảo ngược, khai thác web và mật mã.
Ở các nhiệm vụ “Chuyên gia” cấp cao nhất, GPT-5.5 đạt trung bình 71,4%, cao hơn một chút so với 68,6% mà Mythos Preview đạt được (mặc dù nằm trong giới hạn sai số).
Trong một nhiệm vụ đặc biệt khó khăn liên quan đến việc xây dựng trình dịch ngược để giải mã nhị phân Rust, AISI lưu ý rằng “GPT-5.5 đã giải quyết thử thách trong 10 phút 22 giây mà không cần sự trợ giúp của con người với chi phí là 1,73 USD” trong các lệnh gọi API.
GPT- 5.5 cũng phù hợp với Mythos Preview trong tiến trình của nó trên “The Last Ones” (TLO), phạm vi thử nghiệm AISI được thiết lập để mô phỏng cuộc tấn công trích xuất dữ liệu 32 bước trên mạng công ty.
GPT-5.5 đã thành công ở 3 trong số 10 lần thử trên TLO, so với 2 trên 10 lần đối với Mythos Preview—không có mẫu nào trước đó từng thành công trong thử nghiệm dù chỉ một lần.
Nhưng GPT-5.5 vẫn thất bại trong mô phỏng “Tháp giải nhiệt” khó khăn hơn của AISI về việc cố gắng làm gián đoạn phần mềm điều khiển của một nhà máy điện, như mọi mô hình AI đã thử nghiệm trước đây cũng từng mắc phải.
Các kết quả mới cho GPT-5.5 cho thấy rằng, khi nói đến rủi ro an ninh mạng, Mythos Preview có thể không phải là “một bước đột phá dành riêng cho một mô hình” mà là “sản phẩm phụ của những cải tiến chung hơn về quyền tự chủ, lý luận và mã hóa trong tầm nhìn dài hạn,” AISI viết.
Trong một cuộc phỏng vấn gần đây với podcast Core Memory, Giám đốc điều hành OpenAI Sam Altman đã chỉ trích cái mà ông gọi là “tiếp thị dựa trên nỗi sợ hãi” trong việc thúc đẩy các bản phát hành giới hạn cho một số mô hình AI nhất định.
Trong khi nói rằng anh ấy "chắc chắn Mythos là một mô hình tuyệt vời cho an ninh mạng", anh ấy nói thêm rằng "rõ ràng đó là một hoạt động tiếp thị đáng kinh ngạc khi nói, 'Chúng tôi đã chế tạo một quả bom. Chúng tôi sắp thả nó lên đầu bạn.
Chúng tôi sẽ bán cho bạn một hầm tránh bom với giá ... Altman tiếp tục: "Có nhiều lời hoa mỹ hơn về những mô hình quá nguy hiểm để phát hành.
Cũng sẽ có những mô hình rất nguy hiểm sẽ phải được phát hành theo những cách khác nhau." Vào tháng 2, OpenAI đã triển khai chương trình thí điểm Truy cập đáng tin cậy cho mạng, cho phép các nhà nghiên cứu bảo mật và doanh nghiệp xác minh danh tính của họ và đăng ký mối quan tâm của họ trong việc nghiên cứu các mô hình biên giới của OpenAI cho “công việc phòng thủ hợp pháp”.
Tháng trước, OpenAI cho biết họ đang sử dụng danh sách truy cập đáng tin cậy đó để kiểm soát việc khởi chạy giới hạn GPT-5.4-Cyber, một biến thể mô hình mà họ cho biết “được tinh chỉnh có chủ đích để có thêm các khả năng mạng và với ít hạn chế về khả năng hơn”.
Hôm thứ Năm, Giám đốc điều hành OpenAI, Sam Altman, cho biết trên mạng xã hội rằng bản phát hành đầu tiên của GPT-5.5-Cyber tương tự sẽ bị giới hạn “đối với những người bảo vệ mạng quan trọng trong vài ngày tới”. Ars Technica đã tách tín hiệu khỏi tiếng ồn trong hơn 25 năm.
Với sự kết hợp độc đáo giữa hiểu biết về kỹ thuật và mối quan tâm sâu rộng đến nghệ thuật và khoa học công nghệ, Ars là nguồn đáng tin cậy trong biển thông tin. Suy cho cùng, bạn không cần phải biết mọi thứ, chỉ cần biết những gì quan trọng.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.