"Dangerous" AI models are coming no...

Các mô hình AI với khả năng hack tiên tiến sẽ sớm trở thành tiêu chuẩn. Cuối tuần trước, Anthropic đã đưa các mô hình AI Claude Fable 5 và Mythos 5 mới của mình vào chế độ ngoại tuyến theo chỉ thị kiểm soát xuất khẩu của chính phủ Hoa Kỳ cấm “bất kỳ công dân nước ngoài nào” sử dụng dịch vụ. Công ty đã đàm phán với Nhà Trắng kể từ thứ Sáu nhưng vẫn chưa đạt được thỏa thuận cho phép họ khôi phục các dịch vụ. Kể từ khi Mythos ra mắt vào tháng 4, Anthropic đã tuyên bố và cảnh báo rằng mô hình này có các khả năng nâng cao không chỉ để tìm ra các lỗ hổng phần mềm nhằm giúp các nhà bảo vệ vá chúng mà còn tìm ra cách khai thác chúng mà kẻ xấu có thể lợi dụng. Bản thân Anthropic đã lưu ý đến con dao hai lưỡi này khi ra mắt Mythos 5 và Claude Fable 5. “Phần lớn cách sử dụng nâng cao của các mô hình AI là sử dụng kép: các truy vấn tương tự có lợi trong tay các chuyên gia an ninh mạng và nhà nghiên cứu sinh học có thể nguy hiểm nếu có sẵn cho các tác nhân độc hại,” công ty viết trong một bài đăng trên blog vào tuần trước. Với suy nghĩ này, ban đầu công ty đã phát hành một phiên bản có tên Mythos Preview cho một tập đoàn chọn lọc như một phần của nhóm làm việc có tên Project Glasswing. Thần thoại 5 cũng đã được phát hành riêng cho nhóm này vào tuần trước, trong khi Claude Fable 5, một mô hình cấp độ Mythos, đã được phát hành ra công chúng với các khối cụ thể về khả năng đưa ra câu trả lời cho các câu hỏi về sinh học và an ninh mạng. Sau đó, vào cuối tuần trước, chính quyền Trump đã chuyển sang hạn chế cả hai mô hình vì họ tin rằng các rào chắn của Fable 5 có thể bị vô hiệu hóa để cho phép truy cập đầy đủ vào các khả năng của Mythos 5, bị cáo buộc khiến nó trở thành rủi ro an ninh quốc gia. Tuy nhiên, các chuyên gia cho rằng cuộc xung đột thể chế này chỉ đơn giản là trì hoãn hoặc che giấu một sự thật phũ phàng: Anthropic có thể là mũi nhọn trong thời điểm này, nhưng khả năng AI nói chung và các mô hình từ nhiều công ty cũng như nhà phát triển trọng lượng mở gần như chắc chắn sẽ có khả năng tương tự như Mythos 5 trong tương lai gần—nếu chưa có. Tarah Wheeler, giám đốc an ninh của công ty tư vấn an ninh mạng chuyên biệt TPO Group, cho biết: “Thật là thiển cận khi nghĩ rằng không có đối thủ cạnh tranh nào khác của Anthropic sẽ phát triển các khả năng tương tự như Mythos hoặc thậm chí họ chưa làm như vậy”. “Có những công ty khác theo sát Anthropic, những người này có lẽ cũng có đủ năng lực và đang đưa chúng vào kho dự trữ khi họ thấy Anthropic đang được đối xử như thế nào trong môi trường pháp lý hiện tại.” Bản thân Anthropic đã nhấn mạnh điểm này kể từ khi ra mắt Mythos Preview. “Thông điệp thực sự là đây không phải về mô hình hay Anthropic,” Logan Graham, trưởng nhóm đỏ biên giới của công ty, nói với WIRED khi Mythos Preview ra mắt vào tháng 4. “Chúng ta cần chuẩn bị ngay từ bây giờ cho một thế giới nơi những khả năng này sẽ được phổ biến rộng rãi trong 6, 12, 24 tháng nữa.” Ví dụ, OpenAI cũng đã phát hành riêng một mô hình tập trung vào an ninh mạng vào giữa tháng 4 và công bố chiến lược an ninh mạng mở rộng. Các nhà nghiên cứu lưu ý rằng ngay cả trước thế hệ mô hình tiếp theo này, các dịch vụ AI hiện có có thể được sử dụng để phát triển khai thác và săn tìm lỗ hổng nâng cao với cơ chế khai thác được tinh chỉnh. Một nhóm lớn các nhà lãnh đạo an ninh mạng đã nhấn mạnh điều này với chính quyền trong một bức thư ngỏ vào Chủ nhật, cho rằng chỉ thị kiểm soát xuất khẩu của Nhà Trắng là sai lầm. “Đó không phải là một mô hình; Bruce Schneier, một nhà nghiên cứu tại Đại học Harvard và Đại học Toronto, người đã phân tích tình hình, cho biết: “Các mô hình nguồn mở nhỏ hơn, rẻ hơn, đôi khi một mình và đôi khi phối hợp với nhau, có thể kết hợp màn trình diễn của Mythos/Fable với sự gợi ý phức tạp hơn. Và chúng ta nên mong đợi các mô hình khác sẽ phù hợp với khả năng sáng tạo và độ bền của Mythos/Fable trong vòng vài tháng — lâu hơn một chút đối với các mô hình nguồn mở.” Các chuyên gia cho rằng điều mà Nhà Trắng và các chính phủ trên thế giới cần tập trung vào là phát triển một cách dân chủ các kế hoạch rộng hơn và minh bạch hơn nhiều về cách họ sẽ đối phó với những tiến bộ về khả năng AI trong an ninh mạng và trong các lĩnh vực nhạy cảm khác khi chúng chắc chắn xảy ra. Chris Wysopal, đồng sáng lập công ty bảo mật đám mây Veracode, cho biết: “Vấn đề chính sách không phải là liệu một công nghệ có rủi ro hay không”. “Câu hỏi đặt ra là liệu một hạn chế cụ thể có làm giảm rủi ro đó một cách có ý nghĩa hay nó chủ yếu làm chậm những người đang cố gắng làm cho hệ thống an toàn hơn”. Ars Technica đã tách tín hiệu khỏi tiếng ồn trong hơn 25 năm. Với sự kết hợp độc đáo giữa hiểu biết về kỹ thuật và mối quan tâm sâu rộng đến nghệ thuật và khoa học công nghệ, Ars là nguồn đáng tin cậy trong biển thông tin. Suy cho cùng, bạn không cần phải biết mọi thứ, chỉ cần biết những gì quan trọng. Gợi ý thực hành: 1. Theo dõi thông báo từ cơ quan địa phương tại California. 2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.

Những mô hình AI "nguy hiểm" đang đến dù thế nào đi chăng nữa