Nội dung bài viết
Anthropic đang đề xuất các công ty trí tuệ nhân tạo hàng đầu thế giới đưa ra cách phối hợp để tạm dừng phát triển các hệ thống AI tiên tiến, cảnh báo công nghệ đang cải tiến nhanh đến mức có nguy cơ con người sẽ mất kiểm soát.
Công ty đứng sau chatbot Claude cho biết trong một bài đăng trên blog hôm thứ Năm rằng khi AI tiên tiến ngày càng thực hiện các nhiệm vụ nhanh hơn, “sẽ tốt cho thế giới nếu có lựa chọn làm chậm lại hoặc tạm dừng” sự phát triển của nó.
Anthropic cho biết viện nghiên cứu nội bộ của họ có kế hoạch hợp tác với những người khác để khám phá vấn đề này và “thực hiện các hành động” để giúp xây dựng hệ thống giảm tốc độ hoặc tạm dừng đáng tin cậy mà không nêu cụ thể hơn.
Đối thủ nhân loại OpenAI đã lập luận về một cách tiếp cận khác trong một báo cáo được công bố hôm thứ Tư, nói rằng “các chính phủ dân chủ, không phải các công ty tư nhân hành động một mình, cuối cùng phải xác định các quy tắc, biện pháp bảo vệ và cơ chế trách nhiệm giải trình”.
“Quan điểm của chúng tôi là các quyết định về tốc độ đổi mới AI không nên được giao cho bất kỳ phòng thí nghiệm, công ty hoặc nhóm lợi ích đặc biệt nào,” nó nói. Các mô hình AI ngày càng nhanh hơn, với sự gia tăng nhanh chóng về tốc độ chúng có thể thực hiện các tác vụ phần mềm như tự viết mã.
n, Anthropic cho biết trong bài đăng của mình. Dựa trên các xu hướng hiện tại và được cung cấp đủ sức mạnh tính toán, một hệ thống AI có thể thiết kế và phát triển phiên bản kế nhiệm của riêng nó, theo cái gọi là “tự cải thiện đệ quy”.
Anthropic cho biết, AI tự xây dựng sẽ là một cột mốc công nghệ quan trọng mang lại lợi ích trong khoa học, chăm sóc sức khỏe và các lĩnh vực khác, nhưng nó “cũng có thể làm tăng nguy cơ con người mất quyền kiểm soát các hệ thống AI”.
Một số nhân vật trong ngành công nghệ từ lâu đã cảnh báo về một kịch bản như vậy. Bài đăng của Anthropic được đưa ra sau một cảnh báo khác trong tuần này từ một nhóm các nhà nghiên cứu tại Đại học Toronto.
Họ đã chỉ ra cách sử dụng các công cụ AI để tạo ra một loại “sâu” AI mới có thể điều chỉnh chiến lược hack của nó khi nó lây lan từ thiết bị này sang thiết bị khác và chiếm lĩnh một mạng máy tính rộng lớn.
Trưởng nhóm nghiên cứu Nicolas Papernot cho biết trong một cuộc phỏng vấn: “Tôi nghĩ điều thực sự quan trọng là mọi người phải hiểu rằng không chỉ những mô hình ngôn ngữ lớn nhất, mạnh mẽ nhất mới gây ra những lo ngại về an ninh”.
Các tác giả của bài đăng Anthropic, người đồng sáng lập công ty Jack Clark và Marina Favaro, người đứng đầu viện nghiên cứu của nó, cho biết việc tạm dừng sẽ được sử dụng để cho phép “nghiên cứu về cấu trúc xã hội và sự liên kết” bắt kịp những tiến bộ của AI.
Sự liên kết là cách viết tắt của ngành để đảm bảo công nghệ phù hợp với các giá trị và ý định của con người.
Sự phối hợp được đề xuất sẽ cho phép các phòng thí nghiệm AI tiên tiến xác minh rằng các đối thủ toàn cầu đã thực sự dừng hoặc làm chậm công việc của họ, “và kẻ xấu không thể lợi dụng sự hỗ trợ của việc phối hợp làm chậm lại để bí mật tiến lên phía trước”.
Công ty cho biết cần có một cơ chế phối hợp toàn cầu vì nếu không có cơ chế này, sự chậm lại trong quá trình phát triển AI có thể khiến những người chơi “ít thận trọng nhất” bắt kịp và gây thêm áp lực cho các công ty và chính phủ khi họ đưa ra những lựa chọn khó khăn về an toàn AI.
Bài đăng của Anthropic xuất hiện khi công ty và OpenAI, nhà sản xuất ChatGPT, chạy đua bán cổ phiếu trên thị trường chứng khoán, trong một đợt IPO có thể định giá Anthropic ở mức gần một nghìn tỷ đô la.
Papernot đã thông báo cho các cơ quan an ninh mạng Canada trước khi công bố báo cáo của mình, trong đó cho thấy cách các nhà nghiên cứu đã phát triển sâu này trong phòng thí nghiệm bằng cách sử dụng một công cụ AI “mã nguồn mở” mà các nhà phát triển phần mềm có thể dễ dàng truy cập và sửa đổi với chi phí thấp.
Ông nói: “Trước đây, những kẻ tấn công mạng sẽ tập trung vào các mục tiêu có giá trị rất cao.
“Hệ thống ngân hàng, bệnh viện, lưới điện, hệ thống xử lý nước, trường học.” Giấy không đồng ý d rằng cần có sự hợp tác nhiều hơn giữa các công ty, cơ quan chính phủ và các nhà nghiên cứu hàn lâm để phát triển các biện pháp đối phó khi các công cụ hack được hỗ trợ bởi AI tăng cường tìm kiếm các lỗ hổng máy tính.
Ông nói: “Chiếc máy tính xách tay cũ mà bạn có trong tầng hầm mà bạn không kiểm tra thường xuyên dường như không phải là một mục tiêu có giá trị cao, nhưng nó có thể được sử dụng làm bệ phóng để tấn công những mục tiêu có giá trị cao hơn này”.
“Bất kỳ thứ gì được kết nối với Internet hiện đều gặp rủi ro vì chi phí thực hiện các cuộc tấn công mạng này quá thấp.”
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.