Nội dung bài viết
Nó cảnh báo rằng những tiến bộ nhanh chóng trong công nghệ có thể sớm cho phép các hệ thống AI tự cải thiện nhanh hơn khả năng xã hội có thể kiểm soát rủi ro.
Anthropic đang đề xuất các công ty trí tuệ nhân tạo hàng đầu thế giới đưa ra cách phối hợp để tạm dừng phát triển các hệ thống AI tiên tiến, đồng thời cảnh báo rằng công nghệ này đang cải tiến nhanh đến mức có nguy cơ con người sẽ mất kiểm soát.
Công ty đứng sau chatbot Claude cho biết trong một bài đăng trên blog hôm thứ Năm rằng, khi AI tiên tiến ngày càng thực hiện các nhiệm vụ nhanh hơn, “sẽ tốt cho thế giới nếu có lựa chọn làm chậm lại hoặc tạm dừng” sự phát triển của nó.
Anthropic cho biết viện nghiên cứu nội bộ của họ có kế hoạch hợp tác với những người khác để khám phá vấn đề này và “thực hiện các hành động” để giúp xây dựng hệ thống giảm tốc độ hoặc tạm dừng đáng tin cậy mà không nêu cụ thể hơn.
Đối thủ nhân loại OpenAI đã lập luận về một cách tiếp cận khác trong một báo cáo được công bố hôm thứ Tư, nói rằng “các chính phủ dân chủ, không phải các công ty tư nhân hành động một mình, cuối cùng phải xác định các quy tắc, biện pháp bảo vệ và cơ chế trách nhiệm giải trình”.
“Quan điểm của chúng tôi là các quyết định về tốc độ đổi mới AI không nên được giao cho bất kỳ phòng thí nghiệm, công ty hoặc thông số kỹ thuật nào.
Anthropic cho biết trong bài đăng của mình: Dựa trên các xu hướng hiện tại và được cung cấp đủ sức mạnh tính toán, một hệ thống AI có thể thiết kế và phát triển người kế nhiệm của riêng nó, cái được gọi là "tự cải tiến đệ quy".
Nicolas Papernot, trưởng nhóm nghiên cứu cho biết: "Tôi nghĩ điều thực sự quan trọng là mọi người hiểu rằng đó không chỉ là mô hình ngôn ngữ lớn nhất, mạnh nhất mới gây ra mối lo ngại về bảo mật". phỏng vấn Các tác giả của bài Anthropic, người đồng sáng lập công ty.
Jack Clark và Marina Favaro, người đứng đầu viện nghiên cứu của nó, cho biết việc tạm dừng sẽ được sử dụng để cho phép “cấu trúc xã hội và nghiên cứu liên kết” theo kịp những tiến bộ của AI. Sự liên kết là cách viết tắt của ngành để đảm bảo công nghệ phù hợp với các giá trị và ý định của con người.
Sự phối hợp được đề xuất sẽ cho phép các phòng thí nghiệm AI tiên tiến xác minh rằng các đối thủ toàn cầu đã thực sự dừng hoặc làm chậm công việc của họ, “và kẻ xấu không thể lợi dụng sự hỗ trợ của việc phối hợp làm chậm lại để bí mật tiến lên phía trước”.
Công ty cho biết cần có một cơ chế phối hợp toàn cầu vì nếu không có cơ chế này, sự chậm lại trong quá trình phát triển AI có thể khiến những người chơi “ít thận trọng nhất” bắt kịp và gây thêm áp lực lên các công ty và chính phủ khi họ đưa ra những lựa chọn khó khăn về an toàn AI.
Những lo ngại rằng các hệ thống AI tiên tiến có thể vượt khỏi tầm kiểm soát của con người và gây ra tác hại cho xã hội đã tăng lên khi công nghệ này ngày càng trở nên hữu ích.
Mô hình Mythos của chính Anthropic đã gây ra làn sóng chấn động trong các ngành công nghiệp, bao gồm cả ngân hàng và phần mềm, vào đầu năm nay với khả năng tìm ra các lỗ hổng trong mã hiện có. Nhưng quy định còn chậm, đặc biệt là ở Mỹ, nơi đặt trụ sở của hầu hết các phòng thí nghiệm AI hàng đầu.
Một lệnh điều hành sớm của chính quyền Trump er tuần này đã đặt trách nhiệm lên vai các phòng thí nghiệm, yêu cầu họ tự nguyện gửi các mô hình có khả năng nhất của mình để chính phủ kiểm tra an ninh mạng trước khi phát hành rộng rãi.
Các nhà nghiên cứu AI trước đây cũng đã kêu gọi tạm dừng nhưng chưa đạt được nhiều thành công.
Elon Musk, người sở hữu phòng thí nghiệm AI xAI, là một trong những người ủng hộ nỗ lực của Viện Cuộc sống Tương lai phi lợi nhuận vào năm 2023 nhằm tạm dừng phát triển AI trong sáu tháng để có thời gian cho các biện pháp bảo vệ an toàn.
Anthropic từ lâu đã định vị mình là phòng thí nghiệm AI tập trung vào an toàn.
Đầu năm nay, nó đã từ chối cho phép quân đội Hoa Kỳ sử dụng các mô hình của mình để giám sát trong nước và vũ khí tự động hoàn toàn, gây ra phản ứng dữ dội từ chính phủ, đưa nó vào danh sách đen an ninh quốc gia, sẽ có hiệu lực vào cuối năm 2026.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.