Nội dung bài viết
Anthropic lần đầu tiên đưa mô hình AI mạnh mẽ nhất của mình đến với công chúng, nhưng nó đang thực hiện điều đó với các rào chắn. Vào thứ Ba, công ty AI đã ra mắt Claude Fable 5, phiên bản công khai đầu tiên của mô hình Mythos.
Anthropic cho biết Fable 5 vượt trội về công nghệ phần mềm, công việc tri thức và tầm nhìn, nhưng nó đi kèm với những giới hạn an toàn cứng nhắc. Trong các lĩnh vực có rủi ro cao như an ninh mạng, sinh học, hóa học và chưng cất, mô hình sẽ chặn phản hồi và quay trở lại Claude Opus 4.8.
Ra mắt dưới dạng bản xem trước vào tháng 4, Mythos ban đầu chỉ giới hạn ở một số đối tác do lo ngại về an ninh mạng. Tuần trước, Anthropic đã mở rộng quyền truy cập tới hàng trăm tổ chức trên 15 quốc gia, một lần nữa tập trung vào các tổ chức quản lý cơ sở hạ tầng quan trọng.
Giờ đây, bất kỳ ai cũng có thể sử dụng phiên bản của công nghệ đó thông qua API Claude của Anthropic và các gói Enterprise dựa trên mức tiêu dùng.
Quyền truy cập vào đăng ký sẽ được triển khai theo từng giai đoạn: đến hết ngày 22 tháng 6, Fable 5 sẽ được đưa vào các gói Enterprise Pro, Max, Team và dựa trên chỗ ngồi mà không phải trả thêm phí.
Vào ngày 23 tháng 6, Anthropic sẽ rút Fable 5 khỏi các gói đó, yêu cầu tín dụng sử dụng trong tương lai, với kế hoạch khôi phục nó dưới dạng đăng ký tiêu chuẩn. n tính năng càng sớm càng tốt.
Anthropic cũng đang triển khai phiên bản Mythos mới, được gọi là Mythos 5, cho các tổ chức đã được chấp thuận truy cập vào mô hình nâng cao. Sự ra mắt của Fable diễn ra khi Anthropic chuẩn bị thâm nhập thị trường đại chúng, cùng với OpenAI và SpaceX của Elon Musk.
Nó cũng tuân theo lời kêu gọi của công ty AI kêu gọi các phòng thí nghiệm AI lớn trên toàn cầu thiết lập một bàn đạp phanh phối hợp để phát triển AI tiên phong.
Anthropic cảnh báo rằng các hệ thống đang phát triển nhanh đến mức chúng có thể sớm đạt được khả năng tự cải thiện đệ quy (RSI), tự cải thiện bản thân mà không cần sự can thiệp của con người.
Cảnh giác với những gì mô hình lớp Mythos có thể làm nếu rơi vào tay kẻ xấu, Anthropic cho biết họ đã kiểm tra kỹ lưỡng các bộ phân loại của mình bằng các nỗ lực bẻ khóa trước khi phát hành Fable 5.
"Trong nội bộ, chúng tôi đã chạy một chương trình thưởng lỗi bên ngoài không tạo ra bản bẻ khóa phổ biến nào trong hơn 1.000 giờ thử nghiệm.
Sau đó, chúng tôi đã làm việc với các tổ chức nhóm đỏ bên ngoài cũng không tìm thấy các bản bẻ khóa phổ quát." Điều đó nói rằng, vẫn có thể có những cuộc tấn công mới.
Do đó, với sự ra mắt của Fable 5 và Mythos 5, Anthropic cho biết họ sẽ yêu cầu lưu giữ 30 ngày đối với tất cả lưu lượng truy cập, ngay cả khi các doanh nghiệp trước đó không có thời gian lưu giữ.
thỏa thuận ion Anthropic cho biết họ sẽ không sử dụng dữ liệu để đào tạo mà chỉ để “bảo vệ khỏi các cuộc tấn công phức tạp và mới lạ, bao gồm cả các cuộc bẻ khóa mới” cũng như “xác định và giảm bớt các kết quả dương tính giả”.
Chính sách này có thể đặt ra tiền lệ trong ngành trong đó quyền truy cập vào các mô hình ngày càng mạnh mẽ đi kèm với các chính sách lưu giữ dữ liệu bắt buộc được coi là biện pháp an toàn. Đối với những người tiếp tục sử dụng mô hình, không phải câu hỏi nào cũng nhận được câu trả lời Fable 5.
Anthropic cho biết trường hợp Fable phải trì hoãn Opus 4.8 là rất hiếm, với dữ liệu ban đầu cho thấy ít nhất 95% phiên Fable chạy hoàn toàn dựa trên phản hồi của chính mô hình.
Trong thử nghiệm của bên thứ ba, công ty phân tích Hex cho biết trong một tuyên bố rằng Fable là công ty đầu tiên đạt 90% điểm chuẩn phân tích cốt lõi của các nhiệm vụ phân tích phức tạp, kéo dài.
Hex nói: “Đối với những câu hỏi khó nhất, nó thể hiện khả năng phán đoán mạnh mẽ và sự chú ý đến sắc thái. Nền tảng mã hóa Vibe Base44 đã lưu ý trong một tuyên bố rằng Fable tốt hơn ở “ứng dụng đầy đủ một lần chụp” và có khả năng gọi công cụ tuyệt vời.
Nền tảng tác nhân và không gian làm việc được hỗ trợ bởi AI, Genspark cho biết Fable đã đánh bại mọi mô hình khác trong các đánh giá của mình và hoạt động tốt hơn đáng kể trong các nhiệm vụ như thiết kế giao diện người dùng và mã hóa trò chơi.
giá g cho cả Fable 5 và Mythos 5 là 10 USD trên một triệu mã thông báo đầu vào và 50 USD trên một triệu mã thông báo đầu ra, gấp đôi giá của Opus 4.8. Chỉ riêng mức giá đó đã có thể đóng vai trò ngăn chặn việc sử dụng rộng rãi.
Nhiều doanh nghiệp ngày càng quan ngại về chi phí AI sau khi nhận thấy các hóa đơn đến hoặc vượt quá ngân sách AI hàng năm của họ sớm. Các mô hình nâng cao như Opus 4.8 có thể làm trầm trọng thêm những vấn đề đó, với các kỹ năng lý luận nâng cao có thể chia một yêu cầu thành nhiều nhiệm vụ.
Anthropic cho biết họ dự kiến nhu cầu về Fable 5 sẽ rất cao và khó dự đoán. Và thực sự, một số người, chẳng hạn như nền tảng phần thưởng mua sắm Rakuten, có thể cho rằng mức tăng giá này xứng đáng với mức giá bỏ ra.
Rakuten cho biết trong một tuyên bố: “Với nỗ lực cao nhất, Fable phản ánh và xác nhận công việc của chính mình.
“Đối với chúng tôi, đó là điều khiến các hoạt động có tính tự chủ cao trở nên khả thi — tư duy bổ sung sẽ tự mang lại lợi ích.” Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ.
Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.