Nội dung bài viết
Khi LLM ngày càng phát triển mạnh mẽ hơn, ảo giác đã được chứng minh là khó tránh khỏi. Lỗi xuất hiện ngay cả trong những mô hình thông minh nhất và mặc dù có nhiều cách để phát hiện những lỗi đó nhưng ngành vẫn đang tìm ra cách tốt nhất để khắc phục.
Có lẽ, công ty vừa huy động được 9 triệu đô la tài trợ ban đầu từ Andreessen Horowitz, đang cố gắng xây dựng một cách nghiêm ngặt hơn để phát hiện những lỗi đó.
Như người sáng lập Peter Elias (ảnh trên) đã nói, mục tiêu của công ty là ngăn chặn ảo giác và các lỗi thực tế đơn giản tiếp cận người dùng và đạt được độ chính xác 99,99% thường thấy trong các hệ thống xác định nhưng khó tiếp cận hơn nhiều với AI.
Hóa ra, việc đưa LLM đến mức độ chính xác đó đòi hỏi phải xem xét lại nhiều giả định cơ bản về kỹ thuật AI. Sản phẩm đầu tiên của Có lẽ là một công cụ khoa học dữ liệu, được xây dựng để tạo ra câu trả lời nhanh chóng từ các bộ dữ liệu phức tạp.
Mỗi kết quả đều đi kèm với một trích dẫn và một bản kiểm tra về cách nó được phát triển, một phương pháp ngày càng phổ biến trong các công cụ AI. Nhưng việc giữ cho các sai sót không lọt vào các bản tóm tắt đó đòi hỏi một hệ thống khai thác phức tạp mà Elias mô tả là “bộ đồ cơ khí khoa học dữ liệu”.
Các câu trả lời đầu tiên của LLM đã được kiểm tra Đây không phải là một hệ thống xác thực xác định, hệ thống này sẽ trả lại bất kỳ kết quả nào không khớp với tập dữ liệu.
Công ty cho biết điều quan trọng là LLM đã được đào tạo dựa trên trình xác nhận và toàn bộ hệ thống được tối ưu hóa để có câu trả lời nhanh và chính xác. Elias nói: “Điều chúng tôi học được khi xây dựng mô hình này là kỹ thuật khai thác của bạn càng tốt thì mô hình càng yếu.
"Nếu bạn có thể tinh chỉnh đủ bối cảnh, mô hình sẽ không cần phải nỗ lực nhiều để làm điều đúng. Về cơ bản, đó là một bài tập để giảm sự mơ hồ." Điều đó cho phép công cụ khoa học dữ liệu của Maybe chạy trên các mô hình AI nhỏ hơn đáng kể.
Elias cho biết phiên bản hiện tại đang chạy trên một mô hình “yếu hơn bốn lớp so với các mô hình biên giới”, có nghĩa là nó có thể chạy trên phần cứng cục bộ (nghĩa là máy tính để bàn thay vì trung tâm dữ liệu), giúp giảm một lượng lớn chi phí token liên quan đến việc sử dụng AI.
Đó là một ý tưởng đáng hoan nghênh tại thời điểm chi phí mã thông báo đang tăng lên và nhiều khách hàng đang đánh giá lại ngân sách AI của họ.
Và, ý tưởng của Elias không kết thúc ở khoa học dữ liệu, vì cùng một công cụ có thể được mở rộng để bao gồm các trường hợp sử dụng như dịch vụ kế toán hoặc y tế, như Elias nói, “bất kỳ trường hợp sử dụng nhạy cảm về độ chính xác nào”.
“Tôi nghĩ tôi Điều thực sự thú vị là các phòng thí nghiệm AI lớn thậm chí còn không cố gắng thực hiện điều này,” Elias nói.
“Họ được khuyến khích không làm vậy, bởi vì họ kiếm được tiền khi bạn sửa mô hình nhiều lần hơn.” Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.
Tìm hiểu sâu hơn về những yếu tố cần thiết để mở rộng quy mô và thành công từ các nhà lãnh đạo tại Mach Industries, Founders Fund và Shinkei Systems.
Thông qua các cuộc trò chuyện thẳng thắn bên lò sưởi và kết nối mạng có tác động cao, bạn sẽ có được những hiểu biết sâu sắc có giá trị và các kết nối mới.
Làn sóng sa thải AI đang trở thành thùng bột Connie Loizos Giám đốc điều hành Amazon được cho là đã nêu lên mối lo ngại về mô hình Nhân loại trước khi chính phủ đàn áp Anthony Ha FBI đã xây dựng thị trấn nhỏ bản sao của riêng mình để mô phỏng các cuộc tấn công mạng trong thế giới thực Đơn vị AI hàng tháng tuổi của Zack Whittaker Meta là một trại giam tàn phá tâm hồn, cho biết các kỹ sư bị mắc kẹt bên trong nó Prometheus của Connie Loizos Jeff Bezos huy động được 12 tỷ USD để xây dựng một 'kỹ sư tổng hợp nhân tạo' cho thế giới vật chất Các nhà nghiên cứu an ninh mạng Marina Temkin không hài lòng về các rào chắn trong Truyện ngụ ngôn Lorenzo Franceschi-Bicchierai của Anthropic Google vừa b...
cuộc chiến Lucas Ropek Connie Loizos
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.