Nội dung bài viết
StrictlyVC đầu tiên của năm 2026 sẽ ra mắt SF vào ngày 30 tháng 4. Vé đang bán rất nhanh.
Đăng ký ngay bây giờ. Mua một thẻ Disrupt và nhận thẻ thứ hai với mức giảm giá 50%.
Kết thúc vào ngày 8 tháng 5. Đăng ký ngay.
Trí tuệ nhân tạo đang thay đổi thế giới, đồng thời phát minh ra một ngôn ngữ hoàn toàn mới để mô tả cách thức hoạt động của nó.
Dành năm phút để đọc về AI và bạn sẽ gặp phải LLM, RAG, RLHF và hàng tá thuật ngữ khác có thể khiến ngay cả những người rất thông minh trong thế giới công nghệ cũng cảm thấy bất an. Bảng thuật ngữ này là nỗ lực của chúng tôi để khắc phục điều đó.
Chúng tôi cập nhật nó thường xuyên khi lĩnh vực này phát triển, vì vậy hãy coi nó như một tài liệu sống, giống như các hệ thống AI mà nó mô tả. Trí tuệ nhân tạo tổng hợp, hay AGI, là một thuật ngữ mơ hồ.
Nhưng nó thường đề cập đến AI có khả năng cao hơn con người bình thường trong nhiều nhiệm vụ, nếu không muốn nói là hầu hết. Giám đốc điều hành OpenAI Sam Altman từng mô tả AGI là “tương đương với một con người bình thường mà bạn có thể thuê làm đồng nghiệp”.
Trong khi đó, điều lệ của OpenAI định nghĩa AGI là “các hệ thống có tính tự chủ cao, vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế”.
Cách hiểu của Google DeepMind hơi khác so với hai định nghĩa này; phòng thí nghiệm coi AGI là “AI ít nhất có khả năng như con người trong hầu hết các nhiệm vụ nhận thức”. tâm sự đã sử dụng?
Đừng lo lắng — các chuyên gia đi đầu trong nghiên cứu AI cũng vậy.
Tác nhân AI đề cập đến một công cụ sử dụng công nghệ AI để thay mặt bạn thực hiện một loạt nhiệm vụ, ngoài những gì mà một chatbot AI cơ bản hơn có thể làm, chẳng hạn như nộp hồ sơ chi phí, đặt vé hoặc đặt bàn tại nhà hàng hoặc thậm chí viết và duy trì mã.
Tuy nhiên, như chúng tôi đã giải thích trước đây, có rất nhiều yếu tố chuyển động trong không gian mới nổi này, vì vậy “tác nhân AI” có thể có ý nghĩa khác nhau đối với những người khác nhau. Cơ sở hạ tầng cũng vẫn đang được xây dựng để phát huy hết khả năng dự kiến của nó.
Nhưng khái niệm cơ bản ngụ ý một hệ thống tự trị có thể dựa trên nhiều hệ thống AI để thực hiện các nhiệm vụ nhiều bước. Hãy nghĩ về các điểm cuối API như những “nút” ở mặt sau của một phần mềm mà các chương trình khác có thể nhấn để khiến nó thực hiện mọi việc.
Các nhà phát triển sử dụng các giao diện này để xây dựng các tiện ích tích hợp, ví dụ: cho phép một ứng dụng lấy dữ liệu từ ứng dụng khác hoặc cho phép tác nhân AI kiểm soát trực tiếp các dịch vụ của bên thứ ba mà không cần con người vận hành thủ công từng giao diện.
Hầu hết các thiết bị nhà thông minh và nền tảng được kết nối đều có sẵn các nút ẩn này, ngay cả khi người dùng bình thường không bao giờ nhìn thấy hoặc tương tác với chúng.
Là đặc vụ AI phát triển năng lực hơn, họ ngày càng có khả năng tự mình tìm và sử dụng các điểm cuối này, mở ra những khả năng mạnh mẽ — và đôi khi bất ngờ — cho tự động hóa.
Với một câu hỏi đơn giản, bộ não con người có thể trả lời mà không cần suy nghĩ quá nhiều về nó, những câu như “con vật nào cao hơn, hươu cao cổ hay mèo?” Nhưng trong nhiều trường hợp, bạn thường phải dùng bút và giấy để đưa ra câu trả lời đúng vì phải qua các bước trung gian.
Ví dụ, nếu một người nông dân có gà và bò, tổng cộng chúng có 40 đầu và 120 chân, bạn có thể cần viết ra một phương trình đơn giản để tìm ra câu trả lời (20 con gà và 20 con bò).
Trong bối cảnh AI, lý luận theo chuỗi suy nghĩ cho các mô hình ngôn ngữ lớn có nghĩa là chia một vấn đề thành các bước trung gian nhỏ hơn để cải thiện chất lượng của kết quả cuối cùng.
Thường mất nhiều thời gian hơn để nhận được câu trả lời, nhưng câu trả lời có nhiều khả năng đúng hơn, đặc biệt là trong bối cảnh logic hoặc mã hóa. Các mô hình suy luận được phát triển từ các mô hình ngôn ngữ lớn truyền thống và được tối ưu hóa cho tư duy chuỗi suy nghĩ nhờ học tăng cường.
Đây là một khái niệm cụ thể hơn là “tác nhân AI”, có nghĩa là một chương trình có thể tự mình thực hiện các hành động, ep từng bước, để hoàn thành một mục tiêu. Tác nhân mã hóa là một phiên bản chuyên dụng được áp dụng để phát triển phần mềm.
Thay vì chỉ đề xuất mã để con người xem xét và dán vào, tác nhân mã hóa có thể viết, kiểm tra và gỡ lỗi mã một cách tự động, xử lý loại công việc lặp đi lặp lại, thử và sai thường tiêu tốn cả ngày của nhà phát triển.
Các tác nhân này có thể hoạt động trên toàn bộ cơ sở mã, phát hiện lỗi, chạy thử nghiệm và đưa ra các bản sửa lỗi với sự giám sát tối thiểu của con người.
Hãy nghĩ về nó giống như việc thuê một thực tập sinh rất nhanh, không bao giờ ngủ và không bao giờ mất tập trung, tuy nhiên, cũng như bất kỳ thực tập sinh nào, con người vẫn cần phải xem lại công việc.
Mặc dù có phần giống một thuật ngữ đa nghĩa, nhưng điện toán thường đề cập đến sức mạnh tính toán quan trọng cho phép các mô hình AI hoạt động. Kiểu xử lý này thúc đẩy ngành công nghiệp AI, mang lại cho ngành này khả năng đào tạo và triển khai các mô hình mạnh mẽ của mình.
Thuật ngữ này thường là cách viết tắt của các loại phần cứng cung cấp sức mạnh tính toán, những thứ như GPU, CPU, TPU và các dạng cơ sở hạ tầng khác tạo thành nền tảng của ngành công nghiệp AI hiện đại.
Một tập hợp con của máy học tự cải tiến trong đó các thuật toán AI được thiết kế với mạng thần kinh nhân tạo (ANN) nhiều lớp struct. Điều này cho phép họ tạo ra các mối tương quan phức tạp hơn so với các hệ thống dựa trên máy học đơn giản hơn, chẳng hạn như mô hình tuyến tính hoặc cây quyết định.
Cấu trúc của các thuật toán học sâu lấy cảm hứng từ các con đường liên kết giữa các tế bào thần kinh trong não người. Các mô hình AI học sâu có thể tự xác định các đặc điểm quan trọng trong dữ liệu thay vì yêu cầu các kỹ sư con người xác định các tính năng này.
Cấu trúc này cũng hỗ trợ các thuật toán có thể học hỏi từ các lỗi và thông qua quá trình lặp lại và điều chỉnh, cải thiện kết quả đầu ra của chính chúng. Tuy nhiên, hệ thống deep learning yêu cầu rất nhiều điểm dữ liệu để mang lại kết quả tốt (hàng triệu điểm trở lên).
Chúng cũng thường mất nhiều thời gian đào tạo hơn so với các thuật toán học máy đơn giản hơn — vì vậy chi phí phát triển có xu hướng cao hơn. Khuếch tán là công nghệ trọng tâm của nhiều mô hình AI tạo nghệ thuật, âm nhạc và văn bản.
Lấy cảm hứng từ vật lý, các hệ thống khuếch tán từ từ “phá hủy” cấu trúc dữ liệu, ví dụ: ảnh, bài hát, v.v., bằng cách thêm tiếng ồn cho đến khi không còn gì. Trong vật lý, sự khuếch tán là tự phát và không thể đảo ngược, đường khuếch tán trong cà phê không thể khôi phục lại dạng khối.
Nhưng hệ thống khuếch tán tôi n AI nhằm mục đích tìm hiểu một loại quy trình “khuếch tán ngược” để khôi phục dữ liệu bị phá hủy, đạt được khả năng khôi phục dữ liệu khỏi nhiễu. Chắt lọc là một kỹ thuật được sử dụng để trích xuất kiến thức từ một mô hình AI lớn với mô hình ‘giáo viên-học sinh’.
Các nhà phát triển gửi yêu cầu đến mô hình giáo viên và ghi lại kết quả đầu ra. Các câu trả lời đôi khi được so sánh với một tập dữ liệu để xem chúng chính xác đến mức nào.
Sau đó, những kết quả đầu ra này được sử dụng để huấn luyện mô hình học sinh, mô hình này được huấn luyện để phỏng đoán hành vi của giáo viên. Quá trình chưng cất có thể được sử dụng để tạo ra mô hình nhỏ hơn, hiệu quả hơn dựa trên mô hình lớn hơn với tổn thất chưng cất tối thiểu.
Đây có thể là cách OpenAI phát triển GPT-4 Turbo, phiên bản nhanh hơn của GPT-4. Mặc dù tất cả các công ty AI đều sử dụng phương pháp chưng cất trong nội bộ, nhưng nó cũng có thể đã được một số công ty AI sử dụng để bắt kịp các mô hình tiên tiến.
Việc chắt lọc từ đối thủ cạnh tranh thường vi phạm các điều khoản dịch vụ của API AI và trợ lý trò chuyện.
Điều này đề cập đến việc đào tạo thêm mô hình AI để tối ưu hóa hiệu suất cho một nhiệm vụ hoặc lĩnh vực cụ thể hơn so với trọng tâm đào tạo trước đây, thường bằng cách cung cấp dữ liệu mới, chuyên biệt (tức là theo định hướng nhiệm vụ).
Nhiều công ty khởi nghiệp AI đang phát triển mạnh mẽ các mô hình ngôn ngữ làm điểm khởi đầu để xây dựng một sản phẩm thương mại nhưng đang cạnh tranh để tăng cường tiện ích cho một lĩnh vực hoặc nhiệm vụ mục tiêu bằng cách bổ sung các chu trình đào tạo trước đó bằng cách tinh chỉnh dựa trên kiến thức và chuyên môn về lĩnh vực cụ thể của riêng họ.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.