Nội dung bài viết
Tính năng AI Overview của Google trả lời sai những câu hỏi đánh vần hay đếm chữ cái đơn giản, cho thấy hạn chế của mô hình ngôn ngữ lớn khi xử lý từ ngữ.
Nhiều người dùng mạng xã hội chia sẻ ảnh chụp màn hình về sự nhầm lẫn của AI Overview khi đưa ra đáp án sai cho những câu hỏi đánh vần mà hầu hết học sinh tiểu học có thể giải quyết dễ dàng. Ví dụ, khi hỏi có bao nhiêu chữ "p" trong từ Google, AI Overview trả lời là hai.
Nó cũng khẳng định có hai chữ "d" trong từ journalism (báo chí) và viết sai thành journadism. Nó trả lời đúng có một chữ "p" trong họ của Tổng thống Mỹ Donald Trump, nhưng lại viết thành Trpum.
AI Overview trả lời có hai chữ cái "p" trong từ Google. Ảnh: X/mersomas "Đếm trong phạm vi từ ngữ là thách thức đã được biết đến với các mô hình ngôn ngữ lớn (LLM).
Chúng tôi đang nỗ lực khắc phục vấn đề", đại diện Google giải thích. Theo TechCrunch , LLM, dạng AI hỗ trợ chatbot và những công cụ tạo văn bản khác, vốn không được xây dựng để hiểu cách đánh vần.
Chúng có thể lập trình một ứng dụng trong vài giây hoặc giải quyết vấn đề mà nhà toán học bó tay suốt hàng thập kỷ, nhưng khả năng đánh vần lại tương đương trẻ mẫu giáo. Các nhà nghiên cứu giải thích, AI không coi câu là đơn vị ngôn ngữ cấu tạo từ các từ và chữ cái.
Nhiều LLM được xây dựng trên kiến trúc transformer (chuyển đổi), phân tích văn bản thành token, có thể là toàn bộ từ, âm tiết hoặc chữ cái, tùy từng mô hình.
Có nghĩa, thay vì "đọc" như con người, AI chuyển đổi văn bản thành những biểu diễn số học, sau đó đặt chúng vào ngữ cảnh để đưa ra phản hồi hợp lý. "Khi bạn nhập câu lệnh, nó sẽ được dịch thành dạng mã hóa.
Khi thấy từ 'the', LLM biết ý nghĩa của 'the' dưới dạng mã hóa, nhưng không biết các chữ cái t-h-e", nhà nghiên cứu AI Matthew Guzdial, phó giáo sư tại Đại học Alberta, nói với TechCrunch.
Kiến trúc dựa trên token của các LLM như AI Overview vốn có hạn chế và giới chuyên gia không nghĩ vấn đề chính tả sẽ sớm được giải quyết. "Thật khó để giải quyết việc nên định nghĩa 'từ' thế nào với một mô hình ngôn ngữ.
Ngay cả khi giới chuyên gia nhất trí về một bộ từ vựng token hoàn hảo, các mô hình có lẽ vẫn thấy hữu ích khi 'chia nhỏ' mọi thứ hơn nữa. Nhưng tôi nghĩ sẽ không thể đạt được việc token hóa hoàn hảo với những rối loạn này", Sheridan Feucht, nghiên cứu sinh tiến sĩ tại Đại học Northeastern, cho biết.
Logo Google theo cách đánh vần sai của AI Overview. Ảnh: Google/TechCrunch Theo Mashable , khi được hỏi về lỗi chính tả, mô hình Gemini của Google trả lời: "Tôi không nhìn hay viết văn bản theo cách bạn làm.
Khi viết từ 'apple' (quả táo), não bạn xử lý 5 chữ cái riêng biệt. Nhưng tôi xem từ đó như một đơn vị duy nhất gọi là token (biểu diễn số học của toàn bộ hoặc một phần từ).
Tôi xử lý từ ngữ như một khối nghĩa hoàn chỉnh thay vì chuỗi chữ cái riêng lẻ, nên không 'đánh vần' các từ theo trình tự". Gemini khẳng định mình biết chính xác apple nghĩa là gì và liên hệ thế nào với những từ khác, nhưng không tập trung vào đánh vần trừ khi được yêu cầu.
Tình trạng này diễn ra với nhiều mô hình AI, không riêng của Google. Tuy nhiên, chúng chỉ đôi khi "đánh vần kém" chứ không mắc lỗi trong mọi tình huống.
Bên cạnh đó, theo TechCrunch , vấn đề cũng không quá cấp thiết với giới nghiên cứu vì lợi ích của LLM không nằm ở khả năng đánh vần. Tuy nhiên, đây là lời nhắc nhở rằng AI không hoàn hảo, dù công nghệ này thường xuyên được đánh giá cao.
Do đó, thay vì tin tưởng tuyệt đối vào kết quả đầu ra, người dùng cần kiểm tra lại độ chính xác của chúng.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.