Nội dung bài viết
Các ứng dụng đọc chính tả AI đã đi được một chặng đường dài trong một thời gian ngắn. Trong nhiều năm, chúng chậm và không chính xác, trừ khi bạn nói với một giọng đặc biệt và phát âm rõ ràng.
Những tiến bộ trong mô hình ngôn ngữ lớn (LLM) và mô hình chuyển giọng nói thành văn bản đã thay đổi điều đó, tạo ra các hệ thống có thể giải mã giọng nói chính xác hơn trong khi vẫn giữ đủ ngữ cảnh để định dạng văn bản chính xác.
Các nhà phát triển cũng đã tích hợp sẵn các tính năng để tự động loại bỏ các từ đệm, sửa lỗi sai và xử lý dấu câu — xuất ra văn bản cần ít chỉnh sửa hơn nhiều.
Với hàng tá ứng dụng như vậy hiện có trên thị trường, chúng tôi đã tổng hợp các lựa chọn của mình để có được những ứng dụng đọc chính tả tốt nhất và hữu ích nhất hiện có.
Wispr Flow là một ứng dụng đọc chính tả bằng AI được tài trợ tốt, cho phép bạn thêm các từ và hướng dẫn tùy chỉnh để đọc chính tả. Nó có các ứng dụng gốc cho macOS, Windows và iOS; một phiên bản Android đang được phát triển.
Ứng dụng cho phép bạn tùy chỉnh cách chép lại văn bản của mình bằng cách chọn từ các phong cách “trang trọng”, “thông thường” và “rất bình thường” cho các loại văn bản khác nhau, chẳng hạn như nhắn tin cá nhân, công việc và email.
Và nếu bạn sử dụng nó với các công cụ mã hóa rung cảm như Cursor, bạn có thể bật tính năng tự động nhận dạng các biến hoặc gắn thẻ tệp trong cuộc trò chuyện. các ứng dụng cho phép bạn phiên âm miễn phí tối đa 2.000 từ mỗi tuần trên máy tính để bàn và 1.000 từ mỗi tháng trên iOS.
Gói đăng ký trả phí cung cấp phiên âm không giới hạn và bắt đầu ở mức 15 đô la mỗi tháng. Willow tự quảng cáo mình là một công cụ tiết kiệm thời gian đáng kể cho những người không thích gõ phím.
Bên cạnh các tính năng phổ biến như tự động chỉnh sửa và định dạng, ứng dụng còn sử dụng các mô hình ngôn ngữ lớn để tạo ra một đoạn văn bản đầy đủ chỉ từ một vài từ chính tả.
Willow cũng áp dụng cách tiếp cận tập trung vào quyền riêng tư hơn bằng cách lưu trữ cục bộ tất cả bản ghi trên thiết bị của bạn và cho phép bạn chọn hoàn toàn không tham gia đào tạo mô hình.
Nó cũng cho phép bạn thêm từ vựng tùy chỉnh để giúp nó thích ứng với thuật ngữ trong ngành hoặc phương ngữ địa phương của bạn. Willow cho phép bạn đọc chính tả 2.000 từ mỗi tháng trên ứng dụng máy tính để bàn miễn phí.
Gói đăng ký cá nhân bắt đầu ở mức 15 đô la mỗi tháng, mở khóa khả năng đọc chính tả không giới hạn và cho phép ứng dụng ghi nhớ phong cách viết của bạn.
Nếu quyền riêng tư là ưu tiên hàng đầu của bạn, Monologue cho phép bạn tải trực tiếp mô hình AI của nó xuống thiết bị của bạn để chép lời, giữ cho dữ liệu của bạn hoàn toàn không bị lưu trữ trên đám mây. Hơn nữa, ứng dụng cho phép bạn tùy chỉnh tông màu tùy thuộc vào ứng dụng bạn sử dụng.
Độc thoại cho phép bạn phiên âm 1.000 từ mỗi tháng miễn phí; một thuê bao có giá 10 USD mỗi tháng hoặc 100 USD mỗi năm. Công ty cũng gửi cho những người dùng tích cực nhất của mình một thiết bị phím tắt vật lý có tên Monokey để sử dụng với ứng dụng.
Bàn phím cũng như năm 1983. Bạn chỉ cần một phím—Monokey, thiết bị phiên bản giới hạn có thể biến giọng nói của bạn thành văn bản trong Monologue.
Chúng tôi đang tặng 10 bản cùng với đăng ký Monologue miễn phí hàng năm. pic.twitter.com/nXuz1ll2LU Superwhisper chủ yếu là một ứng dụng đọc chính tả nhưng nó cũng có thể phiên âm từ các tệp âm thanh hoặc video.
Ứng dụng cho phép bạn chọn và tải xuống các mô hình AI, bao gồm một số mô hình AI của riêng nó ở tốc độ và mức độ chính xác khác nhau, cùng với các mô hình nhận dạng giọng nói Parakeet của Nvidia.
Ứng dụng này cũng cho phép bạn viết lời nhắc tùy chỉnh để điều khiển đầu ra và bạn có thể xem cả bản ghi đã xử lý và chưa xử lý trực tiếp từ bàn phím hệ thống của mình.
Tính năng chuyển giọng nói thành văn bản cơ bản được sử dụng miễn phí và bạn có 15 phút để kiểm tra các tính năng Pro như dịch thuật và chép lời. Bậc trả phí cho phép bạn sử dụng các khóa API AI của riêng mình và kết nối các mô hình cục bộ và đám mây mà không có bất kỳ giới hạn sử dụng nào.
Gói hàng tháng có giá 8,49 USD mỗi tháng, gói hàng năm có giá 84,99 USD mỗi tháng hoặc bạn có thể trả 249,99 USD cho gói đăng ký trọn đời ion. Ứng dụng VoiceTypr sử dụng cách tiếp cận ngoại tuyến, không đăng ký, cho phép bạn sử dụng các mô hình cục bộ để chép lời.
Nó cũng có kho lưu trữ GitHub dành cho những ai muốn tự lưu trữ và chạy phiên bản nguồn mở. VoiceTypr hỗ trợ hơn 99 ngôn ngữ và hoạt động trên cả Mac và Windows.
Ứng dụng có sẵn để dùng thử miễn phí trong ba ngày và sau đó, nó sẽ cho phép bạn mua giấy phép trọn đời. Ứng dụng có giá 35 USD cho một thiết bị, 56 USD cho hai thiết bị và 98 USD cho bốn thiết bị.
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.