Nội dung bài viết
StrictlyVC đầu tiên của năm 2026 sẽ ra mắt SF vào ngày 30 tháng 4. Vé đang bán rất nhanh.
Đăng ký ngay bây giờ. Mua một thẻ Disrupt và nhận thẻ thứ hai với mức giảm giá 50%.
Kết thúc vào ngày 8 tháng 5. Đăng ký ngay.
OpenAI cho biết hôm thứ Năm rằng API của họ hiện sẽ bao gồm một số tính năng thông minh bằng giọng nói mới được thiết kế để giúp các nhà phát triển tạo ra các ứng dụng có thể nói chuyện, phiên âm và dịch các cuộc hội thoại với người dùng.
GPT‑Realtime‑2 mới của công ty là một mẫu giọng nói khác, được xây dựng để tạo ra mô phỏng giọng nói thực tế có thể trò chuyện với người dùng.
Tuy nhiên, không giống như phiên bản tiền nhiệm của nó (GPT-Realtime-1.5), phiên bản này được xây dựng dựa trên lý luận lớp GPT‑5 mà OpenAI cho biết được tạo ra để giải quyết các yêu cầu phức tạp hơn từ người dùng.
Công ty cũng đang tung ra GPT‑Realtime‑Translate, đúng như tên gọi của nó, được thiết kế để cung cấp các dịch vụ dịch thuật theo thời gian thực “theo kịp” người dùng trong cuộc trò chuyện.
Tính năng này bao gồm hơn 70 ngôn ngữ đầu vào (tức là những ngôn ngữ mà nó có thể hiểu) và 13 ngôn ngữ đầu ra (ngôn ngữ mà nó chuyển tiếp tới người nói).
Cuối cùng, công ty cũng đã ra mắt khả năng phiên âm mới, GPT-Realtime-Whisper, mang đến cho người dùng khả năng chuyển giọng nói thành văn bản trực tiếp được ghi lại dưới dạng tương tác. ns xảy ra.
Công ty cho biết: “Cùng nhau, các mô hình mà chúng tôi đang tung ra sẽ chuyển âm thanh theo thời gian thực từ cuộc gọi và phản hồi đơn giản sang giao diện giọng nói thực sự có thể hoạt động: nghe, lý luận, dịch, phiên âm và thực hiện hành động khi cuộc trò chuyện diễn ra”.
Những cập nhật này sẽ tốt cho ai? Các công ty muốn mở rộng khả năng dịch vụ khách hàng là mục tiêu rõ ràng.
Tuy nhiên, OpenAI cũng lưu ý rằng các tính năng mới của nó sẽ hỗ trợ nhiều lĩnh vực, bao gồm giáo dục, truyền thông, sự kiện và nền tảng của người sáng tạo, cùng những lĩnh vực khác. Mặc dù những công cụ này có vẻ hữu ích từ góc độ doanh nghiệp nhưng cũng có vẻ hợp lý khi chúng có thể bị lạm dụng.
Công ty cho biết họ đã xây dựng các biện pháp bảo vệ để ngăn chặn việc lạm dụng các tính năng mới của mình nhằm tạo thư rác, lừa đảo hoặc các hình thức lạm dụng trực tuyến khác.
OpenAI cho biết một số trình kích hoạt nhất định đã được nhúng vào hệ thống để “các cuộc trò chuyện có thể bị tạm dừng nếu chúng bị phát hiện là vi phạm nguyên tắc về nội dung có hại của chúng tôi”. Tất cả các mẫu giọng nói mới đều có trong API thời gian thực của OpenAI.
Translate và Whisper được tính phí theo phút, trong khi GPT-Realtime-2 được tính phí theo mức tiêu thụ mã thông báo. Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ N .
Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi. StrictlyVC Athens là người tiếp theo.
Nghe những hiểu biết sâu sắc chưa được lọc trực tiếp từ các nhà lãnh đạo công nghệ của Châu Âu và kết nối với những người đang định hình những gì phía trước. Khóa tại chỗ của bạn trước khi nó biến mất.
Tin tặc phá hoại các trang đăng nhập của trường học sau khi thực hiện một vụ hack Instruct khác Lorenzo Franceschi-Bicchierai Zack Whittaker Tin tặc đánh cắp dữ liệu của sinh viên trong khi vi phạm gã khổng lồ công nghệ giáo dục Instruct Lorenzo Franceschi-Bicchierai Khi các công nhân lo lắng về AI, Jensen Huang của Nvidia cho biết AI đang 'tạo ra một số lượng lớn việc làm' Lucas Ropek Anthropic và OpenAI đều đang thành lập liên doanh cho các dịch vụ AI dành cho doanh nghiệp Nắp màu mới của Russell Brandom Ouster sắp thay thế máy ảnh Sean O'Kane Điều này máy đọc sách điện tử nhỏ, có từ tính có thể ngăn bạn cuộn giấy tận thế Amanda Silberling
Gợi ý thực hành:
1. Theo dõi thông báo từ cơ quan địa phương tại California.
2. Kiểm tra nguồn chính thức trước khi chia sẻ lại thông tin.