Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFuturesBots‌EarnSao chép
OpenAI phát hành Trợ lý giọng nói

OpenAI phát hành Trợ lý giọng nói

Xem bài gốc
Bitget2025/03/21 00:42

Vào ngày 21 tháng 3 lúc 01:00 (UTC+8), OpenAI đã thực hiện một buổi phát sóng trực tiếp kỹ thuật và phát hành ba mô hình giọng nói mới dành riêng cho việc phát triển các Đại lý Giọng nói AI. Hai trong số đó là các mô hình chuyển giọng nói thành văn bản, GPT-40 Transcribe và GPT-4 Mini Transcribe; một là mô hình chuyển văn bản thành giọng nói, GPT-40 Mini TTS. Đáng chú ý là các nhà phát triển có thể kiểm soát cảm xúc và phong cách giọng nói của mô hình GPT-40 Mini TTS. OpenAI đã thêm một chế độ phát trực tuyến mạnh mẽ vào API chuyển giọng nói thành văn bản của mình, cho phép các nhà phát triển nhập các luồng âm thanh liên tục vào mô hình trong thời gian thực, và mô hình cũng có thể trả về văn bản và phản hồi liên tục trong thời gian thực. Tính năng tương tác thời gian thực này rất hữu ích cho các ứng dụng yêu cầu phản hồi ngay lập tức, chẳng hạn như hệ thống đối thoại giọng nói thời gian thực, chuyển biên các cuộc họp giọng nói, v.v. (Cộng đồng Mở AIGC)

0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!