OpenAI merilis Agen Suara
Pada tanggal 21 Maret pukul 01:00 (UTC+8), OpenAI mengadakan siaran langsung teknis dan merilis tiga model suara baru yang khusus untuk mengembangkan Agen Suara AI. Dua di antaranya adalah model suara-ke-teks, GPT-40 Transcribe dan GPT-4 Mini Transcribe; satu adalah model teks-ke-suara, GPT-40 Mini TTS. Perlu dicatat bahwa pengembang dapat mengontrol emosi dan gaya vokal dari model GPT-40 Mini TTS. OpenAI telah menambahkan mode streaming yang kuat ke API suara-ke-teksnya, memungkinkan pengembang untuk memasukkan aliran audio berkelanjutan ke dalam model secara real-time, dan model tersebut juga dapat mengembalikan teks dan respons berkelanjutan secara real-time. Fitur interaksi real-time ini sangat membantu untuk aplikasi yang memerlukan umpan balik langsung, seperti sistem dialog suara real-time, transkripsi rapat suara, dll. (Komunitas Terbuka AIGC)
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Walrus: Situs klaim airdrop WAL sekarang sudah dibuka
Walrus akan segera meluncurkan fungsi hadiah staking WAL
Berita trending
LainnyaHarga kripto
Lainnya








