OpenAI rilascia l'Agente vocale
Il 21 marzo alle 01:00 (UTC+8), OpenAI ha condotto una trasmissione tecnica in diretta e ha rilasciato tre nuovi modelli vocali specificamente per lo sviluppo di Agenti Vocali AI. Due sono modelli da voce a testo, GPT-40 Transcribe e GPT-4 Mini Transcribe; uno è un modello da testo a voce, GPT-40 Mini TTS. Vale la pena menzionare che gli sviluppatori possono controllare l'emozione e lo stile vocale del modello GPT-40 Mini TTS. OpenAI ha aggiunto una potente modalità di streaming alla sua API da voce a testo, permettendo agli sviluppatori di inserire flussi audio continui nel modello in tempo reale, e il modello può anche restituire testo e risposte continue in tempo reale. Questa caratteristica di interazione in tempo reale è molto utile per applicazioni che richiedono feedback immediato, come sistemi di dialogo vocale in tempo reale, trascrizione di riunioni vocali ecc. (AIGC Open Community)
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche
Walrus: il sito per richiedere l'airdrop di WAL è ora aperto
Walrus lancerà presto la funzione di ricompensa per lo staking di WAL
In tendenza
AltroPrezzi delle criptovalute
Altro








