OpenAI wprowadza agenta głosowego
21 marca o godzinie 01:00 (UTC+8) OpenAI przeprowadziło techniczną transmisję na żywo i wprowadziło trzy nowe modele głosowe specjalnie do rozwijania agentów głosowych AI. Dwa z nich to modele zamiany mowy na tekst, GPT-40 Transcribe i GPT-4 Mini Transcribe; jeden to model zamiany tekstu na mowę, GPT-40 Mini TTS. Warto wspomnieć, że deweloperzy mogą kontrolować emocje i styl głosu modelu GPT-40 Mini TTS. OpenAI dodało potężny tryb strumieniowy do swojego API zamiany mowy na tekst, umożliwiając deweloperom wprowadzanie ciągłych strumieni audio do modelu w czasie rzeczywistym, a model może również zwracać ciągły tekst i odpowiedzi w czasie rzeczywistym. Ta funkcja interakcji w czasie rzeczywistym jest bardzo pomocna dla aplikacji wymagających natychmiastowej informacji zwrotnej, takich jak systemy dialogu głosowego w czasie rzeczywistym, transkrypcja spotkań głosowych itp. (AIGC Open Community)
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Walrus: Strona do zgłaszania roszczeń airdropu WAL jest już otwarta
Walrus wkrótce uruchomi funkcję nagród za staking WAL
Popularne
WięcejCeny krypto
Więcej








