OpenAI lança Agente de Voz
Em 21 de março às 01:00 (UTC+8), a OpenAI realizou uma transmissão técnica ao vivo e lançou três novos modelos de voz especificamente para o desenvolvimento de Agentes de Voz de IA. Dois são modelos de voz-para-texto, GPT-40 Transcribe e GPT-4 Mini Transcribe; um é um modelo de texto-para-voz, GPT-40 Mini TTS. Vale mencionar que os desenvolvedores podem controlar a emoção e o estilo vocal do modelo GPT-40 Mini TTS. A OpenAI adicionou um modo de streaming poderoso à sua API de voz-para-texto, permitindo que os desenvolvedores insiram fluxos de áudio contínuos no modelo em tempo real, e o modelo também pode retornar texto e respostas contínuas em tempo real. Este recurso de interação em tempo real é muito útil para aplicações que exigem feedback imediato, como sistemas de diálogo de voz em tempo real, transcrição de reuniões de voz, etc. (Comunidade Aberta AIGC)
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez você também goste
Walrus: site para reivindicação de airdrop WAL está agora aberto
Walrus em breve lançará a função de recompensa de staking WAL
Populares
MaisPreços de criptomoedas
Mais








