OpenAI veröffentlicht Sprachagenten
Am 21. März um 01:00 Uhr (UTC+8) führte OpenAI eine technische Live-Übertragung durch und veröffentlichte drei neue Sprachmodelle, die speziell für die Entwicklung von KI-Sprachagenten entwickelt wurden. Zwei davon sind Sprach-zu-Text-Modelle, GPT-40 Transcribe und GPT-4 Mini Transcribe; eines ist ein Text-zu-Sprache-Modell, GPT-40 Mini TTS. Es ist erwähnenswert, dass Entwickler die stimmliche Emotion und den Stil des GPT-40 Mini TTS-Modells steuern können. OpenAI hat seinem Sprach-zu-Text-API einen leistungsstarken Streaming-Modus hinzugefügt, der es Entwicklern ermöglicht, kontinuierliche Audiostreams in Echtzeit in das Modell einzugeben, und das Modell kann auch kontinuierlich Text und Antworten in Echtzeit zurückgeben. Diese Funktion der Echtzeit-Interaktion ist sehr hilfreich für Anwendungen, die sofortiges Feedback erfordern, wie z.B. Echtzeit-Sprachdialogsysteme, Transkription von Sprachmeetings usw. (AIGC Open Community)
Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.
Das könnte Ihnen auch gefallen
Walrus: WAL Airdrop-Claim-Website ist jetzt geöffnet
Walrus wird bald die WAL-Staking-Belohnungsfunktion einführen
Im Trend
MehrKrypto Preise
Mehr








