OpenAI випускає голосового агента
21 березня о 01:00 (UTC+8) OpenAI провела технічну пряму трансляцію та випустила три нові голосові моделі, спеціально розроблені для створення AI Voice Agents. Дві з них є моделями перетворення голосу в текст: GPT-40 Transcribe та GPT-4 Mini Transcribe; одна є моделлю перетворення тексту в голос: GPT-40 Mini TTS. Варто зазначити, що розробники можуть контролювати емоції та стиль голосу моделі GPT-40 Mini TTS. OpenAI додала потужний режим потокової передачі до свого API перетворення голосу в текст, що дозволяє розробникам вводити безперервні аудіопотоки в модель у реальному часі, і модель також може повертати безперервний текст і відповіді в реальному часі. Ця функція взаємодії в реальному часі дуже корисна для застосувань, які потребують негайного зворотного зв'язку, таких як системи голосового діалогу в реальному часі, транскрипція голосових зустрічей тощо. (AIGC Open Community)
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
Walrus: Вебсайт для отримання airdrop WAL тепер відкритий
Walrus незабаром запустить функцію винагороди за стейкінг WAL
У тренді
БільшеЦіни на криптовалюти
Більше








