OpenAI เปิดตัว Voice Agent
เมื่อวันที่ 21 มีนาคม เวลา 01:00 (UTC+8) OpenAI ได้จัดการถ่ายทอดสดทางเทคนิคและเปิดตัวโมเดลเสียงใหม่สามรุ่นที่ออกแบบมาเฉพาะสำหรับการพัฒนา AI Voice Agents สองรุ่นเป็นโมเดลเสียงเป็นข้อความ ได้แก่ GPT-40 Transcribe และ GPT-4 Mini Transcribe; อีกรุ่นหนึ่งเป็นโมเดลข้อความเป็นเสียง ได้แก่ GPT-40 Mini TTS น่าสังเกตว่าผู้พัฒนาสามารถควบคุมอารมณ์และสไตล์เสียงของโมเดล GPT-40 Mini TTS ได้ OpenAI ได้เพิ่มโหมดสตรีมมิ่งที่ทรงพลังให้กับ API เสียงเป็นข้อความของตน ทำให้ผู้พัฒนาสามารถป้อนสตรีมเสียงต่อเนื่องเข้าสู่โมเดลได้แบบเรียลไทม์ และโมเดลยังสามารถส่งคืนข้อความและการตอบสนองต่อเนื่องได้แบบเรียลไทม์อีกด้วย คุณสมบัติของการโต้ตอบแบบเรียลไทม์นี้มีประโยชน์มากสำหรับแอปพลิเคชันที่ต้องการการตอบสนองทันที เช่น ระบบสนทนาเสียงแบบเรียลไทม์ การถอดเสียงการประชุมเสียง เป็นต้น (AIGC Open Community)
ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน
เผื่อคุณอาจชื่นชอบ
ปริมาณการซื้อขายรายวันของ KiloEx ทำสถิติสูงสุดใหม่ที่ 238 ล้านดอลลาร์หลังจากการรวม dappOS V2
Walrus: เว็บไซต์เคลม airdrop ของ WAL เปิดให้บริการแล้ว
Walrus จะเปิดตัวฟังก์ชันรางวัลการสเตก WAL ในเร็วๆ นี้
กำลังมาแรง
เพิ่มเติมราคาคริปโต
เพิ่มเติม








