最近一期的a16z Podcast,探讨了人工智能 (AI) 语音技术最新进展及其对不同领域的影响,摘录一些观点 ① 实时性是语音交互的关键,低延迟 (低于 300-400 毫秒) 才能创造与真人对话的错觉。 ② 电话是与世界互动的 "API",实时语音技术将使更多人通过电话体验 AI ③ 语音是人类最古老、最自然的交流方式,但一直未成为与技术交互的主要界面。AI 正在改变这一现状,语音识别和处理技术的进步使 "语音编程" 成为可能。例如AI语音代理可以替代人工进行电话客服、预约等工作,还有AI语音伴侣和语言学习等应用也展现出巨大潜力。