Deepgram 推出语音代理 API,让 AI 对话变得生动有趣

柒柒快讯3小时前发布 AI-77
0
Deepgram 推出语音代理 API,让 AI 对话变得生动有趣

Deepgram 推出了一项新的语音代理API,这项技术能够实现大规模的实时人机自然对话。通过集成语音识别和语音合成的AI模型,Deepgram的系统能够提供类似人类的响应性,并且通过单一API提供完整的服务。用户只需设置提示并告诉系统他们想要执行的任务,系统就会自动处理其余部分。这种系统可以应用于任何带有麦克风和扬声器的设备,如网站、手机、移动设备、AI挂件甚至汽车的免提系统。

Deepgram的系统不仅能够让用户听到AI合成的语音并像与真人交谈一样回应,而且在对话层面上具有高响应性,能够在适当的时机插话而不打断对方的思路。此外,系统可以被打断,就像与另一个人交谈一样,不会丢失对话的上下文,从而实现流畅的交互。

公司的联合创始人兼首席执行官Scott Stephenson表示,AI已经成为主流,而语音AI在过去的六个月中也变得普及。Deepgram的系统允许开发者选择任何大型语言模型(LLM)来连接API,包括来自OpenAI、Anthropic PBC和Meta Platforms Inc.的模型。Deepgram还提供了12种不同的声音选项供客户选择。

BARC US的研究副总裁Kevin Petrie认为,随着语音到语音的交互成为人机交互的标准方式,Deepgram的Voice Agent API抓住了市场机遇,并通过将文本对话转换为语音,简化了客户服务流程。此外,Deepgram通过与各种大型语言模型集成,扩大了市场机会。

Stephenson还提到,Deepgram不仅仅局限于语音到语音的交互,它也可以轻松地与文本到语音集成,允许人们在需要隐私时使用。例如,在拥挤的火车上,用户可能只想在手机上打字,然后通过耳机听取回复。他预测,一旦人们意识到可以与语音代理进行类似人类的可打断对话体验,他们将会更频繁地使用这项服务。

来源:siliconangle

© 版权声明

相关文章

暂无评论

暂无评论...