OpenAI发布新一代语音模型系列 支持语音情感控制

OpenAI发布新一代语音模型系列 支持语音情感控制
2025年3月21日消息,OpenAI发布新一代语音模型系列,包括语音转文本模型GPT-4oTranscribe和GPT-4oMiniTranscribe,以及文本转语音模型GPT-4oMiniTTS。这些模型在语音转录准确性和语音生成的自然度、情感表达方面取得显著进步。GPT-4oTranscribe单词错误率大幅降低,尤其在英语、西班牙语等语言上表现优异;GPT-4oMiniTranscribe则以更快的速度和更高的效率满足实时转录需求。GPT-4oMiniTTS首次支持语音情感控制,用户可通过自然语言指令定制语音的语调和情感,如让AI以“富有同理心的客服”或“正念老师”的语气表达内容,还提供多种预设语音风格。这些模型已向全球开发者开放,定价为每分钟0.01美元。
© 版权声明
pANYIIS.jpg

相关文章

暂无评论

暂无评论...