OpenAI公布其语音生成模型:Voice Engine



根据文本输入和一个15秒的音频样本,就能生成接近原始说话者声音的自然听起来的语音。

Voice Engine最初于2022年底开发,并已经提供给包括Heygen在内的少数公司进行测试性使用。


## 主要功能


1、自然听起来的语音生成:利用单个15秒的音频样本,Voice Engine能够创造出既情感丰富又真实的语音,显著提升合成语音的自然度和真实感。

2、支持多种用途:从教育援助、内容翻译、提高偏远地区服务质量,到支持非语言人士和帮助患者恢复声音,Voice Engine的应用场景广泛,跨越多个行业。

3、语言和口音的保留:在内容翻译时,Voice Engine能够保留原始发言者的本地口音,使得翻译后的语音不仅流利还能保持原声音的特色。

4、多语种支持:能够生成多种语言的语音输出,适应全球化需求,特别是对于需要将内容本地化到不同语言市场的企业和内容创作者来说,这一特点尤为重要。


详细:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices


视频:https://youtu.be/UWLsrNY3pQQ

留言