Emilia 一个开源多语言高质量语音数据集

包含六种语言超10万小时

港中大（深圳）联合中科院声学所、上海人工智能实验室等机构发布了超过10万小时包含6种语言的多样化的语音生成数据集—— Emilia！

Emilia是一个开源的多语种外语音数据集，专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录，覆盖了各种说话风格和内容类型，如脱口秀、访谈、辩论、体育评论和有声书。

需求人群：

"Emilia数据集面向需要进行大规模语音生成研究的学者和研究人员，特别是那些专注于多语种语音合成和语音识别技术的专业人士。"

使用场景示例：

用于开发多语种的语音合成系统
作为训练数据集，提高语音识别算法的准确性
在教育领域，用于语言学习和语音教学

产品特色：

提供超过101,000小时的六种语言高质量语音数据
包含中文、英文、日文、韩文、德文和法文的语音和文本转录
源自互联网上多样化的视频平台和播客，内容类型丰富
支持使用Emilia-Pipe开源预处理管道进行数据预处理
允许研究者下载原始音频文件并重建数据集
Emilia-Pipe支持自定义语音数据的预处理，以满足特定研究需求

如果想详细了解，可以点开视频下方的链接。
谢谢观看本视频。要是喜欢，请订阅、点赞。谢谢

ArXiv: https://arxiv.org/abs/2407.05361
GitHub: https://github.com/open-mmlab/Amphion/tree/main/preprocessors/Emilia
Homepage: https://emilia-dataset.github.io/Emilia-Demo-Page/
HuggingFace: https://huggingface.co/datasets/amphion/Emilia

油管：https://youtu.be/7bQDIbJQb94

Tarogo Gugu Bloger

搜尋此網誌