❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
🎙️ "Siri要失业?网易开源语音合成核弹:2000种声线+情绪自由调节,中文效果炸裂!"
大家好,我是蚝油菜花。你是否也经历过这些AI语音的尴尬时刻——
- 👉 听电子书像机器人念经,听到一半直接睡着
- 👉 语音助手永远用同种语调说"我明白了",气得你想摔手机
- 👉 想给视频配个愤怒旁白,结果AI把"怒火中烧"读成"岁月静好"...
今天要介绍的 EmotiVoice ,正在重新定义"会说话的AI"!这个由网易有道开源的语音引擎:
- ✅ 情绪大师模式:用"开心/愤怒/悲伤"等提示词精准控制语音情感
- ✅ 声优自由切换:2000+音色库秒变专业配音演员
- ✅ 中英双语专家:无缝切换语言不卡壳,发音堪比母语者
已有团队用它批量生成有声书,影视公司靠它制作角色配音——你的耳朵准备好迎接这场语音革命了吗?
🚀 快速阅读
EmotiVoice是网易有道开源的多功能语音合成系统。
- 核心功能:支持中英文2000+音色,通过提示词控制情感输出,提供语音克隆能力
- 技术原理:基于风格嵌入实现情感控制,采用多说话人嵌入向量技术,支持Docker快速部署
EmotiVoice 是什么
EmotiVoice是由网易有道团队开源的多语言文本转语音(TTS)系统。该系统支持中文和英语两种语言,提供超过2000种不同的声音选择,并能通过提示词控制生成带有特定情感的语音。
该系统采用先进的深度学习技术,具备完整的训练和推理框架。除了基础语音合成功能外,还支持语音克隆等高级特性,提供Web交互界面和兼容OpenAI的API接口,方便开发者在各种场景中集成使用。
EmotiVoice 的主要功能
- 多语言支持:完美处理中文和英文语音合成任务
- 海量音色库:内置超过2000种不同音色可供选择
- 情感控制:通过提示词生成快乐、悲伤、愤怒等多种情感语音
- 便捷接口:提供Web界面和API两种使用方式
- 语音克隆:支持用户自定义声音特征的克隆和复现
EmotiVoice 的技术原理
- 情感嵌入技术:通过风格嵌入向量实现情感和风格的条件控制
- 多说话人建模:为每个说话人训练独特的嵌入向量表征
- 高效推理架构:基于Docker容器实现快速部署和扩展
- 预训练+微调:在大规模数据预训练基础上支持个性化调整
如何运行 EmotiVoice
Docker快速部署
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
访问 http://localhost:8501 即可使用Web界面
完整安装
conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
python -m nltk.downloader "averaged_perceptron_tagger_eng"
API服务启动
pip install fastapi pydub uvicorn[standard] pyrubberband
uvicorn openaiapi:app --reload
资源
- GitHub 仓库:https://github.com/netease-youdao/EmotiVoice
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
发表评论 取消回复