查看: 555

小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice

[复制链接]
已绑定手机
 楼主| wo*** 发表于 2026-5-30 15:23 | 显示全部楼层 |阅读模式
1.jpg

OmniVoice 是一款最先进的大规模多语言零样本文本到语音(TTS)模型,支持超过 600 种语言。该模型基于一种新颖的扩散语言模型架构,能够以卓越的推理速度生成高质量语音,并支持语音克隆和声音设计。

软件特点
超广语言覆盖:支持600+ 语言,零样本 TTS 中覆盖最广。
零样本语音克隆:仅需3–10 秒参考音频,无需训练即可复刻音色,质量顶尖。
自由语音设计:用文本指令控制性别、年龄、音高、口音 / 方言、耳语等,无需参考音。
极速推理:RTF 低至0.025,比实时快40 倍,适合批量与实时场景。
精细发音控制:支持笑声 / 叹气等非语言标记,支持拼音 / 音标强制纠音。
架构简洁高效:扩散语言模型结构,兼顾音质、速度与扩展性。
易用部署:一键启动 Web UI,已经制作好了离线整合包给大家使用,大家有需要的可以试试。
完全开源:GitHub 开源,可本地部署(已经可以本地离线运行了)、二次开发与商用友好。

2.jpg

3.jpg

4.jpg

5.jpg

中创网免费提供下载 (加入中赚VIP 项目更精彩)  

下载地址....【关注中赚,天天给你精彩内容,你值得收藏。】......................

友情提醒:中赚网官方微信公众号开通了,这里没有广告,只有干货!定期分享你意想不到的网络思维!干货教程!网赚论坛部分教程需要解压密码,所以请务必加微信公众号!
据说扫下这个二维码的,一个月都可以赚几万块!试试就知道哦

   
温馨提示:
1、本内容内由作者投稿,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
客服QQ/微信
723915236 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先中创网,值得信赖!
众创网络 版权所有!

本站内容均转载于互联网,并不代表中创网立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

信息产业部备案号 粤ICP备2022107892号

小黑屋|加入vip|手机版| 中创网

GMT+8, 2026-6-12 12:52 , Processed in 0.030890 second(s), 20 queries , Gzip On, Redis On.

快速回复 返回顶部 返回列表