
2025年12月15日,阿里通义大模型推出了一对超实用的语音“神器”--通义百聆语音双子星。简单说,这俩工具一个能让AI“说人话”,还能模仿你的声音讲外语、说方言;另一个能让AI“听懂人话”,就算在菜市场、地铁里说话,也能精准转成文字。更厉害的是,这两项技术都公开免费开源,开源地址我放文末了
一、AI“配音员”:3秒克隆声音,外语方言随口来
第一个是Fun-CosyVoice3,它像一个全能AI配音员,不仅能说多种语言,还能模仿任何人的声音,用起来特别简单。
1. 核心技能:普通人也能get的实用功能
- 说话零延迟:不管是打字输入文字,还是实时语音转换,AI马上就能出声,没有卡顿。比如做直播时想给画面配解说,输入文字瞬间就能听到配音,完全不耽误节奏。
- 中英文、方言随便切换:支持中、英、日、粤等9种常用语言,还有东北话、四川话、粤语等18种方言。就算你说“这个oversize的衣服太大了”这种中英文混搭的话,AI也能念得又准又自然;用普通话录3秒声音,就能让AI用你的音色说粤语、日语,听起来就像你自己说的一样。
- 能“带情绪”说话:开心、愤怒、平静等9种情绪都能模拟。比如想做一段搞笑短视频配音,AI能笑着说话;想做科普视频,就能用沉稳的语气讲解。
- 多音字不读错:像“他把数据输入电脑,开始数数”这种句子,AI能精准区分“数据(shù)”和“数数(shǔ)”的发音,不会闹笑话。
2. 开源福利:免费get专属AI配音
这次推出的Fun-CosyVoice3-0.5B版本,完全免费开放给大家用。只要你提供一段3秒以上的自己的声音(比如录一句“大家好”),AI就能克隆你的音色,之后输入任何文字,都能生成“你自己说的话”。
不管是想给自家孩子做专属睡前故事配音,还是给短视频账号做固定音色解说,甚至想做一个“会说方言的语音助手”,都能靠它实现,而且可以下载到自己的电脑上随便改、随便用。
二、AI“听写员”:嘈杂环境也能听清,多语言都能转文字
部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章
- https://github.com/FunAudioLLM/CosyVoice(GitHub)
- https://funaudiollm.github.io/cosyvoice3/(GitHub.io)
- https://www.modelscope.cn/studios/FunAudioLLM/Fun-CosyVoice3-0.5B(体验demo)
- https://modelscope.cn/models/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(国内模型仓库)
- https://huggingface.co/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(海外模型仓库)
Fun-ASR-Nano-0.8B:
- https://github.com/FunAudioLLM/Fun-ASR(GitHub)
- https://funaudiollm.github.io/funasr/(GitHub.io)
- https://modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano/(国内体验demo)
- https://huggingface.co/spaces/FunAudioLLM/Fun-ASR-Nano(海外体验demo)
- https://modelscope.cn/models/FunAudioLLM/fun-asr-nano-2512(国内模型仓库)
- https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512(海外模型仓库)
原创文章,更多AI科技、提示词,微信搜索 橙 市 播 客 小程序
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明