3秒克隆你的声音!阿里通义开源语音神器,方言、外语都能说,嘈杂环境也能听清
aikeji
12-15
112


2025年12月15日,阿里通义大模型推出了一对超实用的语音“神器”--通义百聆语音双子星。简单说,这俩工具一个能让AI“说人话”,还能模仿你的声音讲外语、说方言;另一个能让AI“听懂人话”,就算在菜市场、地铁里说话,也能精准转成文字。更厉害的是,这两项技术都公开免费开源,开源地址我放文末了

一、AI“配音员”:3秒克隆声音,外语方言随口来

第一个是Fun-CosyVoice3,它像一个全能AI配音员,不仅能说多种语言,还能模仿任何人的声音,用起来特别简单。

1. 核心技能:普通人也能get的实用功能

  • 说话零延迟:不管是打字输入文字,还是实时语音转换,AI马上就能出声,没有卡顿。比如做直播时想给画面配解说,输入文字瞬间就能听到配音,完全不耽误节奏。
  • 中英文、方言随便切换:支持中、英、日、粤等9种常用语言,还有东北话、四川话、粤语等18种方言。就算你说“这个oversize的衣服太大了”这种中英文混搭的话,AI也能念得又准又自然;用普通话录3秒声音,就能让AI用你的音色说粤语、日语,听起来就像你自己说的一样。
  • 能“带情绪”说话:开心、愤怒、平静等9种情绪都能模拟。比如想做一段搞笑短视频配音,AI能笑着说话;想做科普视频,就能用沉稳的语气讲解。
  • 多音字不读错:像“他把数据输入电脑,开始数数”这种句子,AI能精准区分“数据(shù)”和“数数(shǔ)”的发音,不会闹笑话。

2. 开源福利:免费get专属AI配音

这次推出的Fun-CosyVoice3-0.5B版本,完全免费开放给大家用。只要你提供一段3秒以上的自己的声音(比如录一句“大家好”),AI就能克隆你的音色,之后输入任何文字,都能生成“你自己说的话”。

不管是想给自家孩子做专属睡前故事配音,还是给短视频账号做固定音色解说,甚至想做一个“会说方言的语音助手”,都能靠它实现,而且可以下载到自己的电脑上随便改、随便用。

二、AI“听写员”:嘈杂环境也能听清,多语言都能转文字

部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章

Fun-ASR-Nano-0.8B:

原创文章,更多AI科技、提示词,微信搜索 橙 市 播 客 小程序



微信扫描下方的二维码阅读更多精彩内容

打赏
使用AI生成超现实饮料罐广告图的完整教程
上一篇
用 AI 玩游戏《宝可梦水晶版》:Gemini 3 Pro 如何击败 2.5 Pro
下一篇
生成中...
点赞是美意,赞赏是鼓励