首页> 新闻中心>

【OpenVoice】人工智能语音大模型可以通过录音定制音色

2025-06-24 11:43:52

来源：新华网

字体：小大

在这里插入图片描述
Openvoice是一种创新的开源语音克隆和生成技术，它通过先进的深度学习算法，特别是基于Transformer结构的文本转语音（TTS）模型，实现高精度音色克隆和灵活的语音风格控制。该技术不仅可以在多种语言和口音中产生语音，还具备零样本跨语言声音克隆的能力，在语音合成领域取得了重大突破。Openvoice原生支持多种语言，如英语、西班牙语、法语、汉语、日语和韩语。这种多语言支持能力使Openvoice在全球范围内具有广阔的应用前景。

下载和使用。

搭建环境。

安装python和anaconda。
Pythonoice指定Python 3.9版本分析器󿀌如果已经下载了其他版本的Python，那就没关系了c;Anaconda适配༈anaconda 在中国下载似乎有点慢󿀌如果需要安装包󿀌可在文末看到。只提供windows版）
环境变量需要在安装成功后进行配置。

配置pip conda 国内镜像。

# 添加清华大学镜像站频道。conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/。# 添加频道后，需要显示频道。conda config。 --set。show_channel_urls。 yes。# 查询现有频道。conda config。 --get。channels。##############pip###############。# 使用清华镜像源配置。pip config。 set。global.index-url https://pypi.tuna.tsinghua.edu.cn/simple。# 镜像源配置信任。pip config。 set。install.trusted-host pypi.tuna.tsinghua.edu.cn。

升级pip。

python。 -m。pip。 install。--upgrade。

安装ffmpeg。
到官网下载6.11版󿀌并配置环境变量（这个东西在国内下载也很慢，如果需要安装包󿀌文末可以看到）

在这里插入图片描述
3. 安装vscode。
可以直接在官网下载。
下载后，需要下载python extension。

下载源码。
假如你有git 去要保存的文件夹选择git bash here。

直接使用git clone https://github.com/myshell-ai/OpenVoice.git 等待下载完成。

如果没有�直接到官网下载源码压缩包即可。
在这里插入图片描述

添加Jupyter扩展VSCode。

输入Jupyter搜索�第一次安装，附带扩展将自动安装。
选择Python分析器。

新建虚拟环境。

在这里插入图片描述
选择"Venv"

选择3.9python。

6. 安装所需插件。

点击OK。过程需要时间󿀌耐心等待VSCode安装完成。

假如发生意外然后需要打开控制台重新安装插件。
```
pip install。 -。r requirements。.。txt。
```

在这里插入图片描述
需要注意的是如果出现 (.venv) 解释激活成󿀌 如果没有，则需要重新激活。

.。\。.venv。\。Scripts。\。activate。

安装ipykernel。
```
pip。 install。ipykernel。
```
用于激活虚拟环境。
安装ipywidgets。
```
pip。 install。ipywidgets。
```

用于数据分析。

下载checkpoints（需要梯子󿀌checkpoints不能下载，可以在文末获得）
点击官网下载。
checkpoints包含中文ZH和英文EN的模型处理文件。

解压后放入openvoice文件夹下。

模型使用。

点击左边的文件demo_part1.ipynb，然后点击右侧红框选择虚拟环境。
选Python Environments。

可以用conda代替。
点击所有出现的三角形。

这次执行的虚拟环境在右侧。
执行后可以看到这里的output_source有相应的语音。

中文配置。

若要配置自己想要的音色，将录音文件复制到resources，替换下图中的MP3文件作为自定义录音文件例如：
在这里插入图片描述

demo_part_02需要api___02key。

在这里插入图片描述
作者资金有限公司，我没试过。

获取相关文件。

工重号发送【openvoice】即可获得。
关联文章。
在这里插入图片描述

【责任编辑：新华网】

LANGUAGE

新闻

财经

观点

文化

国情

承建网站