【OpenVoice】人工智能语音大模型可以通过录音定制音色
2025-06-24 11:43:52
来源:新华网
Openvoice是一种创新的开源语音克隆和生成技术,它通过先进的深度学习算法,特别是基于Transformer结构的文本转语音(TTS)模型,实现高精度音色克隆和灵活的语音风格控制。该技术不仅可以在多种语言和口音中产生语音,还具备零样本跨语言声音克隆的能力,在语音合成领域取得了重大突破。Openvoice原生支持多种语言,如英语、西班牙语、法语、汉语、日语和韩语。这种多语言支持能力使Openvoice在全球范围内具有广阔的应用前景。
下载和使用。
搭建环境。
- 安装python和anaconda。
Pythonoice指定Python 3.9版本分析器如果已经下载了其他版本的Python,那就没关系了c;Anaconda适配༈anaconda 在中国下载似乎有点慢如果需要安装包可在文末看到。只提供windows版)
环境变量需要在安装成功后进行配置。
配置pip conda 国内镜像。
# 添加清华大学镜像站频道。conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/。# 添加频道后,需要显示频道。conda config。 --set。show_channel_urls。 yes。# 查询现有频道。conda config。 --get。channels。##############pip###############。# 使用清华镜像源配置。pip config。 set。global.index-url https://pypi.tuna.tsinghua.edu.cn/simple。# 镜像源配置信任。pip config。 set。install.trusted-host pypi.tuna.tsinghua.edu.cn。
升级pip。
python。 -m。pip。 install。--upgrade。
- 安装ffmpeg。
到官网下载6.11版并配置环境变量(这个东西在国内下载也很慢,如果需要安装包文末可以看到)
3. 安装vscode。
可以直接在官网下载。
下载后,需要下载python extension。
- 下载源码。
假如你有git 去要保存的文件夹 选择git bash here。
直接使用git clone https://github.com/myshell-ai/OpenVoice.git 等待下载完成。
如果没有直接到官网下载源码压缩包即可。
添加Jupyter扩展VSCode。
输入Jupyter搜索第一次安装,附带扩展将自动安装。选择Python分析器。
新建虚拟环境。
选择"Venv"
选择3.9python。
6. 安装所需插件。
点击OK。过程需要时间耐心等待VSCode安装完成。
- 假如发生意外 然后需要打开控制台 重新安装插件。
pip install。 -。r requirements。.。txt。
需要注意的是 如果出现 (.venv) 解释激活成 如果没有,则需要重新激活。
.。\。.venv。\。Scripts。\。activate。
- 安装ipykernel。
用于激活虚拟环境。pip。 install。ipykernel。
- 安装ipywidgets。
pip。 install。ipywidgets。
用于数据分析。
- 下载checkpoints(需要梯子checkpoints不能下载,可以在文末获得)
点击官网下载。
checkpoints包含中文ZH和英文EN的模型处理文件。
解压后放入openvoice文件夹下。
模型使用。
- 点击左边的文件demo_part1.ipynb,然后点击右侧红框选择虚拟环境。
- 选Python Environments。
可以用conda代替。 - 点击所有出现的三角形。
这次执行的虚拟环境在右侧。 - 执行后可以看到这里的output_source有相应的语音。
中文配置。
若要配置自己想要的音色,将录音文件复制到resources,替换下图中的MP3文件作为自定义录音文件 例如:
demo_part_02需要api___02key。
作者资金有限公司,我没试过。
获取相关文件。
工重号发送【openvoice】即可获得。
关联文章。