分享缩略图

分享到:
链接已复制
首页> 新闻中心>

【OpenVoice】人工智能语音大模型可以通过录音定制音色

2025-06-24 11:43:52

来源:新华网

字体:

在这里插入图片描述
Openvoice是一种创新的开源语音克隆和生成技术,它通过先进的深度学习算法,特别是基于Transformer结构的文本转语音(TTS)模型,实现高精度音色克隆和灵活的语音风格控制。该技术不仅可以在多种语言和口音中产生语音,还具备零样本跨语言声音克隆的能力,在语音合成领域取得了重大突破。Openvoice原生支持多种语言,如英语、西班牙语、法语、汉语、日语和韩语。这种多语言支持能力使Openvoice在全球范围内具有广阔的应用前景。

下载和使用。
搭建环境。
  1. 安装python和anaconda。
    Pythonoice指定Python 3.9版本分析器󿀌如果已经下载了其他版本的Python,那就没关系了c;Anaconda适配༈anaconda 在中国下载似乎有点慢󿀌如果需要安装包󿀌可在文末看到。只提供windows版)
    环境变量需要在安装成功后进行配置。
    在这里插入图片描述
    配置pip conda 国内镜像。
# 添加清华大学镜像站频道。conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config。 --add。channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/。# 添加频道后,需要显示频道。conda config。 --set。show_channel_urls。 yes。# 查询现有频道。conda config。 --get。channels。##############pip###############。# 使用清华镜像源配置。pip config。 set。global.index-url https://pypi.tuna.tsinghua.edu.cn/simple。# 镜像源配置信任。pip config。 set。install.trusted-host pypi.tuna.tsinghua.edu.cn。

升级pip。

python。 -m。pip。 install。--upgrade。
  1. 安装ffmpeg。
    到官网下载6.11版󿀌并配置环境变量(这个东西在国内下载也很慢,如果需要安装包󿀌文末可以看到)
    在这里插入图片描述

在这里插入图片描述
3. 安装vscode。
可以直接在官网下载。
下载后,需要下载python extension。

  1. 下载源码。
    假如你有git 去要保存的文件夹 选择git bash here。
    在这里插入图片描述

直接使用git clone https://github.com/myshell-ai/OpenVoice.git 等待下载完成。

如果没有�直接到官网下载源码压缩包即可。
在这里插入图片描述

  1. 添加Jupyter扩展VSCode。
    在这里插入图片描述
    输入Jupyter搜索�第一次安装,附带扩展将自动安装。
    在这里插入图片描述

  2. 选择Python分析器。
    在这里插入图片描述
    新建虚拟环境。

在这里插入图片描述
选择"Venv"
在这里插入图片描述
选择3.9python。
在这里插入图片描述
6. 安装所需插件。
在这里插入图片描述
点击OK。过程需要时间󿀌耐心等待VSCode安装完成。

  1. 假如发生意外 然后需要打开控制台 重新安装插件。
    pip install。 -。r requirements。.。txt。

在这里插入图片描述
需要注意的是 如果出现 (.venv) 解释激活成󿀌 如果没有,则需要重新激活。

.。\。.venv。\。Scripts。\。activate。
  1. 安装ipykernel。
    pip。 install。ipykernel。
    用于激活虚拟环境。
    在这里插入图片描述
  2. 安装ipywidgets。
    pip。 install。ipywidgets。

用于数据分析。

  1. 下载checkpoints(需要梯子󿀌checkpoints不能下载,可以在文末获得)
    点击官网下载。
    checkpoints包含中文ZH和英文EN的模型处理文件。
    在这里插入图片描述
    解压后放入openvoice文件夹下。
    在这里插入图片描述
模型使用。
  1. 点击左边的文件demo_part1.ipynb,然后点击右侧红框选择虚拟环境。
    在这里插入图片描述
  2. 选Python Environments。
    在这里插入图片描述
    可以用conda代替。
    在这里插入图片描述
  3. 点击所有出现的三角形。
    在这里插入图片描述
    这次执行的虚拟环境在右侧。
  4. 执行后可以看到这里的output_source有相应的语音。
    在这里插入图片描述
    在这里插入图片描述
    中文配置。
    在这里插入图片描述

若要配置自己想要的音色,将录音文件复制到resources,替换下图中的MP3文件作为自定义录音文件 例如:
在这里插入图片描述
在这里插入图片描述

demo_part_02需要api___02key。

在这里插入图片描述
作者资金有限公司,我没试过。

获取相关文件。

工重号发送【openvoice】即可获得。
关联文章。
在这里插入图片描述

【责任编辑:新华网】
返回顶部