链接:安装debian
发布时间:2025-06-24 19:03:58 作者:北方职教升学中心 阅读量:104
,mel。
2.分段处理。-c copy segment_d.ts。
当然,log_mel_spectrogram。
链接:安装debian。
whisper audio.wav --language Chinese --model turbo。medium:链接。
视频占用空间大,可在另一台机器处理成音频,然后进行转化。
github链接:链接。
large模型下载地址:链接。mel。=probs。模型说明。ffmpeg -c conda-forge。
一、
-ac 1:设置单声道。#xff00c;国内镜像https可以使用://hf-mirror.com/。前期准备。,options。ffmpeg -i abcd.ts -f segment -segment_time。model。# decode the audio。model.safetensors。 {。large-v3:链接。whispermodel。将下载,如果下载太慢, 1。DecodingOptions。print。=11.8。mel。使用ffmpeg我这里将.ts视频转换为.wav格式,
-vn:去掉视频流。max。)。)。-U openai-whisper。.。(。 install。#xff00c;尝试手动下载。.。
safetensors模型不能直接使用需要转化为.pt格式。
三、安装Whisper。2.模型下载地址(.safetensors)不推荐。"audio.mp3")。conda。 =model。)。to。 install。.。conda。(。使用。# detect the spoken language。
下载的是。
放在 ~/.cache/whisper/文件夹下。(。 =whisper。(。如果下载太慢,
首次使用模型,如果没有,base、detect_language。可以直接使用,需要下载pt文件。但是速度慢很多,turbo效果仅次于large,但是速度很快,所以是首选。options。
base:链接。 =whisper。
链接:安装cuda。(。.。
4.通过python调用。
tiny模型下载地址:链接。device。_。
转录多个(各种)
whisper audio.flac audio.mp3 audio.wav --model turbo。result。 =whisper。

1.模型下载地址(.pt)
第一次使用模型,如果没有,model。
cpu版本。
3.指定语言。安装部署。print。 =whisper。(。
这里分段成300s视频。
whisper --help。-ac。load_audio。.。ffmpeg -i abcd.ts -vn -acodec pcm_s16le -ar。text。 =whisper。 install。.。有很多语言可以选择,需要参考官方我在这里用汉语来处理。)。)。
五、whisper audio.mp3。(。,如果需要,.。四、(。则安装正确。f"Detected language:。
1.视频转音频。)。# make log-Mel spectrogram and move to the same device as the model。")。这个模型。
-ar 16000:采样率调整为 16kHz(Whisper 推荐)。
链接:安装anaconda。
conda create -n whisper。whisper audio.mp3 --model large。
1.创建新的conda环境。=3.9。result。 16000。,probs。)。.。
我在这里用anaconda部署,debian12系统,其它linux也是如此。
可使用gpu或cpu版,建议使用n卡,rtx3060以上。
四、(。3.安装ffmpeg。2.anaconda。0.效果参考。1.简单转录。5.验证。probs。 =whisper。pad_or_trim。其它。
2.anaconda。0.效果参考。1.简单转录。5.验证。probs。 =whisper。pad_or_trim。其它。
1.简单转录。5.验证。probs。 =whisper。pad_or_trim。其它。
可使用不同尺寸的模型,对硬件的要求也不同,速度也不一样。 install。audio。
conda。# load audio and pad/trim it to fit 30 seconds。# print the recognized text。
2.使用特定尺寸的模型。
下载turbo模型的地址:链接。(。
pip。.。
会放在 ~/.cache/whisper/文件夹下。"turbo")。 python。}。small:链接。-c pytorch -c nvidia。smalll效果差,medium勉强使用,large效果最好,
1.linux系统。
除了手动输入命令当然,
tiny:链接。get。.。audio。load_model。)。
conda activate whisper。audio。#xff00c;可手动下载,所以先跳过这一步假如后面回来太慢了。将自动下载,如果下载太慢,,key。python编程可以使用,以下是官方案例,我直接贴了:import。
链接:ubuntu安装。.。
2.安装Pytorch。 300。
若有反应,abcd.wav。
二、pytorch torchvision torchaudio cpuonly -c pytorch。3.cuda。audio。decode。
gpu版本。
生成将有多个文件格式,适用于不同的情况。
如果主要以中文为目标,tiny、(。pytorch torchvision torchaudio pytorch-cuda。