默认值："'“¿([{-

发布时间：2025-06-24 17:34:53 作者：北方职教升学中心阅读量：235

换行前󿀌一行最多有多少个字符 (条件：--word_timestamps True)。

默认值："'“¿([{-。--initial_prompt INITIAL_PROMPT。--suppress_tokens SUPPRESS_TOKENS。
16、

translate：语音转英语

默认值：transcribe。

5、
20、whisper简介：

Whisper是一种通用的语音识别模型。

默认值：False。因为 `logprob_threshold`解码失败，认为这个片段没有声音。默认情况下使用简单长度标准化。

默认值： 0.2。
14、

默认值："'.。

默认值： false。
可选文本作为第一个窗口的提示。
如果平均对数概率低于此值，认为解码失败了。温度会升高。

9、

默认值：无。
24、

默认值：0.6。

在CPU接口下，torch使用的线程数量，取代 MKL_NUM_THREADS/OMP_NUM_THREADS。--model_dir MODEL_DIR。

beam解码࿰选项patience值c;参考https://arxiv.org/abs/2204.05424, 默认情况下（1.0）相当于传统的beam搜索。--verbose VERBOSE。
15、
23、

2、

4、

1、
29、

10、--max_line_width MAX_LINE_WIDTH。
25、

默认值：无。

用于取样温度。

默认值：无。将进行语言测试。--logprob_threshold LOGPROB_THRESHOLD。--temperature TEMPERATURE。

3、--compression_ratio_threshold COMPRESSION_RATIO_THRESHOLD。

二、--prepend_punctuations PREPEND_PUNCTUATIONS。

默认值：5。
22、

在非零温度下采样时的候选人数。--beam_size BEAM_SIZE。--task {transcribe,translate}。
默认值：2.4。大多数特殊字符的默认值将被抑制#xff1a;-1。

默认值：5。

如果word_timestamps设置为true，将这些标点符号与后一个单词结合起来。

默认值：无。

一、
当解码失败遇到以下任何阈值时，
可选令牌长度处罚系数（alpha）参考https://arxiv.org/abs/1609.08144，

如果word_timestamps设置为true，将这些标点符号与前一个单词结合起来。

8、
18、--temperature_increment_on_fallback TEMPERATURE_INCREMENT_ON_FALLBACK。
beam search beams在算法中的数量，只适用于temperature为0的情况。--word_timestamps WORD_TIMESTAMPS。它是在各种音频的大型数据集上训练的，也是多任务模型，可进行多语言语音识别、

选用的模型，默认值：small。
如果gzip压缩率大于此值，认为解码失败了。
13、

默认值：0。--output_format {txt,vtt,srt,tsv,json,all}, -f {txt,vtt,srt,tsv,json,all}。

默认值：无。--append_punctuations APPEND_PUNCTUATIONS。
默认值：-1.0。
19、
27、--best_of BEST_OF 。

使用Pytorch接口的设备，默认值：CPU。

音频文件的语言设置，如果设置为无则，--patience PATIENCE。,，!！?？:：”)]}、--condition_on_previous_text CONDITION_ON_PREVIOUS_TEXT。

transcribe：语音转文字。--max_line_count MAX_LINE_COUNT。

格式输出文件，默认值：all。

FP16是否使用？

默认值：true。-h, --help。
提取单词级别的时间戳，并根据它们细化结果 (实验性质) 。

默认值：无。

如果是true，前一个模型的输出将作为下一个窗口的提示，禁用可能导致窗口之间的文本不一致，但是这个模型不容易陷入故障循环。

查看whisper的参数。--length_penalty LENGTH_PENALTY。
最大的一个片段包含几行 (条件：--word_timestamps True)。

6、--highlight_words HIGHLIGHT_WORDS。

12、whisper参数。--model {tiny.en,tiny,base.en,base,small.en,small,medium.en,medium,large-v1,large-v2,large} 。--device DEVICE 。--language {af,am,ar,as,az,ba,be,bg,bn,bo,br,bs,ca,cs,cy,da,de,el,en,es,et,eu,fa,fi,fo,fr,gl,gu,ha,haw,he,hi,hr,ht,hu,hy,id,is,it,ja,jw,ka,kk,km,kn,ko,la,lb,ln,lo,lt,lv,mg,mi,mk,ml,mn,mr,ms,mt,my,ne,nl,nn,no,oc,pa,pl,ps,pt,ro,ru,sa,sd,si,sk,sl,sn,so,sq,sr,su,sv,sw,ta,te,tg,th,tk,tl,tr,tt,uk,ur,uz,vi,yi,yo,zh,Afrikaans,Albanian,Amharic,Arabic,Armenian,Assamese,Azerbaijani,Bashkir,Basque,Belarusian,Bengali,Bosnian,Breton,Bulgarian,Burmese,Castilian,Catalan,Chinese,Croatian,Czech,Danish,Dutch,English,Estonian,Faroese,Finnish,Flemish,French,Galician,Georgian,German,Greek,Gujarati,Haitian,Haitian Creole,Hausa,Hawaiian,Hebrew,Hindi,Hungarian,Icelandic,Indonesian,Italian,Japanese,Javanese,Kannada,Kazakh,Khmer,Korean,Lao,Latin,Latvian,Letzeburgesch,Lingala,Lithuanian,Luxembourgish,Macedonian,Malagasy,Malay,Malayalam,Maltese,Maori,Marathi,Moldavian,Moldovan,Mongolian,Myanmar,Nepali,Norwegian,Nynorsk,Occitan,Panjabi,Pashto,Persian,Polish,Portuguese,Punjabi,Pushto,Romanian,Russian,Sanskrit,Serbian,Shona,Sindhi,Sinhala,Sinhalese,Slovak,Slovenian,Somali,Spanish,Sundanese,Swahili,Swedish,Tagalog,Tajik,Tamil,Tatar,Telugu,Thai,Tibetan,Turkish,Turkmen,Ukrainian,Urdu,Uzbek,Valencian,Vietnamese,Welsh,Yiddish,Yoruba}。--threads THREADS。
使用逗号分隔的令牌ID列表࿱应在采样过程中抑制b;'-1'除常见标点符号外，

11、

默认值：true。
在srt和vtt中说的每个单词下加下划线(条件：--word_timestamps True)。
21、--output_dir OUTPUT_DIR, -o OUTPUT_DIR。语音翻译和语言识别。--fp16 FP16。
如果|nospeech|的概率高于此值，
28、。
26、
17、

模型文件的保存路径，默认值：~/.cache/whisper。

是否打印进度和debug信息󿼌默认值：true。--no_speech_threshold NO_SPEECH_THRESHOLD。

7、

上一篇：【排序算法】—— 快速排序

下一篇：微调llama 3 — PEFT微调和全量微调

学生姓名：
男女
联系电话：
意向班型：
我是学生我是家长

咨询热线：	400-029-7969
咨询电话：	029-61855169 029-61855069
学校邮箱：	bfzx365@163.com
学校地址：	西安市雁塔区长安西路66号