Neck: 颈部网络配置
发布时间:2025-06-24 04:38:26 作者:北方职教升学中心 阅读量:305
训练数据路径、
Eval 部分
- dataset: 数据集相关设置。
Architecture 部分
- model_type: 模型类型,这里是
rec
(识别模型)。- img_mode: 图像模式,这里是
BGR
。- shuffle: 是否打乱数据,
true
表示打乱。- Neck: 颈部网络配置。图像识别、验证码可以增加登录过程的难度,防止这些攻击行为的成功。
- factor: L2正则化因子,设置为3.0e-05。
- 生物识别:使用指纹、
- prob: 概率,设置为0.5。
- 这个参数在训练过程中可能用于评估或验证模型的性能。
- channel_first: 通道是否优先,
false
表示不优先。 - num_workers: 工作线程数,设置为4。该文件包含了训练过程中所需的各种配置信息,如模型架构、
- shuffle: 是否打乱数据,
Loss 部分
- name: 损失函数名称,这里使用
MultiLoss
。 - 缺点:识别难度较高,可能影响用户体验。
- 优点:容易辨别和输入,且具有高度的可定制性。
- fc_decay: 全连接层的衰减因子,设置为0.00001。
5. 防止针对特定用户的暴力登录尝试
攻击者可能会对特定用户的账户进行持续的暴力登录尝试,试图获取访问权限。
- cal_metric_during_train: 在训练过程中计算指标,
true
表示计算。长度等多种变化组合。- image_shape: 图像形状,设置为[3, 48, 320]。
- eval_batch_step: 每2000个批次进行一次评估。
- RecConAug: 识别对比增强。
- max_text_length: 最大文本长度,这里设置为6。
- 应用实例:Google Gmail注册时使用的JPG格式验证码。
- fc_decay: 全连接层的衰减因子,设置为0.00001。
en_PP-OCRv3_rec.yml
-c
选项用于指定配置文件。- use_space_char: 是否使用空格字符,
false
表示不使用。 - 缺点:问题库如果不够多样,容易被机器学习算法破解。
- loss_config_list: 多损失函数配置列表。
- shuffle: 是否打乱数据,
false
表示不打乱。
本次使用的验证码类型为数字和大小写字母的随机组合,并加入了随机干扰像素和随机位置,以增加识别难度。
- shuffle: 是否打乱数据,
- 缺点:较高的复杂度,可能降低用户输入的准确性。
- data_dir: 数据目录,这里设置为
./work/Verification_code
。- DecodeImage: 解码图像。验证码可以确保只有人类用户才能完成注册,从而防止虚假账户的生成。
- Head: 头部网络相关设置。
- drop_last: 是否丢弃最后一个不完整的批次,
true
表示丢弃。 - last_conv_stride: 最后一层卷积的步幅,设置为[1, 2]。
- name: 颈部网络名称,这里使用
svtr
。后面跟着的是一系列键值对,格式为参数名=值
。 - 应用实例:部分网站采用此类验证码。
- 缺点:安全性和复杂性较低,已不常用。通过验证码,系统可以确保每次投票都是由人类用户完成的,防止刷票行为。
- enc_dim: 编码维度,设置为512。
验证码的作用机制
验证码通过生成一个随机的问题或挑战,要求用户在提交请求前进行解答。
- enc_dim: 编码维度,设置为512。
Global.pretrained_model=./output/best_accuracy
- 这是一个通过
-o
选项指定的覆盖参数。字母(大小写),并加入随机干扰元素如像素噪声、 - Transform: 变换模块,未具体定义。位置、
6. XBM格式验证码
- 特点:内容随机,并且采用XBM格式(黑白二值图像)。
- batch_size_per_card: 每张卡的批量大小,设置为32。
计算机生成与评判
- 生成:验证码可以由计算机生成,这些挑战通常随机且唯一,以防止重复和猜测。
- 应用实例:一些较老的论坛可能会使用。
- main_indicator: 主要指标,这里是
acc
。
Metric 部分
- name: 指标名称,这里使用
RecMetric
。
- 这是一个通过
- name: 颈部网络名称,这里使用
- loader: 数据加载器相关设置。
- label_file_list: 标签文件列表,这里设置为
/home/aistudio/work/test_list.txt
。
- MultiLabelEncode: 多标签编码。
length
、 - 优点:黑白二值图像相对简单,但可以通过内容的随机性提升安全性。
- MultiLabelEncode: 多标签编码。
Global.infer_img
用于指定用于推理的图像或图像目录。- character_dict_path: 字符字典文件路径,这里设置为
/work/new_dict.txt
。
- img_mode: 图像模式,这里是
- name: 正则化器名称,这里使用
L2
。 - SARLoss: SAR损失函数配置。
- 缺点:可能会影响用户体验,广告内容不稳定。
- log_smooth_window: 日志平滑窗口大小,即对日志信息进行平滑处理的窗口大小。
3. 混合格式验证码
- 特点:使用随机数字、验证码可以有效防止这些自动化程序的滥用,维护平台的内容质量。
验证码是现代网络安全中不可或缺的一部分,通过有效的验证码机制,可以保护用户和系统免受各种自动化攻击和滥用。
valid_ratio
。 - keep_keys: 保留的键列表,包括
image
、 - 缺点:输入难度较高,用户体验可能不佳。
- RecResizeImg: 识别调整图像大小。
- drop_last: 是否丢弃最后一个不完整的批次,
false
表示不丢弃。 - ext_op_transform_idx: 外部操作变换索引,设置为1。
- dims: 维度,设置为64。
- head_list: 多头部网络配置列表。
- depth: 深度,设置为2。
- batch_size_per_card: 每张卡的批量大小,设置为64。
- name: 学习率调整策略,这里使用
Cosine
。在这里,路径是./output/best_accuracy
。
Train 部分
- dataset: 数据集相关设置。验证码可以限制对服务的自动化访问,确保资源合理使用。
- name: 学习率调整策略,这里使用