跳转至

十三、 模型训练与自动标注

本模块集成了深度学习模型的端到端处理能力,支持从数据一键训练到利用现有模型进行智能化自动标注。


1. 核心特性

  • 多架构适配:全面支持标准 水平目标检测OBB 旋转框检测
  • 全系列支持:训练算法深度适配 YOLO26 系列(n, s, m, l, x)。
  • 零配置导入:直接解析原始数据集目录,无需额外打包。

2. 模型训练操作步骤

第一步:路径配置

  1. 数据集目录:点击 [...] 按钮,指向包含图片与对应 JSON 标签的文件夹。
  2. 模型仓库目录:选择训练结果(权重、日志、图表)的存放路径。

第二步:参数调整

  • 基础参数 面板设置轮数与批次。
  • [重要提示]图像尺寸 (W x H) 默认推荐使用 640 * 640。若需调整,数值必须是 32 的倍数。
  • 高级参数 面板根据硬件情况微调。

第三步:启动与监控

  • 点击 [开始训练],通过内置控制台查看实时日志与进度条。

terminal.png

Box Loss

loss.png

Loss值越低越好,一般情况下会降低到0.5左右。



3. 基础训练参数 (Basic)

参数名称 对应代码 功能说明
训练轮数 Epochs 决定模型学习数据的完整次数。数值越大训练越久。
批次大小 Batch 每次喂给模型的图片数。显存小请调低。-1 为自动。
工作线程 Workers 数据加载进程数。Windows 建议设为 0 ~ 4 以防报错。
图像尺寸 W x H 默认 640 * 640。输入图片缩放大小,必须是 32 的倍数。
标注阈值 Conf 自动标注的置信度门槛,低于此值的框将被过滤。

640.png


4. 高级进阶参数 (Advanced)

配置建议

若您对以下深度学习参数不熟悉,请保持默认设置即可。系统已针对工业场景内置了最优缺省值。

参数名称 对应代码 功能说明
设备选择 Device Auto 自动检测,0 为第一张 GPU,cpu 为强制使用 CPU。
断点续训 Resume 勾选后自动寻找上次中断的 last.pt 继续训练。
高速缓存 Cache 将数据缓存到内存或硬盘以加速训练。内存小时建议关闭。
马赛克增强 Mosaic 开启多图拼接增强概率 (0.0 ~ 1.0)。提升小目标感知。
关闭Mosaic轮数 Close Mosaic 在最后 N 轮关闭 Mosaic 增强,防止模型后期震荡。
初始学习率 lr0 初始学习率,一般默认 0.01,控制参数更新步长。
混合精度 AMP 推荐开启。节省显存并提速,且基本不影响精度。
验证频率 Period 每隔多少轮保存一次权重或验证一次。-1 为自动。
早停耐心 Patience 验证指标连续 N 轮无改善则停止训练。0 表示禁用。
优化器 Optimizer auto 会自动选择;也可手动指定 SGD、AdamW 等。
Dropout Dropout 正则化比率 (0.0 ~ 1.0),用于防止模型过拟合。
权重衰减 Weight Decay L2 正则化项系数,防止模型权重过大导致泛化差。
Mixup 增强 Mixup 混合两张图片及标签的概率 (0.0 ~ 1.0)。增加样本多样性。
Copy-Paste Copy-Paste 将目标随机复制粘贴到其他图像,提升模型召回率。
冻结层数 Freeze 冻结模型前 N 层权重不更新。适合预训练模型微调。
可视化工具 TB 开启后使用 TensorBoard 记录详细日志(Loss、指标)。

TensorBoard

tensor.png

勾选relaod data后,TensorBoard即可自动刷新数据,默认为30秒一次。


5. 自动标注流程 (Auto Labeling)

  1. 加载模型:选择已生成的最佳权重文件(best.pt)。
  2. 设定阈值:调节 Conf,建议根据场景设定在 0.3 ~ 0.5 之间。
  3. 执行标注:系统自动扫描图片目录并生成对应的 JSON 标签。
  4. 校核确认:配合“图像标注”模块进行快速人工审核。

6. 最终结果

最终结果

result.png

模型训练完毕之后,会有以上最终评估图可供参考。


环境注意事项

  1. 训练期间请勿关闭软件控制台,否则进程会强制中断。
  2. 若使用 OBB 旋转框 模式,请确保数据集 JSON 格式定义正确(Length1/Length2 为半宽半高)。