跳转至

三、 数据优化

本章节介绍如何使用 ATSVisionOps 内置的 Test 工具进行数据集优化。该功能支持在不破坏原始数据的基础上,实现自动化的重命名、缺陷类名统一及映射修改。

test1.png

1. 默认测试逻辑(直接优化)

如果你不需要对当前的图片名称或缺陷名称进行任何修改,只需优化数据集,可以使用默认操作。

  • 操作步骤
    1. 确认输入路径无误。
    2. 直接点击 [开始优化数据集] 按钮(默认不勾选任何更改选项)。
  • 执行结果
    • 显示“已完成”后,系统会在对应的 结果文件夹 中生成图片与 JSON 文件。
    • 数据一致性:图片与 JSON 文件一一对应,可直接用于后续的 COCO 格式转换或模型训练。

2. 批量重命名文件

为了方便数据管理,你可以对数据集进行全局重命名,系统会自动同步更新 JSON 内部的引用字段。

  • 操作步骤
    1. 勾选 「批量重命名文件」 选项。
    2. 在输入框中输入目标前缀(例如:111)。
    3. 点击 [开始优化数据集]
  • 功能特性

    • 同步修改:不仅修改物理磁盘上的文件名(如 111_000001.jpg),同时会自动修正 JSON 文件内部的 imagePath 字段,确保数据关联不丢失。

    • test3.png

    • test2.png

3. 缺陷名称管理

针对标签名不规范或需要合并类别的情况,系统提供以下两种模式:

A. 统一修改缺陷名(全局覆盖)

适用于将当前数据集中所有不同类别的缺陷合并为一个新名称。

  • 示例:原标签为 qx(缺陷),希望统一改为 bd(白点)。

  • 效果:处理后,结果文件夹内所有 JSON 里的 label 字段将全部变为 bd

B. 映射指定缺陷(精准替换)

适用于只修改特定的缺陷类别,而保持其他类别不变。

  • 示例:数据集中包含 qxzzbd 三种标签,仅需将 zz(杂质)修改为 bszz(白色杂质)。

  • 操作:勾选 「映射指定缺陷」,在旧名称栏输入 zz,新名称栏输入 bszz

  • 效果:仅有 zz 会被替换,其余标签不受影响。


数据安全:所有优化操作均在“结果文件夹”中进行,不会修改您的原始输入数据。

test4.png