跳转至

九、 其他工具

其他工具 模块集成了数据集规范化校验与标注格式灵活转换的实用工具,用于解决项目后期的数据冗余与格式兼容性问题。


1. 符号检测迁移 (Filename Sanitizer)

功能说明: 在工业视觉软件部署时,不规范的文件名(如包含特殊字符、空格或非法符号)往往会导致路径解析崩溃或模型读取失败。

  • 检测范围
    • 自动扫描数据集中的所有图片与 JSON 文件名。
    • 识别隐藏的非法符号,即使是常见的英文横杠 -、空格、或中文字符。
  • 处理逻辑
    • 自动更名:一键将不规范文件名迁移到自定义的输出目录里。

开发笔记

在 Windows 下看似正常的文件名,在 Linux 或某些嵌入式视觉算子中可能会引起闪退。建议在模型训练前,统一执行一次符号检测。


2. JSON 多边形转矩形 (Polygon to BBox)

功能说明: 将精细的“多边形(Polygon)”标注转换为标准的“外接矩形框(Bounding Box)”标注。

  • 转换逻辑
    • 系统会自动提取多边形所有顶点的最大/最小坐标值。
    • 自动计算出能够完全包裹该多边形的最小水平矩形。
  • 适用场景
    • 算法降级:当项目从分割算法(Segmentation)切换为检测算法(Detection)时,无需重新标注。
    • 格式统一:快速统一来自不同标注团队或不同版本软件的异构数据。

转换特性

转换过程为非破坏性转换。生成的矩形框将严格遵循 YOLO 或标准 JSON 坐标规范,方便直接投入训练。