九、 其他工具
其他工具 模块集成了数据集规范化校验与标注格式灵活转换的实用工具,用于解决项目后期的数据冗余与格式兼容性问题。
1. 符号检测迁移 (Filename Sanitizer)¶
功能说明: 在工业视觉软件部署时,不规范的文件名(如包含特殊字符、空格或非法符号)往往会导致路径解析崩溃或模型读取失败。
- 检测范围:
- 自动扫描数据集中的所有图片与 JSON 文件名。
- 识别隐藏的非法符号,即使是常见的英文横杠
-、空格、或中文字符。
- 处理逻辑:
- 自动更名:一键将不规范文件名迁移到自定义的输出目录里。
开发笔记
在 Windows 下看似正常的文件名,在 Linux 或某些嵌入式视觉算子中可能会引起闪退。建议在模型训练前,统一执行一次符号检测。
2. JSON 多边形转矩形 (Polygon to BBox)¶
功能说明: 将精细的“多边形(Polygon)”标注转换为标准的“外接矩形框(Bounding Box)”标注。
- 转换逻辑:
- 系统会自动提取多边形所有顶点的最大/最小坐标值。
- 自动计算出能够完全包裹该多边形的最小水平矩形。
- 适用场景:
- 算法降级:当项目从分割算法(Segmentation)切换为检测算法(Detection)时,无需重新标注。
- 格式统一:快速统一来自不同标注团队或不同版本软件的异构数据。
转换特性
转换过程为非破坏性转换。生成的矩形框将严格遵循 YOLO 或标准 JSON 坐标规范,方便直接投入训练。