跳转至

八、 图片处理

图片处理 模块专门用于工业图像的预处理与数据集重构,支持图像与 JSON 标签的同步变换,确保数据的一致性。


1. 格式转化 (Format Conversion)

功能说明: 支持工业相机常用的 BMPPNG 格式互转。

  • 核心特性:
    • 名称同步更新:转换格式后,系统会自动修改JSON对应的图片文件名称,确保内部的 imagePath 字段与硬盘上的文件名完全一致。
    • 防错机制:有效解决因手动修改文件名导致的“图片与 JSON 无法匹配”问题。

2. 图片拆分 (Image Splitting)

功能说明: 针对超大分辨率图片(如线阵相机拍摄的图像),支持将其拆分为多个小图。

  • 操作要点:
    • 同步处理:拆分图片的同时,系统会自动重算并切割 JSON 内部的所有标记框。
    • 灵活配置:支持自定义拆分的行数列数

3. 像素裁剪 (Pixel Resizing)

功能说明: 批量缩放图片尺寸,以加速模型训练。

  • 智能对齐:为了适配 YOLO 等深度学习模型的 BackBone 输入,系统会将自定义尺寸自动对齐为 32 的倍数
  • 重计算:缩放后,JSON 内部的所有坐标点会按比例自动平移和缩放。

数据集备份建议

虽然缩小图片能显著减少训练时间,但归档备份时务必保留原始大图数据,以便后续算法优化。


4. 贴边裁剪 (Auto-Contour Crop)

功能说明: 针对固定背景的工业场景,自动识别物料轮廓并进行贴边裁剪。

  • 边距系数:用户可定义物料边缘与图片边界的预留距离(Padding),防止裁剪过于死板导致边缘信息丢失。
  • 应用场景:去除背景噪声,使模型更专注于物料本身的缺陷。

5. 数据集裁剪 (Dataset Cropping)

功能说明: 用于剔除画面中无关的干扰区域,仅保留特定的 ROI(感兴趣区域)。

sjj_cj.png

使用方法:

  1. 点击 [导入单图]

  2. 在预览窗口中用鼠标画出矩形框(框内为保留区域)。

  3. 确定保留内容后,点击 [批量裁剪]

典型场景

当某些缺陷只在产品特定位置(如中心或边缘)出现时,使用该功能可有效去除周边干扰,提升模型精度。


6. 信息清除 (Metadata Cleaner)

功能说明: 深度清理 JSON 文件中的冗余元数据。

  • 主要清理对象
    • imageData:Labelme 生成的 Base64 原始数据(该数据会导致 JSON 文件体积巨大,严重占用内存)。
    • flags:无用的标记组。
    • 其他自定义元数据。

来自开发者的建议

如果您目前仍在使用 Labelme 进行标注,建议尽快全面迁移至 ATSVisionOps,以获得更轻量、更高效的标注体验。