imgdiff_difference_area_generator_mapper#

Generates and filters bounding boxes for image pairs based on similarity, segmentation, and text matching.

This operator processes image pairs to identify and filter regions with significant differences. It uses a sequence of operations:

  • Filters out image pairs with large differences.

  • Segments the images to identify potential objects.

  • Crops sub-images based on bounding boxes.

  • Determines if the sub-images contain valid objects using image-text matching.

  • Filters out sub-images that are too similar.

  • Removes overlapping bounding boxes.

  • Uses Hugging Face models for similarity and text matching, and FastSAM for segmentation.

  • Caches intermediate results in DATA_JUICER_ASSETS_CACHE.

  • Returns the filtered bounding boxes in the MetaKeys.bbox_tag field.

基于相似性、分割和文本匹配生成并过滤图像对的边界框。

此算子处理图像对以识别和过滤具有显著差异的区域。它使用一系列操作:

  • 过滤掉差异较大的图像对。

  • 分割图像以识别潜在对象。

  • 基于边界框裁剪子图像。

  • 使用图像-文本匹配确定子图像是否包含有效对象。

  • 过滤掉过于相似的子图像。

  • 移除重叠的边界框。

  • 使用 Hugging Face 模型进行相似性和文本匹配,使用 FastSAM 进行分割。

  • DATA_JUICER_ASSETS_CACHE 中缓存中间结果。

  • 返回 MetaKeys.bbox_tag 字段中的过滤后的边界框。

Type 算子类型: mapper

Tags 标签: cpu

🔧 Parameter Configuration 参数配置#

name 参数名

type 类型

default 默认值

desc 说明

image_pair_similarity_filter_args

typing.Optional[typing.Dict]

{}

Arguments for image pair similarity filter.

image_segment_mapper_args

typing.Optional[typing.Dict]

{}

Arguments for image segmentation mapper.

image_text_matching_filter_args

typing.Optional[typing.Dict]

{}

Arguments for image-text matching filter.

args

''

kwargs

''

📊 Effect demonstration 效果演示#

not available 暂无