--- title: HFA Cap emoji: 🌖 colorFrom: indigo colorTo: purple sdk: gradio sdk_version: 5.44.0 app_file: app.py pinned: false license: mit short_description: Human Feedback Assisted Captioning --- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference # 半自动图像标注(Captioning)工具 基于 **Hugging Face Spaces + Gradio** 的轻量级半自动图像标注流水线,支持图像预处理、AI 自动打草稿、人工校验精修及一键导出高质量数据集。 --- ## 目录 - [项目简介](#项目简介) - [功能特点](#功能特点) - [架构流程](#架构流程) - [文件结构](#文件结构) - [安装与运行](#安装与运行) - [使用方法](#使用方法) - [可选增强](#可选增强) - [许可证](#许可证) --- ## 项目简介 本工具实现了一个生产可用的图像标注流水线: 1. **上传图片 / ZIP** 2. **预处理与过滤**(模糊检测 + 去重 + 可选人脸质量检测) 3. **AI 自动打草稿**(BLIP / CLIP Interrogator / WD14) 4. **人工校验与精修**(Gradio 表格界面 / Label Studio) 5. **一键导出**(CSV / JSONL / ZIP 格式) 可快速构建高质量的图像-文本训练集。 --- ## 功能特点 - **预处理** - Laplacian Variance 模糊检测(OpenCV) - 感知哈希去重(dHash) - InsightFace 人脸质量检测(可选) - **自动打草稿** - BLIP-base(CPU 友好) - BLIP-large(推荐 GPU Space) - 可选 CLIP Interrogator / WD14 Tagger - **人工校验与精修** - 内置 Gradio 表格可直接修改 caption - 可导出 JSONL 格式用于 Label Studio - **一键导出** - CSV、JSONL、ZIP(包含筛选后图像) - 结果可直接作为模型训练数据集 --- ## 架构流程