HFA-Cap / README.md
Humphreykowl's picture
Update README.md
9f5e473 verified

A newer version of the Gradio SDK is available: 6.14.0

Upgrade
metadata
title: HFA Cap
emoji: 🌖
colorFrom: indigo
colorTo: purple
sdk: gradio
sdk_version: 5.44.0
app_file: app.py
pinned: false
license: mit
short_description: Human Feedback Assisted Captioning

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

半自动图像标注(Captioning)工具

基于 Hugging Face Spaces + Gradio 的轻量级半自动图像标注流水线,支持图像预处理、AI 自动打草稿、人工校验精修及一键导出高质量数据集。


目录


项目简介

本工具实现了一个生产可用的图像标注流水线:

  1. 上传图片 / ZIP
  2. 预处理与过滤(模糊检测 + 去重 + 可选人脸质量检测)
  3. AI 自动打草稿(BLIP / CLIP Interrogator / WD14)
  4. 人工校验与精修(Gradio 表格界面 / Label Studio)
  5. 一键导出(CSV / JSONL / ZIP 格式)

可快速构建高质量的图像-文本训练集。


功能特点

  • 预处理

    • Laplacian Variance 模糊检测(OpenCV)
    • 感知哈希去重(dHash)
    • InsightFace 人脸质量检测(可选)
  • 自动打草稿

    • BLIP-base(CPU 友好)
    • BLIP-large(推荐 GPU Space)
    • 可选 CLIP Interrogator / WD14 Tagger
  • 人工校验与精修

    • 内置 Gradio 表格可直接修改 caption
    • 可导出 JSONL 格式用于 Label Studio
  • 一键导出

    • CSV、JSONL、ZIP(包含筛选后图像)
    • 结果可直接作为模型训练数据集

架构流程