Spaces:
Sleeping
Sleeping
| title: HFA Cap | |
| emoji: 🌖 | |
| colorFrom: indigo | |
| colorTo: purple | |
| sdk: gradio | |
| sdk_version: 5.44.0 | |
| app_file: app.py | |
| pinned: false | |
| license: mit | |
| short_description: Human Feedback Assisted Captioning | |
| Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference | |
| # 半自动图像标注(Captioning)工具 | |
| 基于 **Hugging Face Spaces + Gradio** 的轻量级半自动图像标注流水线,支持图像预处理、AI 自动打草稿、人工校验精修及一键导出高质量数据集。 | |
| --- | |
| ## 目录 | |
| - [项目简介](#项目简介) | |
| - [功能特点](#功能特点) | |
| - [架构流程](#架构流程) | |
| - [文件结构](#文件结构) | |
| - [安装与运行](#安装与运行) | |
| - [使用方法](#使用方法) | |
| - [可选增强](#可选增强) | |
| - [许可证](#许可证) | |
| --- | |
| ## 项目简介 | |
| 本工具实现了一个生产可用的图像标注流水线: | |
| 1. **上传图片 / ZIP** | |
| 2. **预处理与过滤**(模糊检测 + 去重 + 可选人脸质量检测) | |
| 3. **AI 自动打草稿**(BLIP / CLIP Interrogator / WD14) | |
| 4. **人工校验与精修**(Gradio 表格界面 / Label Studio) | |
| 5. **一键导出**(CSV / JSONL / ZIP 格式) | |
| 可快速构建高质量的图像-文本训练集。 | |
| --- | |
| ## 功能特点 | |
| - **预处理** | |
| - Laplacian Variance 模糊检测(OpenCV) | |
| - 感知哈希去重(dHash) | |
| - InsightFace 人脸质量检测(可选) | |
| - **自动打草稿** | |
| - BLIP-base(CPU 友好) | |
| - BLIP-large(推荐 GPU Space) | |
| - 可选 CLIP Interrogator / WD14 Tagger | |
| - **人工校验与精修** | |
| - 内置 Gradio 表格可直接修改 caption | |
| - 可导出 JSONL 格式用于 Label Studio | |
| - **一键导出** | |
| - CSV、JSONL、ZIP(包含筛选后图像) | |
| - 结果可直接作为模型训练数据集 | |
| --- | |
| ## 架构流程 | |