File size: 1,823 Bytes
9802e0b
 
 
 
 
 
 
 
 
 
 
 
 
 
9f5e473
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
---
title: HFA Cap
emoji: 🌖
colorFrom: indigo
colorTo: purple
sdk: gradio
sdk_version: 5.44.0
app_file: app.py
pinned: false
license: mit
short_description: Human Feedback Assisted Captioning
---

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
# 半自动图像标注(Captioning)工具

基于 **Hugging Face Spaces + Gradio** 的轻量级半自动图像标注流水线,支持图像预处理、AI 自动打草稿、人工校验精修及一键导出高质量数据集。

---

## 目录
- [项目简介](#项目简介)
- [功能特点](#功能特点)
- [架构流程](#架构流程)
- [文件结构](#文件结构)
- [安装与运行](#安装与运行)
- [使用方法](#使用方法)
- [可选增强](#可选增强)
- [许可证](#许可证)

---

## 项目简介

本工具实现了一个生产可用的图像标注流水线:

1. **上传图片 / ZIP**
2. **预处理与过滤**(模糊检测 + 去重 + 可选人脸质量检测)
3. **AI 自动打草稿**(BLIP / CLIP Interrogator / WD14)
4. **人工校验与精修**(Gradio 表格界面 / Label Studio)
5. **一键导出**(CSV / JSONL / ZIP 格式)

可快速构建高质量的图像-文本训练集。

---

## 功能特点

- **预处理**  
  - Laplacian Variance 模糊检测(OpenCV)  
  - 感知哈希去重(dHash)  
  - InsightFace 人脸质量检测(可选)  

- **自动打草稿**  
  - BLIP-base(CPU 友好)  
  - BLIP-large(推荐 GPU Space)  
  - 可选 CLIP Interrogator / WD14 Tagger  

- **人工校验与精修**  
  - 内置 Gradio 表格可直接修改 caption  
  - 可导出 JSONL 格式用于 Label Studio  

- **一键导出**  
  - CSV、JSONL、ZIP(包含筛选后图像)  
  - 结果可直接作为模型训练数据集  

---

## 架构流程