VLM-CapCurriculum - a UCSC-VLAA Collection

UCSC-VLAA 's Collections

VLM-CapCurriculum

GPT-Image-Edit-1.5M

Recap-DataComp-1B

VLM-CapCurriculum

updated about 6 hours ago

Staged post-training along the perception → reasoning capability axis. Models, datasets, paper. ICML 2026.

UCSC-VLAA/VLM-CapCurriculum-Qwen3-VL-8B-Staged

Image-Text-to-Text • 9B • Updated about 1 hour ago

Note Primary release: Qwen3-VL-8B + staged training
UCSC-VLAA/VLM-CapCurriculum-Qwen2.5-VL-7B-Staged

Image-Text-to-Text • 8B • Updated about 1 hour ago

Note Qwen2.5-VL-7B + staged training
UCSC-VLAA/VLM-CapCurriculum-InternVL3-8B-Staged

Image-Text-to-Text • 8B • Updated about 1 hour ago

Note InternVL3-8B + staged training
UCSC-VLAA/VLM-CapCurriculum-InternVL3.5-8B-Staged

Image-Text-to-Text • 9B • Updated about 1 hour ago

Note InternVL3.5-8B + staged training
UCSC-VLAA/VLM-CapCurriculum-Perception-Data

Viewer • Updated about 1 hour ago • 3.36k

Note Stage-1: synthesised + filtered DOCCI MCQs (with pass_rate)
UCSC-VLAA/VLM-CapCurriculum-TextReasoning-Data

Viewer • Updated about 1 hour ago • 13.2k

Note Stage-2: ORZ-Math-13k textual reasoning (with pass_rate)
UCSC-VLAA/VLM-CapCurriculum-VisualReasoning-Data

Updated about 1 hour ago

Note Stage-3: visual reasoning mix — CLEVR-Math + GeoQA170K + Math PUMA + ArxivQA (with pass_rate)