Commit History

Add ROCM_ACCELERATION.md — deep dive into ROCm model acceleration libraries and how they relate to StreamingVLM

f6c261b
verified

s23deepak commited on about 13 hours ago

Add EXPLAINED.md — deep dive into StreamingVLM architecture and patching methodology

0ae32a3
verified

s23deepak commited on about 14 hours ago

Update ML Intern artifact metadata

dc9a7e5
verified

s23deepak commited on about 14 hours ago

Update README: add Qwen3-VL-2B support, CUDA flash_attention_2, dual platform guide

f1156c0
verified

s23deepak commited on about 14 hours ago

Add Qwen3-VL-2B support + CUDA flash_attention_2 config

189031e
verified

s23deepak commited on about 14 hours ago

Add MIGRATION_GUIDE.md

48b62e4
verified

s23deepak commited on about 14 hours ago

Add DeepSpeed ZeRO-3 config

374b17e
verified

s23deepak commited on about 14 hours ago

Add stage 2 script and zero3 config

14e1bb9
verified

s23deepak commited on about 14 hours ago

Add training scripts and DeepSpeed config

c7e3bed
verified

s23deepak commited on about 14 hours ago

Add inference.py — main streaming loop

b819280
verified

s23deepak commited on about 14 hours ago

Add get_qwen_range.py token utilities

94b4975
verified

s23deepak commited on about 14 hours ago

Add pos_emb.py — contiguous RoPE for infinite streams

4306b5f
verified

s23deepak commited on about 14 hours ago

Add model_forward.py — top-level streaming forward

af7a516
verified

s23deepak commited on about 14 hours ago

Add vision_forward.py — chunked SDPA for vision encoder

c555dfc
verified

s23deepak commited on about 14 hours ago

Add language_forward.py — SDPA attention for text decoder

d788786
verified

s23deepak commited on about 14 hours ago

Add qwen3 patch_model.py

6216b1d
verified

s23deepak commited on about 14 hours ago

Add streaming_cache.py

009a7a2
verified

s23deepak commited on about 14 hours ago

Add streaming_args.py

e84a655
verified

s23deepak commited on about 14 hours ago

Add utils init

f61ae6d
verified

s23deepak commited on about 14 hours ago

Add generate init

6e87f2a
verified

s23deepak commited on about 14 hours ago

Add qwen3 and generate init files

76bdeca
verified

s23deepak commited on about 14 hours ago

Add inference subpackage init files

fa36fa1
verified

s23deepak commited on about 14 hours ago

Add streaming_vlm package init files

78c8c7a
verified

s23deepak commited on about 14 hours ago

Add test_imports.py

5c73eaa
verified

s23deepak commited on about 14 hours ago

Add train.py and test_imports.py

86d7955
verified

s23deepak commited on about 14 hours ago

Add setup.py

6aae577
verified

s23deepak commited on about 14 hours ago

Add requirements, setup, and training files

b7cd7a3
verified

s23deepak commited on about 14 hours ago

Update ML Intern artifact metadata

6806947
verified

s23deepak commited on about 14 hours ago

Initial commit: StreamingVLM port for Qwen3-VL 4B on ROCm

2f4b97d
verified

s23deepak commited on about 14 hours ago

Update ML Intern artifact metadata

af6621b
verified

s23deepak commited on about 14 hours ago

initial commit

91bb527
verified

s23deepak commited on about 14 hours ago

Commit History

Add ROCM_ACCELERATION.md — deep dive into ROCm model acceleration libraries and how they relate to StreamingVLM f6c261b verified

Add EXPLAINED.md — deep dive into StreamingVLM architecture and patching methodology 0ae32a3 verified

Update ML Intern artifact metadata dc9a7e5 verified

Update README: add Qwen3-VL-2B support, CUDA flash_attention_2, dual platform guide f1156c0 verified

Add Qwen3-VL-2B support + CUDA flash_attention_2 config 189031e verified

Add MIGRATION_GUIDE.md 48b62e4 verified

Add DeepSpeed ZeRO-3 config 374b17e verified

Add stage 2 script and zero3 config 14e1bb9 verified

Add training scripts and DeepSpeed config c7e3bed verified

Add inference.py — main streaming loop b819280 verified

Add get_qwen_range.py token utilities 94b4975 verified

Add pos_emb.py — contiguous RoPE for infinite streams 4306b5f verified

Add model_forward.py — top-level streaming forward af7a516 verified

Add vision_forward.py — chunked SDPA for vision encoder c555dfc verified

Add language_forward.py — SDPA attention for text decoder d788786 verified

Add qwen3 patch_model.py 6216b1d verified

Add streaming_cache.py 009a7a2 verified

Add streaming_args.py e84a655 verified

Add utils init f61ae6d verified

Add generate init 6e87f2a verified

Add qwen3 and generate init files 76bdeca verified

Add inference subpackage init files fa36fa1 verified

Add streaming_vlm package init files 78c8c7a verified

Add test_imports.py 5c73eaa verified

Add train.py and test_imports.py 86d7955 verified

Add setup.py 6aae577 verified

Add requirements, setup, and training files b7cd7a3 verified

Update ML Intern artifact metadata 6806947 verified

Initial commit: StreamingVLM port for Qwen3-VL 4B on ROCm 2f4b97d verified

Update ML Intern artifact metadata af6621b verified

initial commit 91bb527 verified

Add ROCM_ACCELERATION.md — deep dive into ROCm model acceleration libraries and how they relate to StreamingVLM

f6c261b
verified

Add EXPLAINED.md — deep dive into StreamingVLM architecture and patching methodology

0ae32a3
verified

Update ML Intern artifact metadata

dc9a7e5
verified

Update README: add Qwen3-VL-2B support, CUDA flash_attention_2, dual platform guide

f1156c0
verified

Add Qwen3-VL-2B support + CUDA flash_attention_2 config

189031e
verified

Add MIGRATION_GUIDE.md

48b62e4
verified

Add DeepSpeed ZeRO-3 config

374b17e
verified

Add stage 2 script and zero3 config

14e1bb9
verified

Add training scripts and DeepSpeed config

c7e3bed
verified

Add inference.py — main streaming loop

b819280
verified

Add get_qwen_range.py token utilities

94b4975
verified

Add pos_emb.py — contiguous RoPE for infinite streams

4306b5f
verified

Add model_forward.py — top-level streaming forward

af7a516
verified

Add vision_forward.py — chunked SDPA for vision encoder

c555dfc
verified

Add language_forward.py — SDPA attention for text decoder

d788786
verified

Add qwen3 patch_model.py

6216b1d
verified

Add streaming_cache.py

009a7a2
verified

Add streaming_args.py

e84a655
verified

Add utils init

f61ae6d
verified

Add generate init

6e87f2a
verified

Add qwen3 and generate init files

76bdeca
verified

Add inference subpackage init files

fa36fa1
verified

Add streaming_vlm package init files

78c8c7a
verified

Add test_imports.py

5c73eaa
verified

Add train.py and test_imports.py

86d7955
verified

Add setup.py

6aae577
verified

Add requirements, setup, and training files

b7cd7a3
verified

Update ML Intern artifact metadata

6806947
verified

Initial commit: StreamingVLM port for Qwen3-VL 4B on ROCm

2f4b97d
verified

Update ML Intern artifact metadata

af6621b
verified

initial commit

91bb527
verified