4 7 2

Keda TAO

KD-TAO

KD-TAO

AI & ML interests

None yet

Recent Activity

updated a dataset 12 days ago

KD-TAO/LVOmniBench

upvoted an article 12 days ago

Welcome Gemma 4: Frontier multimodal intelligence on device

liked a dataset 19 days ago

KD-TAO/LVOmniBench

View all activity

Organizations

None yet

updated a dataset 12 days ago

KD-TAO/LVOmniBench

Updated 12 days ago • 1.63k • 8

upvoted an article 12 days ago

Article

Welcome Gemma 4: Frontier multimodal intelligence on device

13 days ago

•

844

liked a dataset 19 days ago

KD-TAO/LVOmniBench

Updated 12 days ago • 1.63k • 8

upvoted a paper 26 days ago

LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs

Paper • 2603.19217 • Published 26 days ago • 28

submitted a paper to Daily Papers 26 days ago

LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs

Paper • 2603.19217 • Published 26 days ago • 28

published a dataset 27 days ago

KD-TAO/LVOmniBench

Updated 12 days ago • 1.63k • 8

liked a dataset 2 months ago

PleIAs/YouTube-Commons

Updated Jun 26, 2024 • 2.61k • 379

upvoted a paper 4 months ago

OmniAgent: Audio-Guided Active Perception Agent for Omnimodal Audio-Video Understanding

Paper • 2512.23646 • Published Dec 29, 2025 • 15

submitted a paper to Daily Papers 4 months ago

OmniAgent: Audio-Guided Active Perception Agent for Omnimodal Audio-Video Understanding

Paper • 2512.23646 • Published Dec 29, 2025 • 15

upvoted a paper 5 months ago

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

Paper • 2511.14582 • Published Nov 18, 2025 • 19

commented a paper 5 months ago

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

Paper • 2511.14582 • Published Nov 18, 2025 • 19 •

authored 3 papers 9 months ago

Is Oracle Pruning the True Oracle?

Paper • 2412.00143 • Published Nov 28, 2024 • 3

HoliTom: Holistic Token Merging for Fast Video Large Language Models

Paper • 2505.21334 • Published May 27, 2025 • 21

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

Paper • 2507.20198 • Published Jul 27, 2025 • 28

upvoted a paper 9 months ago

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

Paper • 2507.20198 • Published Jul 27, 2025 • 28

commented a paper 9 months ago

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

Paper • 2507.20198 • Published Jul 27, 2025 • 28 •

authored 2 papers about 1 year ago

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

Paper • 2411.15024 • Published Nov 22, 2024 • 2

Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models

Paper • 2503.16257 • Published Mar 20, 2025 • 28

upvoted 2 papers about 1 year ago

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

Paper • 2411.15024 • Published Nov 22, 2024 • 2

Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models

Paper • 2503.16257 • Published Mar 20, 2025 • 28

Keda TAO

AI & ML interests

Recent Activity

Organizations

KD-TAO's activity

Welcome Gemma 4: Frontier multimodal intelligence on device