4 120 6

Donghao Zhou

donghao-zhou

https://correr-zhou.github.io

AI & ML interests

Generative AI

Recent Activity

upvoted a paper 2 days ago

OneHOI: Unifying Human-Object Interaction Generation and Editing

upvoted a paper 3 days ago

Seedance 2.0: Advancing Video Generation for World Complexity

authored a paper 4 days ago

NTIRE 2025 XGC Quality Assessment Challenge: Methods and Results

View all activity

Organizations

upvoted a paper 2 days ago

OneHOI: Unifying Human-Object Interaction Generation and Editing

Paper • 2604.14062 • Published 4 days ago • 6

upvoted a paper 3 days ago

Seedance 2.0: Advancing Video Generation for World Complexity

Paper • 2604.14148 • Published 4 days ago • 138

upvoted a paper 5 days ago

OmniShow: Unifying Multimodal Conditions for Human-Object Interaction Video Generation

Paper • 2604.11804 • Published 6 days ago • 69

upvoted a paper 7 days ago

LPM 1.0: Video-based Character Performance Model

Paper • 2604.07823 • Published 10 days ago • 71

upvoted 2 papers 12 days ago

AURA: Always-On Understanding and Real-Time Assistance via Video Streams

Paper • 2604.04184 • Published 14 days ago • 50

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 13 days ago • 200

upvoted 2 papers 18 days ago

Project Imaging-X: A Survey of 1000+ Open-Access Medical Imaging Datasets for Foundation Model Development

Paper • 2603.27460 • Published 21 days ago • 68

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

Paper • 2603.27538 • Published 21 days ago • 143

upvoted a paper 25 days ago

SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning

Paper • 2603.23483 • Published 26 days ago • 62

upvoted a paper 27 days ago

VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining

Paper • 2603.15030 • Published Mar 16 • 21

upvoted 2 papers about 1 month ago

MosaicMem: Hybrid Spatial Memory for Controllable Video World Models

Paper • 2603.17117 • Published Mar 17 • 87

WildActor: Unconstrained Identity-Preserving Video Generation

Paper • 2603.00586 • Published Feb 28 • 38

upvoted 7 papers about 2 months ago

Helios: Real Real-Time Long Video Generation Model

Paper • 2603.04379 • Published Mar 4 • 186

Beyond Language Modeling: An Exploration of Multimodal Pretraining

Paper • 2603.03276 • Published Mar 3 • 103

HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images

Paper • 2603.02210 • Published Mar 2 • 29

Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

Paper • 2602.18422 • Published Feb 20 • 30

upvoted a paper 2 months ago

Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models

Paper • 2602.07026 • Published Feb 2 • 140

Donghao Zhou

AI & ML interests

Recent Activity

Organizations

donghao-zhou's activity