jyyyyy's picture

jyyyyy

jyyyyy67

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 17 hours ago

CodeTracer: Towards Traceable Agent States

updated a dataset 7 days ago

NJU-LINK/OmniVideoBench

upvoted a paper 8 days ago

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

View all activity

Organizations

upvoted a paper about 17 hours ago

CodeTracer: Towards Traceable Agent States

Paper • 2604.11641 • Published 2 days ago • 29

updated a dataset 7 days ago

NJU-LINK/OmniVideoBench

Viewer • Updated 7 days ago • 1k • 2.28k • 4

upvoted a paper 8 days ago

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 9 days ago • 200

upvoted a paper 28 days ago

InCoder-32B: Code Foundation Model for Industrial Scenarios

Paper • 2603.16790 • Published 28 days ago • 308

New activity in NJU-LINK/OmniVideoBench 2 months ago

Update data

#8 opened 2 months ago by

add videos

#7 opened 2 months ago by

liked a dataset 2 months ago

NJU-LINK/OmniVideoBench

Viewer • Updated 7 days ago • 1k • 2.28k • 4

New activity in NJU-LINK/OmniVideoBench 2 months ago

Update Videos

#5 opened 2 months ago by

add videos

#4 opened 2 months ago by

upvoted 3 papers 2 months ago

Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration

Paper • 2602.04575 • Published Feb 4 • 17

OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models

Paper • 2602.04804 • Published Feb 4 • 50

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

Paper • 2602.03796 • Published Feb 3 • 64

upvoted a paper 3 months ago

CoF-T2I: Video Models as Pure Visual Reasoners for Text-to-Image Generation

Paper • 2601.10061 • Published Jan 15 • 32

upvoted 4 papers 4 months ago

GRAN-TED: Generating Robust, Aligned, and Nuanced Text Embedding for Diffusion Models

Paper • 2512.15560 • Published Dec 17, 2025 • 25

T2AV-Compass: Towards Unified Evaluation for Text-to-Audio-Video Generation

Paper • 2512.21094 • Published Dec 24, 2025 • 25

Kling-Omni Technical Report

Paper • 2512.16776 • Published Dec 18, 2025 • 173

KlingAvatar 2.0 Technical Report

Paper • 2512.13313 • Published Dec 15, 2025 • 44

upvoted 3 papers 6 months ago

Scaling Latent Reasoning via Looped Language Models

Paper • 2510.25741 • Published Oct 29, 2025 • 229

IF-VidCap: Can Video Caption Models Follow Instructions?

Paper • 2510.18726 • Published Oct 21, 2025 • 26

MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues

Paper • 2510.17722 • Published Oct 20, 2025 • 20