5 60 2

Zhen Fang

CostaliyA

https://costaliya.github.io/

CostaliyA

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Seedance 2.0: Advancing Video Generation for World Complexity

upvoted a paper 1 day ago

SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric Environments

authored a paper 9 days ago

Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models

View all activity

Organizations

None yet

upvoted 2 papers 1 day ago

Seedance 2.0: Advancing Video Generation for World Complexity

Paper • 2604.14148 • Published 2 days ago • 128

SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric Environments

Paper • 2604.14144 • Published 2 days ago • 60

upvoted a paper 9 days ago

Beyond Accuracy: Unveiling Inefficiency Patterns in Tool-Integrated Reasoning

Paper • 2604.05404 • Published 10 days ago • 41

upvoted 2 papers 17 days ago

Why Does Self-Distillation (Sometimes) Degrade the Reasoning Capability of LLMs?

Paper • 2603.24472 • Published 23 days ago • 53

Gen-Searcher: Reinforcing Agentic Search for Image Generation

Paper • 2603.28767 • Published 18 days ago • 57

upvoted a paper 18 days ago

ShotStream: Streaming Multi-Shot Video Generation for Interactive Storytelling

Paper • 2603.25746 • Published 22 days ago • 155

upvoted a paper 22 days ago

GameplayQA: A Benchmarking Framework for Decision-Dense POV-Synced Multi-Video Understanding of 3D Virtual Agents

Paper • 2603.24329 • Published 23 days ago • 28

upvoted a paper 24 days ago

mSFT: Addressing Dataset Mixtures Overfiting Heterogeneously in Multi-task SFT

Paper • 2603.21606 • Published 25 days ago • 39

upvoted a paper about 1 month ago

Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation

Paper • 2602.01756 • Published Feb 2 • 23

upvoted 2 papers about 2 months ago

OmniGAIA: Towards Native Omni-Modal AI Agents

Paper • 2602.22897 • Published Feb 26 • 53

VimRAG: Navigating Massive Visual Context in Retrieval-Augmented Generation via Multimodal Memory Graph

Paper • 2602.12735 • Published Feb 13 • 8

upvoted 4 papers 2 months ago

Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models

Paper • 2602.10224 • Published Feb 10 • 19

GEBench: Benchmarking Image Generation Models as GUI Environments

Paper • 2602.09007 • Published Feb 9 • 39

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 118

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published Jan 29 • 155

upvoted 2 papers 3 months ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

Stochastic CHAOS: Why Deterministic Inference Kills, and Distributional Variability Is the Heartbeat of Artifical Cognition

Paper • 2601.07239 • Published Jan 12 • 3

upvoted a collection 3 months ago

VisionLM

Collection

1884 items • Updated Jan 12 • 146

upvoted 2 papers 3 months ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 216

UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision

Paper • 2601.03193 • Published Jan 6 • 50

Zhen Fang

AI & ML interests

Recent Activity

Organizations

CostaliyA's activity