Efficient-Large-Model
/

SANA-WM_bidirectional

@@ -17,11 +17,11 @@ for high-fidelity decoding.
 Paper: <https://arxiv.org/abs/2605.15178>
 ```bibtex
-@article{sanawm,
-  title  = {SANA-WM: Camera-Controlled Image-to-Video Diffusion},
-  author = {NVIDIA},
   journal = {arXiv preprint arXiv:2605.15178},
-  year   = {2026}
 }
 ```

 Paper: <https://arxiv.org/abs/2605.15178>
 ```bibtex
+@article{zhu2026sanawm,
+  title   = {{SANA-WM}: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer},
+  author  = {Zhu, Haoyi and Liu, Haozhe and Zhao, Yuyang and Ye, Tian and Chen, Junsong and Yu, Jincheng and He, Tong and Han, Song and Xie, Enze},
   journal = {arXiv preprint arXiv:2605.15178},
+  year    = {2026},
 }
 ```