1 3

HouJiadong PRO

iChubai

iChubai

AI & ML interests

None yet

Recent Activity

updated a dataset about 2 hours ago

iChubai/dsahbjkbdhsab

published a dataset 2 days ago

iChubai/dsahbjkbdhsab

updated a bucket 2 days ago

iChubai/tmp_bucket

View all activity

Organizations

updated a dataset about 2 hours ago

iChubai/dsahbjkbdhsab

Updated about 2 hours ago • 27

published a dataset 2 days ago

iChubai/dsahbjkbdhsab

Updated about 2 hours ago • 27

updated a bucket 2 days ago

iChubai/tmp_bucket

130 GB

reactedto Juanxi's post with ❤️🚀🔥👍😎🤗🔥 3 days ago

Post

4326

📢 Awesome Multimodal Modeling

We introduce Awesome Multimodal Modeling, a curated repository tracing the architectural evolution of multimodal intelligence—from foundational fusion to native omni-models.

🔹 Taxonomy & Evolution:

Traditional Multimodal Learning – Foundational work on representation, fusion, and alignment.
Multimodal LLMs (MLLMs) – Architectures connecting vision encoders to LLMs for understanding.
Unified Multimodal Models (UMMs) – Models unifying Understanding + Generation via Diffusion, Autoregressive, or Hybrid paradigms.
Native Multimodal Models (NMMs) – Models trained from scratch on all modalities; contrasts early vs. late fusion under scaling laws.
💡 Key Distinction:
UMMs unify tasks via generation heads; NMMs enforce interleaving through joint pre-training.

🔗 Explore & Contribute: https://github.com/OpenEnvision/Awesome-Multimodal-Modeling