99 263

Mwangi PRO

Benson

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

VimRAG: Navigating Massive Visual Context in Retrieval-Augmented Generation via Multimodal Memory Graph

liked a model 2 days ago

nvidia/Kimodo-SOMA-RP-v1.1

liked a model 3 days ago

Qwen/Qwen3.5-397B-A17B

View all activity

Organizations

None yet

upvoted a paper about 18 hours ago

VimRAG: Navigating Massive Visual Context in Retrieval-Augmented Generation via Multimodal Memory Graph

Paper • 2602.12735 • Published Feb 13 • 6

liked a model 2 days ago

nvidia/Kimodo-SOMA-RP-v1.1

Updated 2 days ago • 131 • 5

liked a model 3 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 28 days ago • 807k • • 1.43k

upvoted 2 papers 6 days ago

WAVE: Learning Unified & Versatile Audio-Visual Embeddings with Multimodal LLM

Paper • 2509.21990 • Published Sep 26, 2025 • 1

A Simple Baseline for Streaming Video Understanding

Paper • 2604.02317 • Published 11 days ago • 71

liked a model 7 days ago

tsinghua-ee/WAVE-7B

Updated Feb 11 • 160 • 2

upvoted a paper 11 days ago

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

Paper • 2603.27538 • Published 15 days ago • 137

upvoted 2 papers 12 days ago

PEARL: Personalized Streaming Video Understanding Model

Paper • 2603.20422 • Published 23 days ago • 40

Towards a Medical AI Scientist

Paper • 2603.28589 • Published 13 days ago • 87

liked a model 13 days ago

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

Image-Text-to-Text • 28B • Updated 7 days ago • 578k • 2.6k

liked a Space 13 days ago

Qwen3.5 Omni Online Demo

📚

Chat with a multimodal AI using text, image, audio, or video

liked a model 14 days ago

internlm/Intern-S1-Pro

Image-Text-to-Text • Updated 14 days ago • 121k • 273

liked a dataset 21 days ago

nvidia/MMOU

Viewer • Updated 16 days ago • 15k • 2.1k • 15

liked a model 23 days ago

syxbb/SAMA-14B

Video-to-Video • Updated 21 days ago • 20

upvoted 3 papers 28 days ago

Multimodal OCR: Parse Anything from Documents

Paper • 2603.13032 • Published about 1 month ago • 43

NLE: Non-autoregressive LLM-based ASR by Transcript Editing

Paper • 2603.08397 • Published Mar 9 • 21

MAISI-v2: Accelerated 3D High-Resolution Medical Image Synthesis with Rectified Flow and Region-specific Contrastive Loss

Paper • 2508.05772 • Published Aug 7, 2025 • 3

liked a model 28 days ago

nvidia/NV-Generate-MR-Brain

Unconditional Image Generation • Updated 4 days ago • 351 • 16

liked a model 29 days ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

Text Generation • 124B • Updated 29 days ago • 16.3k • 26

upvoted a paper about 1 month ago

Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought

Paper • 2505.19877 • Published May 26, 2025 • 2

Mwangi PRO

AI & ML interests

Recent Activity

Organizations

Benson's activity

Qwen3.5 Omni Online Demo