Flux Attention - a QQTang1223 Collection

QQTang1223 's Collections

Flux Attention

updated 5 days ago

🚀 Flux Attention: Context-Aware Hybrid Attention for Efficient LLMs Inference

Flux Attention: Context-Aware Hybrid Attention for Efficient LLMs Inference

Paper • 2604.07394 • Published 12 days ago • 16
QQTang1223/full_streaming_Llama-3.1-8B-Instruct

Text Generation • 8B • Updated 9 days ago • 296
QQTang1223/full_xattn_Qwen3-8B

Text Generation • 8B • Updated 9 days ago • 311 • 1
QQTang1223/full_xattn_Qwen3-4B

Text Generation • 4B • Updated 9 days ago • 293
QQTang1223/full_xattn_Llama-3.1-8B-Instruct

Text Generation • 8B • Updated 9 days ago • 296
QQTang1223/full_triangle_Qwen3-8B

Text Generation • 8B • Updated 9 days ago • 311
QQTang1223/full_triangle_Qwen3-4B

Text Generation • 4B • Updated 9 days ago • 330
QQTang1223/full_triangle_Llama-3.1-8B-Instruct

Text Generation • 8B • Updated 9 days ago • 330
QQTang1223/full_streaming_Qwen3-8B

Text Generation • 8B • Updated 9 days ago • 285
QQTang1223/full_streaming_Qwen3-4B

Text Generation • 4B • Updated 9 days ago • 332
QQTang1223/qwen_mix_sft_64K6

Viewer • Updated 9 days ago • 49.3k • 36
QQTang1223/llama_mix_sft_64K6

Viewer • Updated 9 days ago • 49.3k • 44
QQTang1223/xattn_streaming_Qwen3-4B

Text Generation • 4B • Updated 5 days ago • 246