Hybrid-Distillation - a yanhong-li Collection

yanhong-li 's Collections

Hybrid-Distillation

Hybrid-Distillation

updated Jan 25

Model weights in "Distilling to Hybrid Attention Models via KL-Guided Layer Selection" (https://arxiv.org/abs/2512.20569).