GGUF
conversational

Update README_CN.md

#3
by woodchen7 - opened
Files changed (1) hide show
  1. README_CN.md +2 -1
README_CN.md CHANGED
@@ -24,6 +24,7 @@
24
 
25
  ## 模型介绍
26
 
 
27
 
28
  Hy-MT2 是一款面向真实复杂场景的“快思考”多语言翻译模型家族,涵盖 1.8B、7B 和 30B-A3B(MoE)三种体量,支持 33 种语言互译并具备强大的多语言指令遵循能力。在端侧部署上,得益于 AngelSlim 1.25-bit 极端量化,其 1.8B 模型仅需 440MB 存储空间,推理速度显著提升 1.5 倍。多维度评测表明,Hy-MT2 在通用、真实业务、专业领域及指令遵循等翻译任务中表现卓越:7B 和 30B-A3B 模型性能不仅超越了 DeepSeek-V4-Pro、Kimi K2.6 等开源模型在快思考模式下的表现,轻量级 1.8B 模型亦在整体上超越了微软和豆包等主流商业 API。
29
 
@@ -155,7 +156,7 @@ python3 -m sglang.launch_server --model tencent/Hy-MT2-30B-A3B --tp 1
155
 
156
 
157
  ### llama_cpp
158
- **❕❕ This gguf depends on our STQ kernel, which is released at [PR #22836](https://github.com/ggml-org/llama.cpp/pull/22836).**
159
 
160
  #### Clone llama.cpp
161
 
 
24
 
25
  ## 模型介绍
26
 
27
+ Hy-MT2-1.8B-2Bit-GGUF由AngelSlim产出,更多技术细节可以参考 [[AngelSlim]](https://github.com/Tencent/AngelSlim)。
28
 
29
  Hy-MT2 是一款面向真实复杂场景的“快思考”多语言翻译模型家族,涵盖 1.8B、7B 和 30B-A3B(MoE)三种体量,支持 33 种语言互译并具备强大的多语言指令遵循能力。在端侧部署上,得益于 AngelSlim 1.25-bit 极端量化,其 1.8B 模型仅需 440MB 存储空间,推理速度显著提升 1.5 倍。多维度评测表明,Hy-MT2 在通用、真实业务、专业领域及指令遵循等翻译任务中表现卓越:7B 和 30B-A3B 模型性能不仅超越了 DeepSeek-V4-Pro、Kimi K2.6 等开源模型在快思考模式下的表现,轻量级 1.8B 模型亦在整体上超越了微软和豆包等主流商业 API。
30
 
 
156
 
157
 
158
  ### llama_cpp
159
+ **❕❕ This gguf depends on our STQ kernel, which is released at [PR #19357](https://github.com/ggml-org/llama.cpp/pull/19357).**
160
 
161
  #### Clone llama.cpp
162