注意:此模型仅支持非思考模式,不会在其输出中生成 <think></think> 块。

#21
by Jay-v2 - opened

这是Model Card中的标注。
我的疑问在于,它为什么能够做到“不会在其输出中生成 块”呢?
要知道,此模型的词表中是有 这俩token的,而我即使在prompt中告诉模型“请你输出 和 ”它也不会生成,请问这是如何做到的呢?

【这种现象就意味着,假设基于此非推理模型,想要训练成为推理模型,是不可能的,是吗?因为模型根本不可能输出 和】

尖括号 think 和尖括号/think不显示…… 那我就以【think】和【/think】来代表尖括号版本的吧:

问题是这样的:为什么Qwen/Qwen3-4B-Instruct-2507 可以做到“不会在其输出中生成【think】和【/think】”呢?
要知道,此模型的词表中是有这俩token的,而我即使在prompt中告诉模型“请你输出【think】和【/think】 ”它也不会生成,请问这是如何做到的呢?

Sign up or log in to comment