请问这个FP8模型是怎么转换出来的?

#2
by Paul1006 - opened

如上,官方开源看起来是FP4版本,FP4版本用SGLang部署不了,这个开源FP8版本是怎么转出来的?

同问,模型介绍里面说的是FP4和FP8混合。Sglang的文档写了可以用hopper部署。

Why vLLM doesn't need an extra FP8 version on Hopper card?

Sign up or log in to comment