GPTQ μμνλ V100κ³Ό κ°μ compute capability κ° 7.0 μΈ μν©μμ vllmμ λ릴 μ μλ λͺ μλλ μμν λ°©μμ λλ€.
μ νλκ° AWQλ NVFP4 GGUF μ λΉν΄μλ λ¨μ΄μ§ μ μκ² μ§λ§ μ μ©νκ² μ¬μ©νμ ¨μΌλ©΄ ν©λλ€.
νΉμ¬λ μμν νμΌλ©΄ λͺ¨λΈμ΄ μλ€λ©΄ https://github.com/LEE5J/llm-quant-lab issue λ¨κ²¨μ£Όμλ©΄ νμΈν μμν νλλ‘ νκ² μ΅λλ€.
- Downloads last month
- 35
Model tree for lee5j/EXAONE-4.5-33B_GPTQ8
Base model
LGAI-EXAONE/EXAONE-4.5-33B