Smoothie-Qwen3-8B-KR-Self-Driving-Legal v3

์ž์œจ์ฃผํ–‰๋ฒ•๋ น ๋„๋ฉ”์ธ ํŒŒ์ธํŠœ๋‹ + RAG ์‹คํ—˜ ์ตœ์ข… ๊ฒฐ๊ณผ ๋ณด๊ณ ์„œ

๋ณธ ๋ฌธ์„œ๋Š” 2026-02-24 ์žฌ๊ฒ€ํ† ๋ฅผ ํ†ตํ•ด ์ดˆ๊ธฐ README์˜ ์ค‘๋Œ€ํ•œ ์˜ค๋ฅ˜๋ฅผ ์ˆ˜์ •ํ•œ ์ตœ์ข…ํŒ์ž…๋‹ˆ๋‹ค.


โš ๏ธ ์ •์ •(Errata) ๊ณต์ง€

๊ธฐ์กด ์—…๋กœ๋“œ๋œ v3 README์—๋Š” ํ‰๊ฐ€ ๊ฒฐ๊ณผ ๋ผ๋ฒจ ๋งคํ•‘ ์˜ค๋ฅ˜๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

  • ์›๋ณธ README ์ฃผ์žฅ: FT ๋ชจ๋ธ 86.7%, ์ˆœ์ • ๋ชจ๋ธ 40.7% (FT ์••๋„์  ์šฐ์œ„)
  • ์‹ค์ œ ํ‰๊ฐ€ ๊ฒฐ๊ณผ: FT ๋ชจ๋ธ 43%, ์ˆœ์ • ๋ชจ๋ธ 90% (FT ์—ด์œ„)

๋‚ด๋ถ€ ๋กœ๊ทธ ๋ฐ ๋‹ค์ˆ˜์˜ ๋…๋ฆฝ ๋ถ„์„ ๋ฌธ์„œ์™€์˜ ๊ต์ฐจ ๊ฒ€์ฆ ๊ฒฐ๊ณผ, ์ดˆ๊ธฐ README ์ž‘์„ฑ ์‹œ LLM ์ฑ„์  ๊ณผ์ •์—์„œ ๋‘ ๋ชจ๋ธ์˜ ์‘๋‹ต์„ ์—ญ์ˆœ์œผ๋กœ ์ž…๋ ฅํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ ˆ์ด๋ธ”์ด ๋’ค๋ฐ”๋€ ๊ฒƒ์œผ๋กœ ํŒ๋‹จ๋ฉ๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๋„์ถœ๋œ ๋ชจ๋“  ๊ฒฐ๋ก (FT ์šฐ์œ„, ๋ฌผ๋ฆฌ์  AI ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ ๋“ฑ)์€ ์‹ ๋ขฐํ•  ์ˆ˜ ์—†์œผ๋ฉฐ, ๋ณธ ๋ฌธ์„œ์—์„œ ์ „๋ฉด ์ˆ˜์ •ํ•ฉ๋‹ˆ๋‹ค.


0. ์‹คํ—˜ ์š”์•ฝ (Abstract)

๋ณธ ์—ฐ๊ตฌ๋Š” ๋Œ€ํ•œ๋ฏผ๊ตญ ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ ๊ด€๋ จ ๋ฒ•๋ น์— ํŠนํ™”ํ•œ 8B ๊ฒฝ๋Ÿ‰ ์–ธ์–ด๋ชจ๋ธ์˜ ํŒŒ์ธํŠœ๋‹์ด, ๋™์ผ ๋„๋ฉ”์ธ RAG(Retrieval-Augmented Generation) ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ๋” ํฐ ์ˆœ์ • ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๊ฒ€์ฆํ•˜๋Š” ๊ฒƒ์„ ๋ชฉ์ ์œผ๋กœ ํ•˜์˜€๋‹ค.

Smoothie-Qwen3-8B๋ฅผ ๋ฒ ์ด์Šค๋กœ QLoRA ํŒŒ์ธํŠœ๋‹์„ ์ˆ˜ํ–‰ํ•˜์˜€์œผ๋ฉฐ(750๊ฐœ QnA ๋ฐ์ดํ„ฐ์…‹, 3~5 ์—ํฌํฌ), ๋™์ผ RAG ์กฐ๊ฑด ํ•˜์— 4๊ฐœ ๋ชจ๋ธ(FT-8B Q4, FT-8B Q8/CoT, Non-FT 8B, Non-FT 14B)์„ 15๊ฐœ ์˜ค๋‹ต ์œ ๋„ํ˜• ์งˆ๋ฌธ์œผ๋กœ ํ‰๊ฐ€ํ•˜์˜€๋‹ค.

ํ•ต์‹ฌ ๊ฒฐ๊ณผ:

  • ์ฃผ ๊ฐ€์„ค ๊ธฐ๊ฐ: ํŒŒ์ธํŠœ๋‹๋œ 8B ๋ชจ๋ธ(43~60%)์ด ์ˆœ์ • 8B/14B ๋ชจ๋ธ(90%)์— ๋น„ํ•ด ํ˜„์ €ํžˆ ๋‚ฎ์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.
  • ๋ถ€์ˆ˜์  ๋ฐœ๊ฒฌ: RAG ๋ฒกํ„ฐDB ๊ตฌ์„ฑ ์‹œ ์›๋ฌธ ๋ฒ•๋ น ํ…์ŠคํŠธ์— ๋”ํ•˜์—ฌ ๋„๋ฉ”์ธ QnA ๋ฐ์ดํ„ฐ์…‹์„ ํ•จ๊ป˜ ์ž„๋ฒ ๋”ฉํ•˜๋ฉด ์‘๋‹ต ํ’ˆ์งˆ์ด ํ–ฅ์ƒ๋œ๋‹ค๋Š” ์ ์„ ์‹คํ—˜์ ์œผ๋กœ ํ™•์ธํ•˜์˜€๋‹ค.
  • ๋ฐฉ๋ฒ•๋ก ์  ๊ตํ›ˆ: RAG ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์—์„œ์˜ ํŒŒ์ธํŠœ๋‹์€ ๋ชจ๋ธ์ด ๊ฒ€์ƒ‰๋œ ๋ฌธ๋งฅ ๋Œ€์‹  ๋‚ด๋ถ€ ํ•™์Šต ํŒจํ„ด์„ ์šฐ์„ ํ•˜๋Š” ๋ถ€์ž‘์šฉ์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ๋‹ค.

1. ์—ฐ๊ตฌ ๋™๊ธฐ ๋ฐ ๊ฐ€์„ค

1.1 ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ

๋ฌผ๋ฆฌ์  AI(Physical AI) ๋ฐ ์ž์œจ์ฃผํ–‰ ๋ถ„์•ผ์—์„œ๋Š” ์ถ”๋ก  ์„ฑ๋Šฅ๊ณผ ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ์‚ฌ์ด์˜ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๊ฐ€ ์‹ค์ œ ๋ฐฐํฌ์˜ ํ•ต์‹ฌ ๋ฌธ์ œ๋‹ค. 14B ์ด์ƒ์˜ ๋Œ€ํ˜• ๋ชจ๋ธ์€ 12GB ์ด์ƒ์˜ VRAM์„ ์š”๊ตฌํ•˜์—ฌ ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค๋‚˜ ์ผ๋ฐ˜ ์†Œ๋น„์ž GPU(RTX 3080 Ti 12GB ์ˆ˜์ค€)์—์„œ๋„ ์šด์šฉ ์—ฌ์œ ๊ฐ€ ๋งค์šฐ ์ œํ•œ์ ์ด๋‹ค.

๋ฐ˜๋ฉด 8B ๋ชจ๋ธ์€ 4~8GB VRAM์œผ๋กœ ์ž‘๋™ ๊ฐ€๋Šฅํ•˜์—ฌ ๊ฒฝ๋Ÿ‰ํ™”์˜ ์ด์ ์ด ํฌ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์›์‹œ 8B ๋ชจ๋ธ์€ ๋„๋ฉ”์ธ ํŠนํ™” ๋ฒ•๋ น ํ•ด์„์—์„œ 14B ๋Œ€๋น„ ์„ฑ๋Šฅ ์—ด์œ„๊ฐ€ ์˜ˆ์ƒ๋œ๋‹ค.

์—ฐ๊ตฌ ์งˆ๋ฌธ: "๋„๋ฉ”์ธ ํŠนํ™” ํŒŒ์ธํŠœ๋‹์„ ํ†ตํ•ด 8B ๋ชจ๋ธ์ด ์ˆœ์ • 14B ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?"

1.2 ์—ฐ๊ตฌ ๊ฐ€์„ค

๊ฐ€์„ค H1: ์ž์œจ์ฃผํ–‰ ๋ฒ•๋ น ๋„๋ฉ”์ธ์œผ๋กœ QLoRA ํŒŒ์ธํŠœ๋‹๋œ Qwen3-8B ๋ชจ๋ธ์€, ๋™์ผ ๋„๋ฉ”์ธ RAG ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ์ˆœ์ • Qwen3-14B ๋ชจ๋ธ๋ณด๋‹ค ๋ฒ•๋ น ํ•ด์„ ์ •ํ™•๋„๊ฐ€ ๋†’๊ฑฐ๋‚˜ ๋™๋“ฑํ•  ๊ฒƒ์ด๋‹ค.

1.3 ๊ฐ€์„ค์˜ ์‹ค์šฉ์  ํ•จ์˜

๋ณธ ๊ฐ€์„ค์ด ์ฐธ์ด๋ผ๋ฉด, ๊ณ ๊ฐ€ GPU ์—†์ด๋„ ์ „๋ฌธ ๋„๋ฉ”์ธ LLM์„ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์–ด ํ•˜๋“œ์›จ์–ด ๋…ธํ›„ํ™” ๋ฌธ์ œ๋ฅผ ์ง€์—ฐ์‹œํ‚ค๋Š” ์‹ค์šฉ์  ์ „๋žต์ด ๋  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ณธ ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ด ๊ฐ€์„ค์€ ํ˜„์žฌ ์‹คํ—˜ ์กฐ๊ฑด ํ•˜์—์„œ ๊ธฐ๊ฐ๋˜์—ˆ๋‹ค.


2. ์‹คํ—˜ ์„ค๊ณ„

2.1 ๋ชจ๋ธ ๋ฒ„์ „ ๋ฐœ์ „ ์ด๋ ฅ

๋ณธ ๋ชจ๋ธ(v3)์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ์•„๋ž˜์˜ ๊ฐœ์„  ๊ณผ์ •์„ ๊ฑฐ์ณค๋‹ค.

๋ฒ„์ „ ์ฃผ์š” ๋ณ€๊ฒฝ ๋ฌธ์ œ์ 
v1 ์ตœ์ดˆ ํŒŒ์ธํŠœ๋‹ (๊ธฐ๋ณธ Alpaca ํ˜•์‹) <think> ์™„์ „ ๋น„์–ด์žˆ์Œ, ๋ฌธ๋งฅ ์†Œ์‹ค, ๋ฒ•๋ น ํŽธํ–ฅ ๊ณ ์ฐฉ
v2 ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ ๊ฐ•ํ™” + [์ถœ์ฒ˜:] ํƒœ๊ทธ ์‚ฝ์ž… ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ๊ฐ€ 3,750ํšŒ ๋ฐ˜๋ณต ์ฃผ์ž…๋˜์–ด ํŽธํ–ฅ ์•…ํ™”
v3 DTRO(Direct To Response) ์Šคํƒ€์ผ ๋ณ€ํ™˜ (๊ฐ•์ œ ํ”„๋กฌํ”„ํŠธยทํžŒํŠธ ํƒœ๊ทธ ์ œ๊ฑฐ) <think> ์—ฌ์ „ํžˆ ๋น„์–ด์žˆ์Œ, ๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™” ๋ถˆ๊ฐ€

v3์˜ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์กฐ ๋ณ€ํ™˜ (ํ•ต์‹ฌ ๊ฐœ์„ ):

// v2 (๋ฌธ์ œ)
{
  "instruction": "๋‹น์‹ ์€ ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ๋ฒ• ์ „๋ฌธ๊ฐ€์ž…๋‹ˆ๋‹ค...(์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ 750ร—5=3,750ํšŒ ์ฃผ์ž…)",
  "input": "์ž์œจ์ฃผํ–‰์ž๋™์ฐจ๋ž€? [์ถœ์ฒ˜: ์ž๋™์ฐจ๊ด€๋ฆฌ๋ฒ• ์ œ2์กฐ]",
  "output": "๋‹จ๋‹ตํ˜• ๋‹ต๋ณ€"
}

// v3 (๊ฐœ์„ : DTRO Style)
{
  "instruction": "์ž์œจ์ฃผํ–‰์ž๋™์ฐจ๋ž€ ๋ฌด์—‡์ธ๊ฐ€์š”?",
  "output": "์ž์œจ์ฃผํ–‰์ž๋™์ฐจ๋ž€..."
}

v3๋Š” ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ ํŽธํ–ฅ(์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ ๊ฐ•์ œ ์ฃผ์ž…, ์ถœ์ฒ˜ ํžŒํŠธ)์€ ํ•ด์†Œํ–ˆ์œผ๋‚˜, Chain-of-Thought ์ถ”๋ก  ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ์—†์–ด <think> ๋ณต์›์—๋Š” ์‹คํŒจํ–ˆ๋‹ค.

2.2 ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์„ฑ

ํ•ญ๋ชฉ ๋‚ด์šฉ
๋ฐ์ดํ„ฐ ๊ทœ๋ชจ 750๊ฐœ QnA ์Œ
๋„๋ฉ”์ธ ๋Œ€ํ•œ๋ฏผ๊ตญ ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ ๊ด€๋ จ ๋ฒ•๋ น (์ž๋™์ฐจ๊ด€๋ฆฌ๋ฒ•, ์—ฌ๊ฐ์ž๋™์ฐจ๋ฒ•, ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ๋ฒ• ์‹œํ–‰๊ทœ์น™ ๋“ฑ)
๊ตฌ์„ฑ ๋ฐฉ์‹ ๋ฒ•๋ น ์›๋ฌธ์—์„œ ์ถ”์ถœํ•œ ์˜ค๋‹ต ์œ ๋„ํ˜• ์งˆ๋ฌธ 30๊ฑด + ์ผ๋ฐ˜ ๋ฒ•๋ น ์„ค๋ช…ํ˜• 720๊ฑด
ํฌ๋งท DTRO Style (์ˆœ์ˆ˜ ์งˆ๋ฌธ โ†’ ์ •ํ™•ํ•œ ๋‹ต๋ณ€, ์ถ”๋ก  ๊ณผ์ • ์—†์Œ)
์ถœ์ฒ˜ ํƒœ๊ทธ ์ œ๊ฑฐ (v2์˜ ๋ณต์‚ฌ ํŽธํ–ฅ ๋ฐฉ์ง€)

ํ•œ๊ณ„: ์งˆ๋ฌธ ํ”„๋ ˆ์ด๋ฐ์ด ๋‹จ์ผ ํŒจํ„ด(๊ธ์ • ๋ฐฉํ–ฅ ๋‹ค์ˆ˜)์œผ๋กœ ํŽธํ–ฅ๋˜์–ด, ๋ถ€์ • ๋ฐฉํ–ฅ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ํ•™์Šตํ•˜์ง€ ๋ชปํ•จ.

2.3 ํŒŒ์ธํŠœ๋‹ ์„ค์ • (QLoRA)

ํ•ญ๋ชฉ v3 (์ผ๋ฐ˜ QnA) v5/CoT (ํ›„์† ์‹คํ—˜)
๋ฒ ์ด์Šค ๋ชจ๋ธ dnotitia/Smoothie-Qwen3-8B dnotitia/Smoothie-Qwen3-8B
์–ด๋Œ‘ํ„ฐ QLoRA (r=16, alpha=32) QLoRA (๋™์ผ)
์—ํฌํฌ 5 3
ํ•™์Šต๋ฅ  2e-4 2e-4
๋ฐฐ์น˜ ํฌ๊ธฐ 4 (gradient_accumulation=4) 4
VRAM RTX 3080 Ti 12GB ๋™์ผ
CoT ์—ฌ๋ถ€ โœ— (๋‹จ์ˆœ Qโ†’A) โœ… (<think>...</think> ํฌํ•จ)
์–‘์žํ™” Q4_K_M Q8_0

2.4 RAG ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์„ฑ

๋ชจ๋“  ํ‰๊ฐ€์— ๋™์ผํ•œ RAG ํ™˜๊ฒฝ์„ ์‚ฌ์šฉํ•˜์˜€๋‹ค.

[RAG ์•„ํ‚คํ…์ฒ˜]

์ž…๋ ฅ ์งˆ๋ฌธ
   โ”‚
   โ–ผ
BGE-M3 ์ž„๋ฒ ๋”ฉ (multilingual, ๊ณ ํ’ˆ์งˆ ํ•œ๊ตญ์–ด ์ง€์›)
   โ”‚
   โ–ผ
Qdrant ๋ฒกํ„ฐ DB ๊ฒ€์ƒ‰ (MMR + ์žฌ์ˆœ์œ„ํ™”)
   โ”‚
   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”
   โ”‚  ๋ฒกํ„ฐ DB ๊ตฌ์„ฑ ๋‚ด์šฉ                    โ”‚
   โ”‚  โ‘  ๋ฒ•๋ น ์›๋ฌธ TXT  (์ฒญํฌ ๋‹จ์œ„ ์ž„๋ฒ ๋”ฉ)   โ”‚
   โ”‚  โ‘ก QnA ๋ฐ์ดํ„ฐ์…‹ JSON (Q+A ์Œ ์ž„๋ฒ ๋”ฉ)  โ”‚ โ† ๋ถ€์ˆ˜์  ๊ธ์ • ๋ฐœ๊ฒฌ
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   โ”‚
   โ–ผ
์ƒ์œ„ ์ปจํ…์ŠคํŠธ ์ถ”์ถœ
   โ”‚
   โ–ผ
[ํ‰๊ฐ€ ๋Œ€์ƒ ๋ชจ๋ธ 4์ข…] โ†’ ์‘๋‹ต ์ƒ์„ฑ

์ค‘์š” ์„ค๊ณ„ ์„ ํƒ: ๋ฒกํ„ฐ DB์— ๋ฒ•๋ น ์›๋ฌธ๋ฟ ์•„๋‹ˆ๋ผ QnA ๋ฐ์ดํ„ฐ์…‹ ์ž์ฒด๋„ ์ž„๋ฒ ๋”ฉํ–ˆ๋‹ค. ์ด๋Š” ํ›„์ˆ ํ•˜๋Š” ๋ถ€์ˆ˜์  ๋ฐœ๊ฒฌ์˜ ํ•ต์‹ฌ ์š”์†Œ์ด๋‹ค.

2.5 ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก 

ํ•ญ๋ชฉ ๋‚ด์šฉ
ํ‰๊ฐ€ ์งˆ๋ฌธ 15๊ฐœ ์˜ค๋‹ต ์œ ๋„ํ˜• ํ•จ์ • ์งˆ๋ฌธ (NotebookLM ์ƒ์„ฑ)
์งˆ๋ฌธ ํŠน์„ฑ ๋ฒ•๋ น ์„ธ๋ถ€ ์กฐ๊ฑด์„ ๋’ค์ง‘๊ฑฐ๋‚˜, ์œ ์‚ฌ ๊ฐœ๋…์„ ํ˜ผ์šฉํ•˜์—ฌ ์˜ค๋‹ต์„ ์œ ๋„ํ•˜๋„๋ก ์„ค๊ณ„
์ฑ„์  ๊ธฐ์ค€ โœ… ์ •๋‹ต(๊ฒฐ๋ก +๊ทผ๊ฑฐ ์ •ํ™•), โš ๏ธ ๋ถ€๋ถ„ ์ •๋‹ต(๋ฐฉํ–ฅ ๋งž์œผ๋‚˜ ์˜ค๋ฅ˜ ํฌํ•จ), โŒ ์˜ค๋‹ต(๊ฒฐ๋ก  ์˜ค๋ฅ˜)
๋…๋ฆฝ ํ‰๊ฐ€์ž Claude Opus 4.6 (Thinking ๋ชจ๋“œ), GPT-5.2-High
๊ฐ€์ค‘ ์ ์ˆ˜ โœ…=2์ , โš ๏ธ=1์ , โŒ=0์  (๋งŒ์  30์ )
์œ ์‚ฌ๋„ ๋ถ„๋ฅ˜ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ์งˆ๋ฌธ ๊ฐ„ ์˜๋ฏธ ์œ ์‚ฌ๋„๋ฅผ 4๋‹จ๊ณ„ ๋ถ„๋ฅ˜

3. ์‹คํ—˜ ๊ฒฐ๊ณผ

3.1 ์ •๋Ÿ‰ ๊ฒฐ๊ณผ (6๊ฐœ ๋ชจ๋ธ ์ข…ํ•ฉ ์ตœ์ข…ํŒ)

ํ›„์† ์‹คํ—˜์—์„œ Gemma3n E4B(ํ•  4B๊ธ‰) ๋ฐ DTRO 8B(์ „๋ ฅ์„ค๋น„ ๋„๋ฉ”์ธ FT) 2๊ฐœ ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ๋น„๊ตํ•˜์˜€๋‹ค.

์ˆœ์œ„ ๋ชจ๋ธ โœ… ์ •๋‹ต โš ๏ธ ๋ถ€๋ถ„ โŒ ์˜ค๋‹ต ๊ฐ€์ค‘์ (/30) ์ •๋‹ต๋ฅ 
1 Non-FT 14B 13 1 1 27 90%
1 Non-FT 8B 13 1 1 27 90%
3 Gemma3n E4B 13 0 2 26 87%
4 DTRO 8B (์ „๋ ฅ์„ค๋น„ FT) 11 2 2 24 80%
5 FT-8B (Q8/CoT, v5) 6 6 3 18 60%
6 FT-8B (Q4, v3) 4 5 6 13 43%
์ •๋‹ต๋ฅ  ์‹œ๊ฐํ™”:

Non-FT 14B    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  90%
Non-FT 8B     โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆ  90%
Gemma3n E4B   โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–‘โ–‘  87%  โ† 4B๊ธ‰!
DTRO 8B       โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–‘โ–‘โ–‘โ–‘โ–‘โ–‘  80%
FT-8B (Q8)    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘  60%
FT-8B (Q4)    โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘โ–‘  43%

๊ฒฐ๋ก : ๊ฐ€์„ค H1 ๊ธฐ๊ฐ. ํŒŒ์ธํŠœ๋‹๋œ 8B ๋ชจ๋ธ(4360%)์ด Non-FT ๋ชจ๋ธ(90%) ๋Œ€๋น„ **3047%p ๋‚™์€ ์„ฑ๋Šฅ**์„ ๋ณด์˜€๋‹ค. ๋˜ํ•œ Gemma3n E4B๊ฐ€ ~4B ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ 87%๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ, RAG ํ™˜๊ฒฝ์—์„œ ๋ชจ๋ธ ํฌ๊ธฐ๋ณด๋‹ค RAG ํ’ˆ์งˆ์ด ํ•‘์‹ฌ ๋ณ€์ˆ˜์ž„์ด ํ™•์ธ๋˜์—ˆ๋‹ค.

3.2 ๋ฌธํ•ญ๋ณ„ ํŒ์ • (4๊ฐœ ๋ชจ๋ธ ๋น„๊ต)

Q# ์ฃผ์ œ ์œ ์‚ฌ๋„ FT-8B(Q4) FT-8B(Q8/CoT) Non-FT 8B Non-FT 14B
Q1 ๋ ˆ๋ฒจ3 ๋น„์ƒ/์œ„ํ—˜์ตœ์†Œํ™” ๐Ÿ”ด๋†’์Œ โŒ โš ๏ธ โœ… โš ๏ธ
Q2 CSMS ์ธ์ฆ ๊ฐฑ์‹  ๐ŸŸก์ค‘๊ฐ„ โš ๏ธ โš ๏ธ โœ… โœ…
Q3 ์œ ์ƒ์šด์†ก ํ—ˆ๊ฐ€ ๐Ÿ”ด๋†’์Œ โŒ โŒ โš ๏ธ โœ…
Q4 ์•ˆ์ „๊ตฌ๊ฐ„ ์ •๋ฐ€์ง€๋„ ๐ŸŸข๋‚ฎ์Œ โš ๏ธ โœ… โœ… โœ…
Q5 ์œค๋ฆฌ ๋”œ๋ ˆ๋งˆ ๐ŸŸก์ค‘๊ฐ„ โœ… โš ๏ธ* โœ… โœ…
Q6 ์ž„์‹œ์šดํ–‰ ๋ฌด์ธ์ „ํ™˜ ๐ŸŸข๋‚ฎ์Œ โš ๏ธ โš ๏ธ โœ… โœ…
Q7 ๋ ˆ๋ฒจ4 ์šด์ „์„ ์ดํƒˆ ๐ŸŸก์ค‘~๋†’ โŒ โœ… โœ… โœ…
Q8 ์†ํ•ด๋ฐฐ์ƒ 1์ฐจ ์ฑ…์ž„ ๐ŸŸก์ค‘๊ฐ„ โš ๏ธ โœ… โŒ โŒ
Q9 DSSAD ์ œ์ถœ ๊ฑฐ๋ถ€ ๐Ÿ”ด๋†’์Œ โš ๏ธ โœ… โœ… โœ…
Q10 ์˜ค๋ฒ„๋ผ์ด๋“œ ์ „ํ™˜ ๐ŸŸข๋‚ฎ์Œ โœ… โš ๏ธ โœ… โœ…
Q11 ์‹œ๋ฒ”์ง€๊ตฌ ์ง๊ถŒ ํ•ด์ œ ๐Ÿ”ด๐Ÿ”ด๋งค์šฐ๋†’์Œ โŒ โŒ โœ… โœ…
Q12 ๊ฒฝ๋ฏธ ์‚ฌ๊ณ  ๋ณด๊ณ  ๐ŸŸข๋‚ฎ์Œ โœ… โŒ โœ… โœ…
Q13 C-ITS ๋‹จ์ ˆ ๋Œ€์‘ ๐ŸŸก์ค‘~๋†’ โœ… โœ… โœ… โœ…
Q14 ์ƒํ˜ธ ๋ณ€๊ฒฝ ์‹ ๊ณ  ๐ŸŸข๋‚ฎ์Œ โŒ โš ๏ธ โœ… โœ…
Q15 ์„ฑ๋Šฅ์ธ์ฆ vs ์ ํ•ฉ์„ฑ ๐Ÿ”ด๐Ÿ”ด๋งค์šฐ๋†’์Œ โš ๏ธ โœ… โœ… โœ…

*Q5 (FT-8B Q8/CoT): ๋‚ด์šฉ์€ ์ •ํ™•ํ•˜๋‚˜ "์ฐธ๊ณ ๋ฌธ์„œ 1"์ด 89ํšŒ ์ด์ƒ ๋ฐ˜๋ณต๋˜๋Š” ์ƒ์„ฑ ๋ฃจํ”„ ๋ฐœ์ƒ

3.3 ์œ ์‚ฌ๋„๋ณ„ ์„ฑ๋Šฅ ๋ถ„์„

ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ์—์„œ ๋ฐœ๊ฒฌ๋œ ๊ฐ€์žฅ ์ถฉ๊ฒฉ์ ์ธ ํŒจํ„ด์€ **"ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌํ•œ ์งˆ๋ฌธ์ผ์ˆ˜๋ก ์˜คํžˆ๋ ค ์ •๋‹ต๋ฅ ์ด ๋‚ฎ๋‹ค"**๋Š” ์—ญ์„ค์ด๋‹ค.

FT-8B (Q4) โ€“ ์œ ์‚ฌ๋„๋ณ„ ์ •๋‹ต๋ฅ :

๐Ÿ”ด๐Ÿ”ด ๋งค์šฐ ๋†’์Œ (Q11, Q15):    0/2   ยทยทยทยทยทยทยทยทยทยทยทยทยท  0%   (โ† ๊ธฐ๋Œ€: ๊ฐ€์žฅ ๋†’์•„์•ผ ํ•จ)
๐Ÿ”ด   ๋†’์Œ (Q1, Q3, Q9):       0/3   ยทยทยทยทยทยทยทยทยทยทยทยท  0%
๐ŸŸก   ์ค‘๊ฐ„ (Q2,Q5,Q7,Q8,Q13):  3.5/5 ยทยทยทยทยทยทยทยทยทยทยทยท  70%
๐ŸŸข   ๋‚ฎ์Œ (Q4,Q6,Q10,Q12,Q14): 3/5  ยทยทยทยทยทยทยทยทยทยทยทยท  60%

Non-FT 8B โ€“ ์œ ์‚ฌ๋„๋ณ„ ์ •๋‹ต๋ฅ :

๐Ÿ”ด๐Ÿ”ด ๋งค์šฐ ๋†’์Œ:    2/2   ยทยทยทยทยทยทยทยทยทยทยทยทยท  100%
๐Ÿ”ด   ๋†’์Œ:         2.5/3 ยทยทยทยทยทยทยทยทยทยทยทยทยท   83%
๐ŸŸก   ์ค‘๊ฐ„:         4/5   ยทยทยทยทยทยทยทยทยทยทยทยทยท   80%
๐ŸŸข   ๋‚ฎ์Œ:         5/5   ยทยทยทยทยทยทยทยทยทยทยทยทยท  100%

์ด ์—ญ์ „ ํ˜„์ƒ์€ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ์ด ๋ฒ•๋ น์˜ ๋‚ด์šฉ์ด ์•„๋‹Œ ๋‹ต๋ณ€์˜ ํ‘œ๋ฉด์  ํŒจํ„ด์„ ํ•™์Šตํ–ˆ์Œ์„ ๊ฐ•๋ ฅํžˆ ์‹œ์‚ฌํ•œ๋‹ค.

3.4 ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ์˜ 5๊ฐ€์ง€ ์‹คํŒจ ํŒจํ„ด

โ‘  ํ…œํ”Œ๋ฆฟ ๊ณผ์ ํ•ฉ (Template Overfitting) โ€” ๊ฐ€์žฅ ์น˜๋ช…์ 

๋ชจ๋ธ์ด ์งˆ๋ฌธ์˜ ๋…ผ๋ฆฌ์  ๋ฐฉํ–ฅ์„ ์ดํ•ดํ•˜์ง€ ์•Š๊ณ , "์•„๋‹™๋‹ˆ๋‹ค + ์„ค๋ช…"์ด๋ผ๋Š” ํ˜•์‹ ์ž์ฒด๋ฅผ ์•”๊ธฐํ•˜์˜€๋‹ค.

[ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ]
Q: "๋ฐ˜๋“œ์‹œ ์‹œยท๋„์ง€์‚ฌ์˜ ์‹ ์ฒญ์ด ์žˆ์–ด์•ผ๋งŒ ํ•ฉ๋‹ˆ๊นŒ?"
A: "์•„๋‹™๋‹ˆ๋‹ค. (...) ์ง๊ถŒ์œผ๋กœ ํ•ด์ œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค."  โ† ์˜ฌ๋ฐ”๋ฅธ ๋ถ€์ •

[ํ…Œ์ŠคํŠธ ์งˆ๋ฌธ: ๋ฐฉํ–ฅ ๋ฐ˜์ „]
Q: "์ง๊ถŒ์œผ๋กœ ํ•ด์ œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?"

[FT-8B ๋‹ต๋ณ€]
A: "์•„๋‹™๋‹ˆ๋‹ค. (...) ์ง๊ถŒ์œผ๋กœ ํ•ด์ œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค."
    โ†‘ ๊ฒฐ๋ก (๋ถ€์ •)๊ณผ ์„ค๋ช…(๊ธ์ •)์ด ๋ชจ์ˆœ โ†’ ํŒจํ„ด๋งŒ ์žฌ์ƒ

โ‘ก ํ•ต์‹ฌ ์šฉ์–ด ํ˜ผ๋™ (Concept Confusion)

์ •๋‹ต:  "์œ„ํ—˜์ตœ์†Œํ™”์šดํ–‰(Risk Minimal Maneuver)"
FT-8B: "๋น„์ƒ์šดํ–‰(๊ฐ์† ๋˜๋Š” ์ •์ง€)"  โ† ์ „ํ˜€ ๋‹ค๋ฅธ ๊ฐœ๋… ํ˜ผ์šฉ

โ†’ ํ›ˆ๋ จ ๊ณผ์ •์—์„œ ๋‘ ๊ฐœ๋…์ด ๋™์ผ ๋งฅ๋ฝ์œผ๋กœ ๊ณผ๋‹ค ๋…ธ์ถœ๋˜์–ด ๊ตฌ๋ถ„ ๋Šฅ๋ ฅ ์†์‹ค

โ‘ข ๊ธ์ •/๋ถ€์ • ์‘๋‹ต ๋ถˆ์ผ์น˜ (Affirmation Inconsistency)

Q: "์ ํ•ฉ์„ฑ ์Šน์ธ์ด ๋ฉด์ œ๋ฉ๋‹ˆ๊นŒ?"
FT-8B: "๋„ค, (...) ์ ํ•ฉ์„ฑ ์Šน์ธ์„ ๋ฐ›์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค."
        โ†‘ "๋„ค"(๋ฉด์ œ๋จ)์™€ "๋ฐ›์•„์•ผ"(๋ฉด์ œ ์•ˆ ๋จ)๊ฐ€ ๋™์‹œ ์ถœ๋ ฅ

โ†’ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ๊ธ์ •/๋ถ€์ • ํŒจํ„ด์ด ๋’ค์„ž์—ฌ ํ˜ผ์šฉ

โ‘ฃ ํ•ต์‹ฌ ์กฐ๊ฑด ํƒˆ๋ฝ (Critical Condition Omission)

ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ: "์‹œยท๋„์ง€์‚ฌ ํ—ˆ๊ฐ€ + ๊ตญํ† ๊ตํ†ต๋ถ€์žฅ๊ด€ ํ˜‘์˜(ํ•„์ˆ˜)"
FT-8B:       "์‹œยท๋„์ง€์‚ฌ ํ—ˆ๊ฐ€๋งŒ์œผ๋กœ ๊ฐ€๋Šฅ"  โ† ํ•ต์‹ฌ ๋‹จ์„œ ๋ˆ„๋ฝ
Non-FT 14B:  RAG ๋ฌธ๋งฅ์—์„œ ๋‘ ์กฐ๊ฑด์„ ๋ชจ๋‘ ์ •ํ™•ํžˆ ์ถ”์ถœ

โ‘ค RAG ๋ฌธ๋งฅ ๋ฌด์‹œ (Context Bypass)

[๋™์ผ RAG ์ปจํ…์ŠคํŠธ ์ œ๊ณต ์ƒํ™ฉ]
Non-FT 8B:  RAG ๋‚ด์šฉ ์ •ํ™•ํžˆ ์ฐธ์กฐ โ†’ โœ…
Non-FT 14B: RAG ๋‚ด์šฉ ์ •ํ™•ํžˆ ์ฐธ์กฐ โ†’ โœ…
FT-8B:      ๋‚ด๋ถ€ ํ•™์Šต ํŒจํ„ด ์šฐ์„ , RAG ์ปจํ…์ŠคํŠธ ๋ฌด์‹œ โ†’ โŒ

โ†’ ํŒŒ์ธํŠœ๋‹์œผ๋กœ ๋‚ด์žฅ๋œ ํŽธํ–ฅ์ด RAG์˜ ํšจ๊ณผ๋ฅผ ์•ฝํ™”์‹œํ‚ด

3.5 CoT ํŒŒ์ธํŠœ๋‹(v5 Q8)์ด ๊ฐ€์ ธ์˜จ ๋ณ€ํ™”

CoT ๋ฐฉ์‹์˜ ํ›„์† ํŒŒ์ธํŠœ๋‹(v5, Q8 ์–‘์žํ™”)์€ +17%p ๊ฐœ์„ ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋‚˜ ์ƒˆ๋กœ์šด ๋ฌธ์ œ๋ฅผ ๋„์ž…ํ–ˆ๋‹ค.

๊ฐœ์„ ๋œ ์‚ฌํ•ญ:

  • ๊ธ์ •/๋ถ€์ • ์‘๋‹ต ๋ถˆ์ผ์น˜: 3๊ฑด โ†’ 1๊ฑด (67% ๊ฐ์†Œ)
  • ๋ ˆ๋ฒจ ๊ฐœ๋… ํ˜ผ๋™ (Q7) ํ•ด์†Œ: โŒ โ†’ โœ…
  • Q8(์†ํ•ด๋ฐฐ์ƒ) โ€” 4๊ฐœ ๋ชจ๋ธ ์ค‘ ์œ ์ผํ•˜๊ฒŒ ์ •๋‹ต: Non-FT 8B/14B๋„ ์˜ค๋‹ต์ธ ๊ณ ๋‚œ๋„ ๋ฒ•์  ํ•ด์„ ์งˆ๋ฌธ์—์„œ CoT ํ•™์Šต์˜ ์ด์ ์„ ๋ฐœํœ˜

์ƒˆ๋กœ ๋ฐœ์ƒํ•œ ๋ฌธ์ œ:

๋ฌธ์ œ ์œ ํ˜• ์„ค๋ช… ์‚ฌ๋ก€
๋ฐ˜๋ณต ๋ฃจํ”„ CoT long-form ์ƒ์„ฑ ์ค‘ ์ข…๋ฃŒ ํ† ํฐ ์ธ์‹ ์‹คํŒจ๋กœ "์ฐธ๊ณ ๋ฌธ์„œ 1"์ด 89ํšŒ ๋ฐ˜๋ณต Q5
๊ต์ฐจ ์˜ค์—ผ "์ž„์‹œ์šดํ–‰" ํ‚ค์›Œ๋“œ๋กœ ๋‹ค๋ฅธ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ(์†Œํ”„ํŠธ์›จ์–ด ๋ณ€๊ฒฝ ์‹ ๊ณ ) ๋‚ด์šฉ์„ ์ž˜๋ชป ๋งค์นญ Q12

CoT์˜ ์œ ์‚ฌ๋„๋ณ„ ์–‘๋ฉด์„ฑ:

์œ ์‚ฌ๋„ ๋†’์€ ์งˆ๋ฌธ:  +34~50%p ๊ฐœ์„  (ํ•™์Šต๋œ reasoning chain ์ง์ ‘ ํ™œ์šฉ)
์œ ์‚ฌ๋„ ๋‚ฎ์€ ์งˆ๋ฌธ:   -10%p  ์•…ํ™” (๊ต์ฐจ ์˜ค์—ผ์œผ๋กœ ์˜คํžˆ๋ ค ์ƒˆ ์˜ค๋ฅ˜ ๋ฐœ์ƒ)

4. ๋ถ€์ˆ˜์  ๊ธ์ • ๋ฐœ๊ฒฌ: QnA ์ž„๋ฒ ๋”ฉ์˜ RAG ์„ฑ๋Šฅ ํ–ฅ์ƒ

4.1 ๋ฐœ๊ฒฌ ๋‚ด์šฉ

๋ณธ ์‹คํ—˜์—์„œ RAG ๋ฒกํ„ฐ DB๋ฅผ ๊ตฌ์„ฑํ•  ๋•Œ โ‘ ๋ฒ•๋ น ์›๋ฌธ TXT์™€ ํ•จ๊ป˜ โ‘กํŒŒ์ธํŠœ๋‹์— ์‚ฌ์šฉํ•œ QnA ๋ฐ์ดํ„ฐ์…‹(750์Œ)์„ ๋™์‹œ์— ์ž„๋ฒ ๋”ฉํ•˜์˜€๋‹ค. ์ด ๊ตฌ์„ฑ ํ•˜์—์„œ Non-FT ๋ชจ๋ธ๋“ค์ด 90%๋ผ๋Š” ๋†’์€ ์ •๋‹ต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜์˜€์œผ๋ฉฐ, QnA ์ž„๋ฒ ๋”ฉ์ด ์‘๋‹ต ํ’ˆ์งˆ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•œ ๊ฒƒ์œผ๋กœ ํŒ๋‹จ๋œ๋‹ค.

QnA ๋ฐ์ดํ„ฐ์…‹์˜ ์ž„๋ฒ ๋”ฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ด์ ์„ ์ œ๊ณตํ•œ๋‹ค:

์ด์  ์„ค๋ช…
์งˆ๋ฌธ-๋‹ต๋ณ€ ์Œ ์ง์ ‘ ๊ฒ€์ƒ‰ ์œ ์‚ฌ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ •๋‹ต ํŒจํ„ด์„ RAG ์ปจํ…์ŠคํŠธ๋กœ ์ง์ ‘ ์ œ๊ณต
๋ฒ•๋ น ์›๋ฌธ ๋ณด์™„ ์›๋ฌธ ์ž์ฒด๋Š” ์กฐ๋ฌธ ํ˜•์‹์ด๋ผ RAG ์ฒญํฌ๊ฐ€ ์งˆ๋ฌธ์— ์ง์ ‘ ๋Œ€์‘ํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ, QnA๊ฐ€ ์˜๋ฏธ์  ์—ฐ๊ฒฐ ์—ญํ• 
๊ฐœ๋… ๊ฒฝ๊ณ„ ๋ช…์‹œ "๋น„์ƒ์šดํ–‰ vs ์œ„ํ—˜์ตœ์†Œํ™”์šดํ–‰" ๊ฐ™์€ ์œ ์‚ฌ ๊ฐœ๋… ๊ตฌ๋ถ„์„ ๋ช…์‹œ์ ์œผ๋กœ ์„œ์ˆ ํ•œ QnA๊ฐ€ ๊ฒ€์ƒ‰๋จ์œผ๋กœ์จ ์˜ค๋‹ต ์œ ๋„ ๋ฐฉ์ง€

4.2 ์‹ค์šฉ์  ํ•จ์˜

ํŒŒ์ธํŠœ๋‹๋ณด๋‹ค ๋น„์šฉ ๋Œ€๋น„ ํšจ๊ณผ๊ฐ€ ๋†’์€ ๋Œ€์•ˆ:

[ํŒŒ์ธํŠœ๋‹ ์ ‘๊ทผ]                     [QnA ์ž„๋ฒ ๋”ฉ ์ ‘๊ทผ]
GPU ํ•™์Šต (์ˆ˜ ์‹œ๊ฐ„)                  QnA ์ƒ์„ฑ (์ˆ˜์‹ญ ๋ถ„)
๋ชจ๋ธ ๊ฐ€์ค‘์น˜ ๋ณ€ํ˜•                     ๋ชจ๋ธ ๊ฐ€์ค‘์น˜ ๋ณด์กด
RAG ๋ฌด์‹œ ๊ฒฝํ–ฅ ๋„์ž…                   RAG ํ™œ์šฉ ๊ทน๋Œ€ํ™”
์—…๋ฐ์ดํŠธ ์‹œ ์žฌํ•™์Šต ํ•„์š”               ๋ฐ์ดํ„ฐ ์ถ”๊ฐ€๋กœ ์ฆ‰์‹œ ์—…๋ฐ์ดํŠธ
โ†’ 43~60% ์„ฑ๋Šฅ                      โ†’ 90% ์„ฑ๋Šฅ (Non-FT + QnA RAG)

๊ถŒ๊ณ : ๋„๋ฉ”์ธ ํŠนํ™” ์‘๋‹ต ์„ฑ๋Šฅ ๊ฐœ์„ ์ด ๋ชฉํ‘œ๋ผ๋ฉด, ํŒŒ์ธํŠœ๋‹์— ์•ž์„œ ๊ณ ํ’ˆ์งˆ QnA ๋ฐ์ดํ„ฐ์…‹์„ RAG ๋ฒกํ„ฐ DB์— ํ•จ๊ป˜ ์ž„๋ฒ ๋”ฉํ•˜๋Š” ๋ฐฉ์‹์„ ์šฐ์„  ๊ฒ€ํ† ํ•  ๊ฒƒ์„ ๊ถŒ์žฅํ•œ๋‹ค.


5. ์ข…ํ•ฉ ๋ชจ๋ธ ๋น„๊ต ๋งคํŠธ๋ฆญ์Šค

ํ‰๊ฐ€ ์ถ• FT-8B(Q4) FT-8B(Q8/CoT) Non-FT 8B Non-FT 14B
์ •๋‹ต๋ฅ  43% 60% 90% 90%
๊ฐœ๋… ๊ตฌ๋ถ„ ๋Šฅ๋ ฅ โŒ ํ˜ผ๋™ ๋นˆ๋ฐœ โš ๏ธ ๋ถ€๋ถ„ ๊ฐœ์„  โœ… ์–‘ํ˜ธ โœ… ์–‘ํ˜ธ
๊ธ์ •/๋ถ€์ • ์ผ๊ด€์„ฑ โŒ 3๊ฑด ๋ชจ์ˆœ โš ๏ธ 1๊ฑด ๋ชจ์ˆœ โœ… ์ผ๊ด€ โœ… ์ผ๊ด€
RAG ๋ฌธ๋งฅ ํ™œ์šฉ โŒ ๋ฌด์‹œ ๊ฒฝํ–ฅ โš ๏ธ ๋ถ€๋ถ„ ํ™œ์šฉ โœ… ์ถฉ๋ถ„ โœ… ์ถฉ๋ถ„
์ƒ์„ฑ ์•ˆ์ •์„ฑ โš ๏ธ ๊ฐ„ํ—์  โŒ ๋ฐ˜๋ณต ๋ฃจํ”„ โœ… ์•ˆ์ • โœ… ์•ˆ์ •
๊ณ ๋‚œ๋„ ๋ฒ•์  ํ•ด์„ โš ๏ธ โœ… Q8 ์œ ์ผ ์ •๋‹ต โŒ โŒ
VRAM ์š”๊ตฌ๋Ÿ‰ ~6 GB ~8 GB ~6 GB ~12 GB

6. ๊ณ ์ฐฐ (Discussion)

6.1 ์™œ ํŒŒ์ธํŠœ๋‹์ด ์ˆœ์ • ๋ชจ๋ธ๋ณด๋‹ค ๋‚˜๋นด๋Š”๊ฐ€

RAG ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์—์„œ์˜ ํŒŒ์ธํŠœ๋‹ ์—ญํšจ๊ณผ:

๊ธฐ๋Œ€ ํšจ๊ณผ ์‹ค์ œ ๊ฒฐ๊ณผ
๋„๋ฉ”์ธ ์ง€์‹ ๋‚ด์žฌํ™” RAG๊ฐ€ ์ด๋ฏธ ๊ณ ํ’ˆ์งˆ ์ปจํ…์ŠคํŠธ ์ œ๊ณต โ†’ ํŒŒ์ธํŠœ๋‹ ์ง€์‹์ด ์ค‘๋ณตยท์ถฉ๋Œ
์ผ๊ด€๋œ ์ถœ๋ ฅ ํ˜•์‹ ํŠน์ • "์•„๋‹™๋‹ˆ๋‹ค + ์„ค๋ช…" ํŒจํ„ด์œผ๋กœ ๊ณผ์ ํ•ฉ โ†’ ํ˜•์‹ ๊ณ ์ •, ๋‚ด์šฉ ์˜ค๋ฅ˜
์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€ ์ถ”๋ก  ์ผ๋ถ€ ๊ฐœ์„ (+17%p CoT), ๊ทธ๋Ÿฌ๋‚˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ๋™์‹œ ์†์‹ค
RAG ๋ฌธ์„œ ์ •ํ™• ํ™œ์šฉ ํ•™์Šต๋œ ํŒจํ„ด์ด ์šฐ์„ ๋˜์–ด ์˜คํžˆ๋ ค RAG ํ™œ์šฉ ๊ฐ์†Œ

๊ทผ๋ณธ ์›์ธ: 750๊ฐœ์˜ QnA๊ฐ€ 5์—ํฌํฌ ๋ฐ˜๋ณต ํ•™์Šต๋˜๋ฉด์„œ ํŠน์ • ์งˆ๋ฌธ-์‘๋‹ต ํŒจํ„ด์— ๊ณผ์ ํ•ฉ์ด ๋ฐœ์ƒํ–ˆ๋‹ค. ๋ชจ๋ธ์€ ์งˆ๋ฌธ์˜ ๋…ผ๋ฆฌ์  ๊ตฌ์กฐ๋ฅผ ์ดํ•ดํ•˜๊ธฐ๋ณด๋‹ค "์ด๋Ÿฐ ํ‚ค์›Œ๋“œ๊ฐ€ ๋‚˜์˜ค๋ฉด โ†’ ์ด๋Ÿฐ ํŒจํ„ด์œผ๋กœ ์‘๋‹ต"์ด๋ผ๋Š” ์—ฐ๊ด€ ๋งคํ•‘์„ ํ•™์Šตํ•œ ๊ฒƒ์œผ๋กœ ๋ณด์ธ๋‹ค.

6.2 ์ˆœ์ • 8B์™€ 14B๊ฐ€ ๋™์ผํ•œ ์ด์œ 

๋น„ํŒŒ์ธํŠœ๋‹ 8B์™€ 14B๊ฐ€ ๋™์ผํ•œ 90%๋ฅผ ๊ธฐ๋กํ–ˆ๋‹ค๋Š” ์ ์€, ํ˜„์žฌ RAG ํŒŒ์ดํ”„๋ผ์ธ์˜ ํ’ˆ์งˆ์ด ์ถฉ๋ถ„ํžˆ ๋†’์•„์„œ ๋ชจ๋ธ ํฌ๊ธฐ ์ฐจ์ด๊ฐ€ ์‘๋‹ต ํ’ˆ์งˆ์— ํฐ ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋Š” ์ž„๊ณ„์ ์— ๋„๋‹ฌํ–ˆ์Œ์„ ์‹œ์‚ฌํ•œ๋‹ค. BGE-M3์˜ ๋†’์€ ์ž„๋ฒ ๋”ฉ ํ’ˆ์งˆ๊ณผ MMR ๊ธฐ๋ฐ˜ ๋‹ค์–‘์„ฑ ๊ฒ€์ƒ‰์ด ์ด ๊ฒฐ๊ณผ์— ๊ธฐ์—ฌํ•œ ๊ฒƒ์œผ๋กœ ํ•ด์„๋œ๋‹ค.

6.3 CoT ํŒŒ์ธํŠœ๋‹์˜ ์ž ์žฌ์  ๊ฐ€์น˜์™€ ํ•œ๊ณ„

CoT ๋ฐ์ดํ„ฐ(v5)๋Š” ๊ธ์ •์  ์‹ ํ˜ธ๋ฅผ ๋ณด์˜€๋‹ค(Q8 ๋‹จ๋… ์šฐ์œ„). ๊ทธ๋Ÿฌ๋‚˜ ์†Œ๊ทœ๋ชจ ๋ชจ๋ธ(8B)์—์„œ CoT๋ฅผ ์ ์šฉํ•  ๋•Œ์˜ ๊ณ ์œ ํ•œ ์œ„ํ—˜์ด ํ™•์ธ๋˜์—ˆ๋‹ค: EOS(์ข…๋ฃŒ) ํ† ํฐ ํ™•๋ฅ ์ด ๋‚ฎ์•„์ ธ ๋ฐ˜๋ณต ๋ฃจํ”„๊ฐ€ ๋ฐœ์ƒํ•˜๋ฉฐ, reasoning chain์ด ํ‘œ๋ฉด์  ํ‚ค์›Œ๋“œ์— ์˜์กดํ•˜์—ฌ ๊ต์ฐจ ์˜ค์—ผ์ด ์ผ์–ด๋‚œ๋‹ค. ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ(3,000๊ฐœ ์ด์ƒ)์™€ ๋‹ค์–‘ํ•œ ํ”„๋ ˆ์ด๋ฐ, ๊ทธ๋ฆฌ๊ณ  ๋ฐ˜๋ณต ์–ต์ œ ํŒจํ„ด์˜ ํ•™์Šต ์—†์ด๋Š” ์œ ํšจํ•œ ๊ฐœ์„ ์œผ๋กœ ์ด์–ด์ง€๊ธฐ ์–ด๋ ต๋‹ค.

6.4 ๋ฐฉ๋ฒ•๋ก ์  ์˜ค๋ฅ˜์˜ ์˜ํ–ฅ๊ณผ ์žฌ๋ฐœ ๋ฐฉ์ง€

์ดˆ๊ธฐ ๋น„๊ต ์‹คํ—˜์—์„œ ๋‘ ๋ชจ๋ธ์˜ ์‘๋‹ต์„ LLM ์ฑ„์  ์‹œ ์—ญ์ˆœ์œผ๋กœ ์ž…๋ ฅํ•˜๋Š” ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ–ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ์‹ค์ œ๋กœ๋Š” ์—ด์œ„์ธ FT ๋ชจ๋ธ์ด ์šฐ์œ„๋กœ ์ฑ„์ ๋˜์—ˆ์œผ๋ฉฐ, FT ๋ชจ๋ธ ์šฐ์œ„๋ผ๋Š” ์ž˜๋ชป๋œ ๊ฒฐ๋ก ์ด ๊ณตํ‘œ๋˜์—ˆ๋‹ค. ํ–ฅํ›„ ์‹คํ—˜์—์„œ๋Š” ์•„๋ž˜๋ฅผ ์˜๋ฌดํ™”ํ•œ๋‹ค:

  • ๋ชจ๋ธ ํƒœ๊ทธ๋ฅผ ์‘๋‹ต ๋กœ๊ทธ์— ๊ธฐ๊ณ„์ ์œผ๋กœ ๊ธฐ๋ก
  • ์ฑ„์  ์ „ ๋ชจ๋ธ-์‘๋‹ต ๋งคํ•‘ ์ด์ค‘ ๊ฒ€์ฆ
  • ๋™์ผ ์งˆ๋ฌธ์…‹/๋™์ผ ์ปจํ…์ŠคํŠธ/๋™์ผ ํŒŒ๋ผ๋ฏธํ„ฐ ์œ ์ง€
  • ์›๋ณธ ์‘๋‹ตยท์ฑ„์  ์›๋ฌธ ์•„์นด์ด๋ธŒ ๋ณด๊ด€

7. ๊ฒฐ๋ก 

7.1 ๊ฐ€์„ค ๊ฒ€์ฆ ๊ฒฐ๊ณผ

๊ฐ€์„ค H1 ๊ธฐ๊ฐ: ํ˜„์žฌ ์‹คํ—˜ ์กฐ๊ฑด์—์„œ QLoRA ํŒŒ์ธํŠœ๋‹๋œ 8B ๋ชจ๋ธ์€ ์ˆœ์ • 14B ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜์ง€ ๋ชปํ•œ๋‹ค.

์ตœ์„  ๊ฒฐ๊ณผ(FT-8B Q8/CoT) ๊ธฐ์ค€์œผ๋กœ๋„ **Non-FT 8B/14B ๋Œ€๋น„ 30%p ๋‚ฎ์€ ์„ฑ๋Šฅ(60% vs 90%)**์ด ์ธก์ •๋˜์—ˆ์œผ๋ฉฐ, ์ƒ์„ฑ ์•ˆ์ •์„ฑ ๋ฉด์—์„œ๋„ ์—ด์œ„๋ฅผ ๋ณด์˜€๋‹ค. ํ˜„์žฌ์˜ ์‹คํ—˜ ์„ค๊ณ„(์†Œ๊ทœ๋ชจ ๋‹จ์ˆœ QnA ๋ฐ์ดํ„ฐ์…‹ + ๋‹ค์ˆ˜ ์—ํฌํฌ)๋กœ๋Š” RAG ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์—์„œ ํŒŒ์ธํŠœ๋‹์„ ํ†ตํ•œ ๊ฒฝ๋Ÿ‰ํ™” ์ „๋žต์ด ์œ ํšจํ•˜์ง€ ์•Š์Œ์ด ํ™•์ธ๋˜์—ˆ๋‹ค.

7.2 ์œ ํšจํ•œ ๋ฐœ๊ฒฌ ์š”์•ฝ

๊ตฌ๋ถ„ ๋ฐœ๊ฒฌ ๋‚ด์šฉ
์ฃผ์š” ๋ถ€์ •์  ๋ฐœ๊ฒฌ RAG ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์—์„œ ์†Œ๊ทœ๋ชจ QLoRA ํŒŒ์ธํŠœ๋‹์€ ๋ชจ๋ธ์˜ RAG ํ™œ์šฉ ๋Šฅ๋ ฅ์„ ์ €ํ•˜์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค
์ฃผ์š” ๊ธ์ •์  ๋ฐœ๊ฒฌ ๋„๋ฉ”์ธ QnA ๋ฐ์ดํ„ฐ์…‹์„ RAG ๋ฒกํ„ฐ DB์— ํ•จ๊ป˜ ์ž„๋ฒ ๋”ฉํ•˜๋ฉด ์‘๋‹ต ํ’ˆ์งˆ์ด ํ–ฅ์ƒ๋œ๋‹ค
์ œํ•œ์  FT ๊ฐ€์น˜ CoT ํŒŒ์ธํŠœ๋‹์€ ๊ณ ๋‚œ๋„ ๋ฒ•์  ํ•ด์„ ์งˆ๋ฌธ์—์„œ ์ˆœ์ • ๋ชจ๋ธ์ด ํ‹€๋ฆฐ ๊ฒฝ์šฐ ๋” ์ •ํ™•ํ•  ์ˆ˜ ์žˆ๋‹ค
๋ฐฉ๋ฒ•๋ก  ๊ตํ›ˆ ์†Œ๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹ + ๋‹ค์ˆ˜ ์—ํฌํฌ์˜ ํŒŒ์ธํŠœ๋‹์€ ์งˆ๋ฌธ ํ”„๋ ˆ์ด๋ฐ ๋ณ€ํ™”์— ์ทจ์•ฝํ•œ ๊ณผ์ ํ•ฉ์„ ์œ ๋ฐœํ•œ๋‹ค

7.3 ์‹ค์šฉ์  ๊ถŒ๊ณ 

์ •ํ™•์„ฑ ์šฐ์„  ์‹œ๋‚˜๋ฆฌ์˜ค (๋ฒ•๋ น ํ•ด์„, ์ž๋ฌธ ๋“ฑ):

1์ˆœ์œ„: Non-FT 8B  + ๋„๋ฉ”์ธ QnA ์ž„๋ฒ ๋”ฉ RAG  (90%, ~6 GB VRAM, ๋น„์šฉ ์ตœ์ €)
2์ˆœ์œ„: Non-FT 14B + ๋„๋ฉ”์ธ QnA ์ž„๋ฒ ๋”ฉ RAG  (90%, ~12 GB VRAM, ๋‹ต๋ณ€ ์ƒ์„ธํ•จ)
๋น„๊ถŒ์žฅ: FT-8B Q8/CoT                         (60%, ์ƒ์„ฑ ๋ถˆ์•ˆ์ •)

โš ๏ธ ๋ณธ ๋ชจ๋ธ(v3)์„ ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ํŒ๋‹จ ๋กœ์ง, ๋ฒ•๋ฅ  ์ž๋ฌธ, ๋˜๋Š” ์•ˆ์ „ ํฌ๋ฆฌํ‹ฐ์ปฌ ์šฉ๋„๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์€ ๊ถŒ๊ณ ํ•˜์ง€ ์•Š๋Š”๋‹ค. ๋ณธ ์‹คํ—˜์€ ์—ฐ๊ตฌยทํ•™์Šต ๋ชฉ์ ์˜ ํƒ์ƒ‰์  ์‹คํ—˜์ด๋ฉฐ ๋ฐฐํฌ ์ค€๋น„๋œ ์‹œ์Šคํ…œ์ด ์•„๋‹ˆ๋‹ค.

7.4 ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

ํ˜„์žฌ ๊ฐ€์„ค์ด ๊ธฐ๊ฐ๋˜์—ˆ๋”๋ผ๋„ ์•„๋ž˜์˜ ์กฐ๊ฑด ํ•˜์—์„œ๋Š” ์žฌ๊ฒ€์ฆ ๊ฐ€์น˜๊ฐ€ ์žˆ๋‹ค:

์šฐ์„ ์ˆœ์œ„ ๊ฐœ์„  ๋ฐฉํ–ฅ ๊ทผ๊ฑฐ
1 RAG-Aware ํŒŒ์ธํŠœ๋‹: ํ•™์Šต ๋ฐ์ดํ„ฐ์— RAG ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ์ปจํ…์ŠคํŠธ๋กœ ํฌํ•จ FT๊ฐ€ RAG๋ฅผ ๋ฌด์‹œํ•˜๋Š” ๊ทผ๋ณธ ์›์ธ ํ•ด์†Œ
2 ์งˆ๋ฌธ ํ”„๋ ˆ์ด๋ฐ ๋‹ค์–‘ํ™”: ๋™์ผ ์งˆ๋ฌธ์„ ๊ธ์ •ํ˜•/๋ถ€์ •ํ˜•/์กฐ๊ฑดํ˜•์œผ๋กœ 3๋ฐฐ์ˆ˜ ์ƒ์„ฑ ํ…œํ”Œ๋ฆฟ ๊ณผ์ ํ•ฉ ๋ฐฉ์ง€
3 ์—ํฌํฌ ์ถ•์†Œ + ํ•™์Šต๋ฅ  ๊ฐ์†Œ (5โ†’2์—ํฌํฌ, 2e-4โ†’5e-5) ๊ณผ์ ํ•ฉ ์–ต์ œ
4 ๋ฐ์ดํ„ฐ์…‹ ๊ทœ๋ชจ ํ™•๋Œ€ (750โ†’3,000+๊ฐœ) ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ํ–ฅ์ƒ
5 ๋ฐ˜๋ณต ์–ต์ œ ํ•™์Šต ๋ฐ์ดํ„ฐ ํฌํ•จ CoT์˜ ๋ฐ˜๋ณต ๋ฃจํ”„ ๋ฐฉ์ง€

8. ์•Œ๋ ค์ง„ ํ•œ๊ณ„

ํ•œ๊ณ„ ์„ค๋ช…
ํ‰๊ฐ€ ๊ทœ๋ชจ 15๊ฐœ ์งˆ๋ฌธ์œผ๋กœ ํ‰๊ฐ€ โ€” ํ†ต๊ณ„์  ์œ ์˜์„ฑ ํ™•๋ณด๋ฅผ ์œ„ํ•ด 100๊ฐœ ์ด์ƒ์˜ ๋‹ค์–‘ํ•œ ์งˆ๋ฌธ์…‹ ํ•„์š”
๋‹จ์ผ ๋„๋ฉ”์ธ ์ž์œจ์ฃผํ–‰ ๋ฒ•๋ น์œผ๋กœ ํ•œ์ • โ€” ํƒ€ ๋„๋ฉ”์ธ์—์˜ ์ผ๋ฐ˜ํ™” ๋ถˆ๊ฐ€
ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ๋‹จ์ผ RTX 3080 Ti 12GB์—์„œ ์‹คํ—˜ โ€” ๋” ํฐ ๋ฐฐ์น˜/ํ•™์Šต๋ฅ  ํƒ์ƒ‰ ์ œํ•œ
RAG ์„ค๊ณ„ ๋ถ„๋ฆฌ ๋ถˆ๊ฐ€ QnA ์ž„๋ฒ ๋”ฉ ํšจ๊ณผ๋ฅผ ํŒŒ์ธํŠœ๋‹ ํšจ๊ณผ์™€ ์™„์ „ํžˆ ๋ถ„๋ฆฌํ•œ ๋Œ€์กฐ ์‹คํ—˜ ๋ฏธ์ˆ˜ํ–‰
๋‹จ์ผ ๋ฒ ์ด์Šค ๋ชจ๋ธ dnotitia/Smoothie-Qwen3-8B๋งŒ ์‚ฌ์šฉ โ€” ํƒ€ 8B ๋ชจ๋ธ๋กœ์˜ ์ผ๋ฐ˜ํ™” ๋ถˆ๋ช…
์ฑ„์ ์ž ์˜์กด LLM ์ฑ„์ ์— ์˜์กด โ€” ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€(๋ฒ•๋ฅ ๊ฐ€) ๊ต์ฐจ ์ฑ„์  ๋ฏธ์ˆ˜ํ–‰

๋ชจ๋ธ ์ •๋ณด

ํ•ญ๋ชฉ ๋‚ด์šฉ
๋ฒ ์ด์Šค ๋ชจ๋ธ dnotitia/Smoothie-Qwen3-8B
ํŒŒ์ธํŠœ๋‹ ๋ฐฉ๋ฒ• QLoRA (r=16, alpha=32, 5 ์—ํฌํฌ)
ํ•™์Šต ๋ฐ์ดํ„ฐ ์ž์œจ์ฃผํ–‰์ž๋™์ฐจ ๊ด€๋ จ ๋ฒ•๋ น QnA 750์Œ (DTRO ์Šคํƒ€์ผ)
์–ธ์–ด ํ•œ๊ตญ์–ด
๋ผ์ด์„ ์Šค Apache 2.0
์‹คํ—˜ ๋ชฉ์  ์—ฐ๊ตฌยทํƒ์ƒ‰์  ์‹คํ—˜ (๋ฐฐํฌ์šฉ ์•„๋‹˜)

๐Ÿ”— ๊ด€๋ จ ๋ฆฌ์†Œ์Šค

๋ฆฌ์†Œ์Šค ๋งํฌ
์‹คํ—˜์šฉ RAG ์ฑ—๋ด‡ (GitHub) Legal_RAG_Chatbot_Qdrant_BGE โ€” Qdrant DB ์‚ฌ์ „ ๊ตฌ์ถ• ํฌํ•จ, ์ฆ‰์‹œ ์‹คํ–‰ ๊ฐ€๋Šฅ
ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹ v3 (DTRO) HuggingFace Datasets
ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹ v5 (CoT) HuggingFace Datasets

๋ณธ ๋ณด๊ณ ์„œ๋Š” 2026-02-24 ์žฌ๊ฒ€ํ†  ๊ธฐ์ค€์œผ๋กœ ์ž‘์„ฑ๋˜์—ˆ์œผ๋ฉฐ, ์ดˆ๊ธฐ README(2026-02-21)์˜ ๊ฒฐ๊ณผ ๋ ˆ์ด๋ธ” ์˜ค๋ฅ˜๋ฅผ ํฌํ•จํ•œ ๋ชจ๋“  ์˜ค๋ฅ˜๋ฅผ ์ „๋ฉด ์ˆ˜์ •ํ•œ ์ตœ์ข…ํŒ์ž…๋‹ˆ๋‹ค.

Downloads last month
30
Safetensors
Model size
8B params
Tensor type
F16
ยท
Inference Providers NEW
This model isn't deployed by any Inference Provider. ๐Ÿ™‹ Ask for provider support

Model tree for bluejude10/Smoothie-Qwen3-8B-KR-Self-Driving-Legal-v3

Finetuned
Qwen/Qwen3-8B
Quantized
(8)
this model
Quantizations
1 model