pravnik v0.1-alpha — prvi slovenski pravni jezikovni model
Proof of concept. Ne uporabljajte za pravno svetovanje.
O modelu
pravnik v0.1-alpha je prvi odprtokodni jezikovni model, specializiran za slovensko pravo, in prvi pravni LLM za slovenščino sploh. Gre za QLoRA adapter na osnovi modela Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled, natreniran na procesiranih slovenskih sodnih odločbah.
Model razume strukturo pravnega razmišljanja, vendar haluciniira zakonske člene in zakone. To je pričakovana omejitev modela, ki je bil treniran izključno na instrukcijskih parih brez predhodnega treninga na literaturi.
Zmogljivosti
Model zna:
- strukturirati pravni odgovor,
- identificirati pravne institute,
- tehtati argumente za in proti,
- pisati v pravnem stilu (sodniškem),
- razlikovati trditveno breme aktivne in pasivne stranke.
Omejitve — POZOR
- Haluciniira zakonske člene — citira člene, ki ne obstajajo, ali navaja napačne številke,
- Izmišljuje si zakone — navaja neobstoječe pravne akte,
- Zamenjuje stare in nove zakone — citira ZOR (1978) namesto OZ (2001), ZZZDR namesto DZ (2017),
- Preklaplja v angleščino — pri kompleksnejših vprašanjih razmišlja v angleščini,
- Odgovori so včasih nepopolni — odrezani ali površni,
- Ne pozna sodne prakse — ne citira dejanskih sodnih odločb.
Eval rezultat: 2.69/10 (na 50 vprašanjih iz 10 pravnih področij).
| Kriterij | Povprečje |
|---|---|
| pravilnost | 2.56/10 |
| stil | 3.16/10 |
| logika | 2.98/10 |
| argumentacija | 2.02/10 |
Zakaj objavljam model z oceno 2.69/10?
Ker je to prvi korak. Cilj v0.1 je samo:
- dokaz, da SFT na procesiranih slovenskih sodbah model nauči pravno strukturo,
- transparentnost — poštena objava z dejanskimi rezultati,
- osnova za nadgradnjo.
Načrt razvoja
Nadaljnji razvoj modela je v teku. Naslednje verzije bodo vključevale dodatne treninge in izboljšave.
Tehnični podatki
- Base model: Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled
- Metoda: LoRA SFT (bf16)
- Dataset: procesirane slovenske sodne odločbe
- Format: LoRA adapter (uporabi z base modelom Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled)
Podatki o treningu
Model je natreniran na procesiranih slovenskih sodnih odločbah iz javno dostopne baze sodnapraksa.si.
Uporaba
Z Ollama (GGUF)
ollama run klemenKM/pravnik
S transformers + LoRA
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
base = AutoModelForCausalLM.from_pretrained("Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled", device_map="auto")
model = PeftModel.from_pretrained(base, "klemenKM/pravnik-v01")
tokenizer = AutoTokenizer.from_pretrained("Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled")
Sistemski prompt
Priporočamo uporabo sistemskega prompta, ki modelu pove, da naj odgovarja kot slovenski pravni svetovalec v slovenščini.
Skladnost z Aktom EU o umetni inteligenci
Status modela
Ta model je QLoRA adapter (modifikacija) na osnovi splošnonamenskega modela Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled. V skladu s Smernicami Komisije o obsegu obveznosti za ponudnike GPAI modelov, modifikator postane ponudnik novega GPAI modela le, ko modifikacija porabi več kot eno tretjino računske zmogljivosti treniranja izvornega modela. Fine-tuning tega adapterja je porabil zanemarljivo količino računske zmogljivosti v primerjavi z izvornim modelom Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (ocenjeni compute za SFT: <10²⁰ FLOP, izvorni model presega indikativni kriterij 10²³ FLOP za GPAI model), zato po oceni ponudnika modifikacija očitno ne dosega indikativnega kriterija > 1/3 računske zmogljivosti treniranja izvornega modela in ponudnik tega adapterja ne obravnava kot nov GPAI model.
Ne glede na navedeno, ponudnik v nadaljevanju prostovoljno izpolnjuje obveznosti iz Akta EU o AI ter objavlja povzetek vsebin, uporabljenih za trening.
Odprtokodna izjema (člen 53(2))
Model je objavljen pod licenco Apache 2.0. Uteži LoRA adapterja in informacije o uporabi so objavljene skupaj z modelom. Arhitektura in uteži izvornega modela so javno dostopne na HuggingFace. Model ni monetiziran. Ob izpolnjenosti teh pogojev bi se ponudnik lahko skliceval na izvzetje iz obveznosti po členu 53(1)(a) in (b) — tehnična dokumentacija in informacije za downstream ponudnike. Ponudnik se na to izjemo ne opira izključno in prostovoljno objavlja tudi copyright policy po členu 53(1)(c) in javni povzetek po členu 53(1)(d). Ponudnik opozarja, da gre za LoRA adapter, ne za celovit model: base model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled distribuira Alibaba Group pod lastno licenco in z lastnim model cardom.
Skladnost z avtorskim pravom (člen 53(1)(c))
Odgovorna oseba: Klemen Kraigher Mišič, ponudnik modela.
Pravni status virov:
- sodne odločbe (sodnapraksa.si) so javni pravni akti, ki na podlagi člena 5 Bernske konvencije in 8. člena ZASP ne uživajo avtorskopravnega varstva.
- zakonodajni teksti so prav tako javni pravni akti brez avtorskopravnega varstva.
Postopek preverjanja virov:
- pred zajemom podatkov je ponudnik preveril pravni status virov in ugotovil, da gre za uradne pravne akte.
- sodnapraksa.si objavlja anonimizirane sodne odločbe na podlagi javnega pooblastila. Zakonodajni viri vsebujejo člene zakonov, objavljene v Uradnem listu RS.
- preverjanje pridržanja pravice do TDM po členu 4(3) Direktive (EU) 2019/790: sodnapraksa.si in Uradni list RS ne vsebujeta strojno berljivega pridržanja pravic (robots.txt, metadata), niti v pogojih uporabe ni izrecnega pridržanja TDM pravice. Ker gre za javne pravne akte, se vprašanje pridržanja TDM pravice po mnenju ponudnika ne postavlja.
Pravila za bodoče trening/fine-tune: ob vsakem dodatnem treningu bo ponudnik ponovil preverjanje pravnega statusa novih virov in posodobil ta povzetek.
Obravnava zahtevkov imetnikov pravic: zahtevke naslovite prek klemen.ai. Ponudnik se zavezuje, da bo vsak utemeljen zahtevek obravnaval v 30 dneh.
Povzetek vsebin za trening (člen 53(1)(d))
Povzetek je pripravljen in objavljen v skladu s predlogo AI Urada EU za javni povzetek po členu 53(1)(d). Objavljen je na HuggingFace model page.
Ta povzetek se nanaša izključno na podatke, uporabljene za modifikacijo modela (SFT). Za izvorni model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled glejte originalni model card. Na dan objave ponudnik ni zasledil javno dostopnega javnega povzetka po členu 53(1)(d) za izvorni model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled.
Sekcija 1: splošne informacije
| Polje | Vsebina |
|---|---|
| Ponudnik | Klemen Kraigher Mišič s.p. |
| Kontakt | klemen.ai |
| Ime modela (verzija) | pravnik v0.1-alpha |
| Datum dajanja na trg EU | april 2026 |
| Izvorni (base) model | Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (Apache 2.0) |
| Vrsta modifikacije | QLoRA SFT |
| Modalitete v trening podatkih | besedilo (text) |
| Ocenjena skupna velikost trening podatkov | <1 GB (samo besedilo) |
| Ocenjeni FLOP za fine-tuning | <10²⁰ (zanemarljivo v primerjavi z base modelom) |
| Energijska poraba za fine-tuning | 1× NVIDIA H100 SXM 80GB, trajanje <24 h, ocenjena poraba <17 kWh |
Sekcija 2: viri podatkov (samo za modifikacijo)
2.1 Javno dostopni nabori podatkov
| Nabor podatkov | Modaliteta | Vir | Metoda pridobitve | Opis |
|---|---|---|---|---|
| Sodne odločbe RS | besedilo | https://www.sodnapraksa.si | programski zajem iz javnega spletnega vmesnika | javno dostopne, anonimizirane sodne odločbe sodišč RS; javni pravni akti |
2.2 Podatki, pridobljeni s spletnim zajemom (web crawling/scraping)
Podatki iz sodnapraksa.si so bili pridobljeni s programskim zajemom (scraper) posameznih sodnih odločb prek javnega spletnega vmesnika. Zajem ni potekal z generičnim web crawlerjem (npr. CommonCrawl), temveč s ciljnim scraperjem, ki je zajemal le javne pravne akte.
2.3 Drugi viri podatkov
Ni uporabniških podatkov. Ni sintetičnih podatkov. Ni licenciranih podatkovnih zbirk tretjih oseb.
Sekcija 3: ukrepi glede avtorske pravice in nezakonite vsebine
3.1 Ukrepi glede pridržanja pravic (opt-out) po členu 4(3) Direktive (EU) 2019/790
- Pred zajemom podatkov je ponudnik preveril robots.txt na sodnapraksa.si in spletnih virih zakonodaje — ni strojno berljivega pridržanja TDM pravice.
- Pogoji uporabe sodnapraksa.si ne vsebujejo izrecnega pridržanja pravice do rudarjenja besedil in podatkov.
- Trening podatki so sestavljeni izključno iz javnih pravnih aktov, ki po členu 5 Bernske konvencije in 8. členu ZASP ne uživajo avtorskopravnega varstva, zato se vprašanje pridržanja TDM pravice po mnenju ponudnika ne postavlja.
- V primeru utemeljenega zahtevka imetnika pravic bo ponudnik ustrezne podatke odstranil iz dataseta in model ponovno natreniral.
3.2 Ukrepi za odstranitev nezakonite vsebine
Sodne odločbe so anonimizirane na viru (sodnapraksa.si). Posebnih ukrepov za odstranitev nezakonite vsebine ni bilo potrebno izvesti, saj gre za uradne pravne akte.
Opomba o kvaliteti podatkov: prvotni QA dataset je bil ocenjen z avtomatskim quality_score sistemom, vendar je empirična ocena (april 2026) pokazala šibko korelacijo med QS oznako in dejansko kakovostjo (Pearson r=0.28). Prihodnje verzije modela bodo trenirane na revidiranem datasetu.
Sistemsko tveganje
Model ne dosega praga računske zmogljivosti za presumpcijo sistemskega tveganja po členu 51(2) (prag: 10²⁵ FLOP; ocenjeni compute tega fine-tuninga: <10²⁰ FLOP). Na dan objave ni znane odločbe Komisije o označitvi tega modela kot sistemsko tveganega na podlagi ekvivalentnih zmogljivosti ali vpliva.
Režim posodabljanja
Ponudnik se zavezuje, da bo ta povzetek treninških vsebin posodobil:
- ob vsakem dodatnem treningu ali materialni spremembi dataseta,
- najkasneje vsakih 6 mesecev od zadnje posodobitve.
Zadnja posodobitev tega povzetka: april 2026.
Izjava o odgovornosti
Ta model je proof of concept za raziskovalne namene. Ni namenjen pravnemu svetovanju in ne nadomešča strokovnega pravnega mnenja. Avtor ne odgovarja za škodo, ki bi nastala z uporabo modela. Uporabniki so dolžni vsak output preveriti pri kvalificiranem pravniku.
Avtor
Klemen Kraigher Mišič, univ. dipl. prav., MBA, CDPSE (exp.)
AI full stack & personal data protection
klemen.ai
Citiranje
@misc{kraigher2026pravnik,
title={pravnik v0.1-alpha: prvi slovenski pravni jezikovni model},
author={Kraigher Mišič, Klemen},
year={2026},
url={https://huggingface.co/klemenKM/pravnik-v01},
note={\url{https://klemen.ai}}
}
Licenca
Apache 2.0 — model in adapter sta prosto dostopna za uporabo, modificiranje in distribucijo.
Model tree for klemenKM/pravnik-v01
Base model
Qwen/Qwen3.5-27B