pravnik v0.1-alpha — prvi slovenski pravni jezikovni model

Proof of concept. Ne uporabljajte za pravno svetovanje.

O modelu

pravnik v0.1-alpha je prvi odprtokodni jezikovni model, specializiran za slovensko pravo, in prvi pravni LLM za slovenščino sploh. Gre za QLoRA adapter na osnovi modela Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled, natreniran na procesiranih slovenskih sodnih odločbah.

Model razume strukturo pravnega razmišljanja, vendar haluciniira zakonske člene in zakone. To je pričakovana omejitev modela, ki je bil treniran izključno na instrukcijskih parih brez predhodnega treninga na literaturi.

Zmogljivosti

Model zna:

  • strukturirati pravni odgovor,
  • identificirati pravne institute,
  • tehtati argumente za in proti,
  • pisati v pravnem stilu (sodniškem),
  • razlikovati trditveno breme aktivne in pasivne stranke.

Omejitve — POZOR

  • Haluciniira zakonske člene — citira člene, ki ne obstajajo, ali navaja napačne številke,
  • Izmišljuje si zakone — navaja neobstoječe pravne akte,
  • Zamenjuje stare in nove zakone — citira ZOR (1978) namesto OZ (2001), ZZZDR namesto DZ (2017),
  • Preklaplja v angleščino — pri kompleksnejših vprašanjih razmišlja v angleščini,
  • Odgovori so včasih nepopolni — odrezani ali površni,
  • Ne pozna sodne prakse — ne citira dejanskih sodnih odločb.

Eval rezultat: 2.69/10 (na 50 vprašanjih iz 10 pravnih področij).

Kriterij Povprečje
pravilnost 2.56/10
stil 3.16/10
logika 2.98/10
argumentacija 2.02/10

Zakaj objavljam model z oceno 2.69/10?

Ker je to prvi korak. Cilj v0.1 je samo:

  1. dokaz, da SFT na procesiranih slovenskih sodbah model nauči pravno strukturo,
  2. transparentnost — poštena objava z dejanskimi rezultati,
  3. osnova za nadgradnjo.

Načrt razvoja

Nadaljnji razvoj modela je v teku. Naslednje verzije bodo vključevale dodatne treninge in izboljšave.

Tehnični podatki

  • Base model: Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled
  • Metoda: LoRA SFT (bf16)
  • Dataset: procesirane slovenske sodne odločbe
  • Format: LoRA adapter (uporabi z base modelom Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled)

Podatki o treningu

Model je natreniran na procesiranih slovenskih sodnih odločbah iz javno dostopne baze sodnapraksa.si.

Uporaba

Z Ollama (GGUF)

ollama run klemenKM/pravnik

S transformers + LoRA

from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

base = AutoModelForCausalLM.from_pretrained("Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled", device_map="auto")
model = PeftModel.from_pretrained(base, "klemenKM/pravnik-v01")
tokenizer = AutoTokenizer.from_pretrained("Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled")

Sistemski prompt

Priporočamo uporabo sistemskega prompta, ki modelu pove, da naj odgovarja kot slovenski pravni svetovalec v slovenščini.


Skladnost z Aktom EU o umetni inteligenci

Status modela

Ta model je QLoRA adapter (modifikacija) na osnovi splošnonamenskega modela Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled. V skladu s Smernicami Komisije o obsegu obveznosti za ponudnike GPAI modelov, modifikator postane ponudnik novega GPAI modela le, ko modifikacija porabi več kot eno tretjino računske zmogljivosti treniranja izvornega modela. Fine-tuning tega adapterja je porabil zanemarljivo količino računske zmogljivosti v primerjavi z izvornim modelom Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (ocenjeni compute za SFT: <10²⁰ FLOP, izvorni model presega indikativni kriterij 10²³ FLOP za GPAI model), zato po oceni ponudnika modifikacija očitno ne dosega indikativnega kriterija > 1/3 računske zmogljivosti treniranja izvornega modela in ponudnik tega adapterja ne obravnava kot nov GPAI model.

Ne glede na navedeno, ponudnik v nadaljevanju prostovoljno izpolnjuje obveznosti iz Akta EU o AI ter objavlja povzetek vsebin, uporabljenih za trening.

Odprtokodna izjema (člen 53(2))

Model je objavljen pod licenco Apache 2.0. Uteži LoRA adapterja in informacije o uporabi so objavljene skupaj z modelom. Arhitektura in uteži izvornega modela so javno dostopne na HuggingFace. Model ni monetiziran. Ob izpolnjenosti teh pogojev bi se ponudnik lahko skliceval na izvzetje iz obveznosti po členu 53(1)(a) in (b) — tehnična dokumentacija in informacije za downstream ponudnike. Ponudnik se na to izjemo ne opira izključno in prostovoljno objavlja tudi copyright policy po členu 53(1)(c) in javni povzetek po členu 53(1)(d). Ponudnik opozarja, da gre za LoRA adapter, ne za celovit model: base model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled distribuira Alibaba Group pod lastno licenco in z lastnim model cardom.

Skladnost z avtorskim pravom (člen 53(1)(c))

Odgovorna oseba: Klemen Kraigher Mišič, ponudnik modela.

Pravni status virov:

  • sodne odločbe (sodnapraksa.si) so javni pravni akti, ki na podlagi člena 5 Bernske konvencije in 8. člena ZASP ne uživajo avtorskopravnega varstva.
  • zakonodajni teksti so prav tako javni pravni akti brez avtorskopravnega varstva.

Postopek preverjanja virov:

  • pred zajemom podatkov je ponudnik preveril pravni status virov in ugotovil, da gre za uradne pravne akte.
  • sodnapraksa.si objavlja anonimizirane sodne odločbe na podlagi javnega pooblastila. Zakonodajni viri vsebujejo člene zakonov, objavljene v Uradnem listu RS.
  • preverjanje pridržanja pravice do TDM po členu 4(3) Direktive (EU) 2019/790: sodnapraksa.si in Uradni list RS ne vsebujeta strojno berljivega pridržanja pravic (robots.txt, metadata), niti v pogojih uporabe ni izrecnega pridržanja TDM pravice. Ker gre za javne pravne akte, se vprašanje pridržanja TDM pravice po mnenju ponudnika ne postavlja.

Pravila za bodoče trening/fine-tune: ob vsakem dodatnem treningu bo ponudnik ponovil preverjanje pravnega statusa novih virov in posodobil ta povzetek.

Obravnava zahtevkov imetnikov pravic: zahtevke naslovite prek klemen.ai. Ponudnik se zavezuje, da bo vsak utemeljen zahtevek obravnaval v 30 dneh.

Povzetek vsebin za trening (člen 53(1)(d))

Povzetek je pripravljen in objavljen v skladu s predlogo AI Urada EU za javni povzetek po členu 53(1)(d). Objavljen je na HuggingFace model page.

Ta povzetek se nanaša izključno na podatke, uporabljene za modifikacijo modela (SFT). Za izvorni model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled glejte originalni model card. Na dan objave ponudnik ni zasledil javno dostopnega javnega povzetka po členu 53(1)(d) za izvorni model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled.

Sekcija 1: splošne informacije

Polje Vsebina
Ponudnik Klemen Kraigher Mišič s.p.
Kontakt klemen.ai
Ime modela (verzija) pravnik v0.1-alpha
Datum dajanja na trg EU april 2026
Izvorni (base) model Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled (Apache 2.0)
Vrsta modifikacije QLoRA SFT
Modalitete v trening podatkih besedilo (text)
Ocenjena skupna velikost trening podatkov <1 GB (samo besedilo)
Ocenjeni FLOP za fine-tuning <10²⁰ (zanemarljivo v primerjavi z base modelom)
Energijska poraba za fine-tuning 1× NVIDIA H100 SXM 80GB, trajanje <24 h, ocenjena poraba <17 kWh

Sekcija 2: viri podatkov (samo za modifikacijo)

2.1 Javno dostopni nabori podatkov

Nabor podatkov Modaliteta Vir Metoda pridobitve Opis
Sodne odločbe RS besedilo https://www.sodnapraksa.si programski zajem iz javnega spletnega vmesnika javno dostopne, anonimizirane sodne odločbe sodišč RS; javni pravni akti

2.2 Podatki, pridobljeni s spletnim zajemom (web crawling/scraping)

Podatki iz sodnapraksa.si so bili pridobljeni s programskim zajemom (scraper) posameznih sodnih odločb prek javnega spletnega vmesnika. Zajem ni potekal z generičnim web crawlerjem (npr. CommonCrawl), temveč s ciljnim scraperjem, ki je zajemal le javne pravne akte.

2.3 Drugi viri podatkov

Ni uporabniških podatkov. Ni sintetičnih podatkov. Ni licenciranih podatkovnih zbirk tretjih oseb.

Sekcija 3: ukrepi glede avtorske pravice in nezakonite vsebine

3.1 Ukrepi glede pridržanja pravic (opt-out) po členu 4(3) Direktive (EU) 2019/790

  • Pred zajemom podatkov je ponudnik preveril robots.txt na sodnapraksa.si in spletnih virih zakonodaje — ni strojno berljivega pridržanja TDM pravice.
  • Pogoji uporabe sodnapraksa.si ne vsebujejo izrecnega pridržanja pravice do rudarjenja besedil in podatkov.
  • Trening podatki so sestavljeni izključno iz javnih pravnih aktov, ki po členu 5 Bernske konvencije in 8. členu ZASP ne uživajo avtorskopravnega varstva, zato se vprašanje pridržanja TDM pravice po mnenju ponudnika ne postavlja.
  • V primeru utemeljenega zahtevka imetnika pravic bo ponudnik ustrezne podatke odstranil iz dataseta in model ponovno natreniral.

3.2 Ukrepi za odstranitev nezakonite vsebine

Sodne odločbe so anonimizirane na viru (sodnapraksa.si). Posebnih ukrepov za odstranitev nezakonite vsebine ni bilo potrebno izvesti, saj gre za uradne pravne akte.

Opomba o kvaliteti podatkov: prvotni QA dataset je bil ocenjen z avtomatskim quality_score sistemom, vendar je empirična ocena (april 2026) pokazala šibko korelacijo med QS oznako in dejansko kakovostjo (Pearson r=0.28). Prihodnje verzije modela bodo trenirane na revidiranem datasetu.

Sistemsko tveganje

Model ne dosega praga računske zmogljivosti za presumpcijo sistemskega tveganja po členu 51(2) (prag: 10²⁵ FLOP; ocenjeni compute tega fine-tuninga: <10²⁰ FLOP). Na dan objave ni znane odločbe Komisije o označitvi tega modela kot sistemsko tveganega na podlagi ekvivalentnih zmogljivosti ali vpliva.

Režim posodabljanja

Ponudnik se zavezuje, da bo ta povzetek treninških vsebin posodobil:

  • ob vsakem dodatnem treningu ali materialni spremembi dataseta,
  • najkasneje vsakih 6 mesecev od zadnje posodobitve.

Zadnja posodobitev tega povzetka: april 2026.


Izjava o odgovornosti

Ta model je proof of concept za raziskovalne namene. Ni namenjen pravnemu svetovanju in ne nadomešča strokovnega pravnega mnenja. Avtor ne odgovarja za škodo, ki bi nastala z uporabo modela. Uporabniki so dolžni vsak output preveriti pri kvalificiranem pravniku.

Avtor

Klemen Kraigher Mišič, univ. dipl. prav., MBA, CDPSE (exp.)
AI full stack & personal data protection
klemen.ai

Citiranje

@misc{kraigher2026pravnik,
  title={pravnik v0.1-alpha: prvi slovenski pravni jezikovni model},
  author={Kraigher Mišič, Klemen},
  year={2026},
  url={https://huggingface.co/klemenKM/pravnik-v01},
  note={\url{https://klemen.ai}}
}

Licenca

Apache 2.0 — model in adapter sta prosto dostopna za uporabo, modificiranje in distribucijo.

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for klemenKM/pravnik-v01