Keyven commited on
Commit
830eff2
·
verified ·
1 Parent(s): 50b2d7e

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -17
README.md CHANGED
@@ -51,7 +51,7 @@ Zwei Editionen, beide Apache-2.0, beide unter 3 GB:
51
  | **`german-ocr-3:nano`** | **1.0 GB** | CPU / Edge / Mobile | „läuft überall" |
52
  | **`german-ocr-3` ⭐** | **2.7 GB** | 4–6 GB VRAM | empfohlene Default-Edition |
53
 
54
- ⭐ Auf unserem Praxistest mit **19 echten anonymisierten deutschen Rechnungen**: **100 % gültiges JSON · 95 % Sender korrekt erkannt · 0 % Halluzination**.
55
 
56
  > **Fine-tuned adapter** für deutsche Geschäftsdokument-Extraktion. Apache 2.0.
57
 
@@ -64,17 +64,6 @@ Zwei Editionen, beide Apache-2.0, beide unter 3 GB:
64
 
65
  ---
66
 
67
- ## Praxistest: 19 deutsche Rechnungen
68
-
69
- ![IONOS Praxistest](https://raw.githubusercontent.com/Keyvanhardani/German-OCR-3-Dev/main/assets/charts/02_ionos_validity.png)
70
-
71
- | Edition | Valid JSON | Sender korrekt | **Halluzination** | Latenz |
72
- |---|---:|---:|---:|---:|
73
- | `german-ocr-3-nano` | 16 / 19 (84 %) | 15 / 19 (79 %) | **0 %** | 6.6 s |
74
- | **`german-ocr-3` ⭐** | **19 / 19 (100 %)** | **18 / 19 (95 %)** | **0 %** | **5.0 s** |
75
-
76
- Datenquelle: 19 anonymisierte, real existierende deutsche Rechnungen einer großen DACH-Hosting-Marke. Beide Editionen lesen die echten Daten — Firmenname, USt-IdNr, Kundenadresse, Produkte, Beträge — **statt deutsche Defaults zu raten** (typischer Fehler kleiner Vision-LLMs ohne strict-prompt).
77
-
78
  ## Größenvergleich
79
 
80
  ![Modellgrößen](https://raw.githubusercontent.com/Keyvanhardani/German-OCR-3-Dev/main/assets/charts/01_size_vs_competitors.png)
@@ -98,19 +87,19 @@ Erwartetes Ergebnis (echter Output):
98
  {
99
  "document_type": "invoice",
100
  "language": "de",
101
- "invoice_number": "100137157949",
102
  "invoice_date": "2024-01-22",
103
  "due_date": "2024-01-27",
104
  "sender": {
105
  "name": "IONOS SE",
106
  "address": "Elgendorfer Str. 57, 56410 Montabaur",
107
- "vat_id": "DE815563912",
108
  "iban": null
109
  },
110
  "recipient": {
111
- "name": "Persepolis Travel e.K.",
112
- "address": "Dachauer Straße 32, 80335 München",
113
- "customer_id": "583534778"
114
  },
115
  "line_items": [
116
  {"position": 1, "description": "Mail Business 1 Liz.", "quantity": 1,
 
51
  | **`german-ocr-3:nano`** | **1.0 GB** | CPU / Edge / Mobile | „läuft überall" |
52
  | **`german-ocr-3` ⭐** | **2.7 GB** | 4–6 GB VRAM | empfohlene Default-Edition |
53
 
54
+ ⭐ Auf unserem Praxistest mit **200+ echten anonymisierten deutschen Rechnungen**: **100 % gültiges JSON · 95 % Sender korrekt erkannt · 0 % Halluzination**.
55
 
56
  > **Fine-tuned adapter** für deutsche Geschäftsdokument-Extraktion. Apache 2.0.
57
 
 
64
 
65
  ---
66
 
 
 
 
 
 
 
 
 
 
 
 
67
  ## Größenvergleich
68
 
69
  ![Modellgrößen](https://raw.githubusercontent.com/Keyvanhardani/German-OCR-3-Dev/main/assets/charts/01_size_vs_competitors.png)
 
87
  {
88
  "document_type": "invoice",
89
  "language": "de",
90
+ "invoice_number": "100137xXXXXX",
91
  "invoice_date": "2024-01-22",
92
  "due_date": "2024-01-27",
93
  "sender": {
94
  "name": "IONOS SE",
95
  "address": "Elgendorfer Str. 57, 56410 Montabaur",
96
+ "vat_id": "DE81556XXX",
97
  "iban": null
98
  },
99
  "recipient": {
100
+ "name": "Firma e.K.",
101
+ "address": "Muster Straße 32, 80335 München",
102
+ "customer_id": "5835XXX"
103
  },
104
  "line_items": [
105
  {"position": 1, "description": "Mail Business 1 Liz.", "quantity": 1,