Original work by Shantipriya Parida — maintained by OdiaGenAIOCR. For the original personal repo (LoRA adapters, checkpoints) see
shantipriya/odia-ocr-qwen-finetuned_v3.
Odia OCR — Qwen2.5-VL-7B LoRA Fine-tune (v3)
🚀 Live Demo:
Try the model interactively — no setup required.
A LoRA adapter fine-tuned on top of Qwen/Qwen2.5-VL-7B-Instruct for Odia script Optical Character Recognition (OCR).
The model is trained to extract printed and synthetic Odia text from paragraph-level document images.
Model Details
| Field | Value |
|---|---|
| Base model | Qwen/Qwen2.5-VL-7B-Instruct |
| Adapter type | LoRA (rank 16, alpha 32) |
| Task | Image → Odia text transcription |
| Script | Odia (ଓଡ଼ିଆ) |
| Training steps | 3 000 (completed — best checkpoint: step 1300/3000) |
| Batch size | 2 × gradient-accumulation 8 = effective 16 |
| Hardware | 1 × NVIDIA A100 80 GB |
| Framework | Transformers + PEFT + TRL |
LoRA Configuration
- Target modules:
q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj - Rank / Alpha: 16 / 32
- Dropout: 0.05
Training Data
Fine-tuned on a merged dataset of 58 720 image–text pairs from two sources:
| Dataset | Description |
|---|---|
| OdiaGenAIOCR/synthetic_data | Synthetically rendered Odia paragraph images |
| shantipriya/odia-ocr-merged | Merged cleaned Odia OCR dataset |
Images contain paragraph-level Odia text printed in varied fonts, sizes and layouts.
Usage
Checkpoint guide:
- Merged model —
shantipriya/odia-ocr-qwen-finetuned_v3-merged— fully merged weights, no PEFT required, easiest to usecheckpoint-1800— latest LoRA adapter (CER=0.750, Acc=25%)checkpoint-1300— ⭐ best LoRA adapter (CER=0.655, Acc=34.5%)
Option A — Merged Model (Easiest, No PEFT Required)
The fully merged model (base + LoRA-1800 baked in) is available as a standalone model:
from transformers import Qwen2_5_VLForConditionalGeneration, AutoProcessor
from qwen_vl_utils import process_vision_info
from PIL import Image
import torch
model = Qwen2_5_VLForConditionalGeneration.from_pretrained(
"shantipriya/odia-ocr-qwen-finetuned_v3-merged",
torch_dtype=torch.bfloat16,
device_map="auto",
)
processor = AutoProcessor.from_pretrained("shantipriya/odia-ocr-qwen-finetuned_v3-merged")
model.eval()
image = Image.open("odia_document.png").convert("RGB")
messages = [{
"role": "user",
"content": [
{"type": "image", "image": image},
{"type": "text", "text": "Transcribe all the Odia text from this image exactly as it appears."}
]
}]
text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
image_inputs, _ = process_vision_info(messages)
inputs = processor(text=[text], images=image_inputs, return_tensors="pt").to(model.device)
with torch.no_grad():
generated_ids = model.generate(**inputs, max_new_tokens=512)
output = processor.batch_decode(
generated_ids[:, inputs.input_ids.shape[1]:], skip_special_tokens=True
)[0]
print(output)
Option B — LoRA Adapter with Checkpoint-1800 (latest)
from transformers import Qwen2_5_VLForConditionalGeneration, AutoProcessor
from peft import PeftModel
from qwen_vl_utils import process_vision_info
from PIL import Image
import torch
REPO = "shantipriya/odia-ocr-qwen-finetuned_v3"
CHECKPOINT = "checkpoint-1800" # latest evaluated checkpoint
# Load base model
base = Qwen2_5_VLForConditionalGeneration.from_pretrained(
"Qwen/Qwen2.5-VL-7B-Instruct",
torch_dtype=torch.bfloat16,
device_map="auto"
)
# Load LoRA adapter — checkpoint-1800
model = PeftModel.from_pretrained(base, REPO, revision=CHECKPOINT)
processor = AutoProcessor.from_pretrained(REPO, revision=CHECKPOINT)
model.eval()
# Run OCR on an image
image = Image.open("odia_document.png").convert("RGB")
messages = [{
"role": "user",
"content": [
{"type": "image", "image": image},
{"type": "text", "text": "Transcribe all the Odia text from this image exactly as it appears."}
]
}]
text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
image_inputs, video_inputs = process_vision_info(messages)
inputs = processor(
text=[text],
images=image_inputs,
return_tensors="pt"
).to(model.device)
with torch.no_grad():
generated_ids = model.generate(**inputs, max_new_tokens=512)
output = processor.batch_decode(
generated_ids[:, inputs.input_ids.shape[1]:],
skip_special_tokens=True
)[0]
print(output)
Option C — LoRA Adapter with Checkpoint-1300 (⭐ best accuracy)
To load the best-performing checkpoint instead, replace the two lines above with:
CHECKPOINT = "checkpoint-1300" # best checkpoint — CER=0.655, Acc=34.5%
model = PeftModel.from_pretrained(base, REPO, revision=CHECKPOINT)
processor = AutoProcessor.from_pretrained(REPO, revision=CHECKPOINT)
Training Metrics
Training loss drops sharply as the model adapts to Odia OCR:
| Step | Train Loss | CER (5 samples) | Accuracy (1 − CER) | Eval dataset |
|---|---|---|---|---|
| 0 (baseline) | — | 0.861 | 13.9 % | word-level |
| 25 | 0.797 | — | — | — |
| 50 | 0.673 | — | — | — |
| 75 | 0.447 | — | — | — |
| 100 | 0.295 | 0.603 | 39.7 % | word-level |
| 125 | 0.223 | — | — | — |
| 150 | 0.185 | — | — | — |
| 175 | 0.159 | — | — | — |
| 200 | 0.138 | 0.504 | 49.6 % | word-level |
| 225 | 0.134 | — | — | — |
| 250 | 0.120 | — | — | — |
| 275 | 0.119 | — | — | — |
| 300 | 0.110 | 0.763 | 23.7 % | paragraph-level† |
| 400 | 0.072 | — | — | — |
| 500 | 0.070 | — | — | — |
| 600 | 0.054 | — | — | — |
| 700 | 0.047 | — | — | — |
| 800 | 0.043 | — | — | — |
| 900 | 0.034 | 0.804 | 19.6% | paragraph-level |
| 1000 | ~0.030 | 0.863 | 13.7% | paragraph-level |
| 1100 | — | — | — | — |
| 1200 | — | — | — | — |
| 1300 | — | 0.655 | 34.5% | paragraph-level |
| 1400 | 0.015 | 0.690 | 31.0% | paragraph-level |
| 1500 | 0.012 | 0.690 | 31.0% | paragraph-level |
| 1600 | 0.010 | 0.758 | 24.2% | paragraph-level |
| 1700 | ~0.009 | 0.912 | 8.8% | paragraph-level |
| 1800 | 0.0085 | 0.750 | 25.0% | paragraph-level |
⚠️ Overfitting note: Best checkpoint is 1300 (CER=0.655, Acc=34.5%). Performance degrades after step 1300 despite training loss continuing to drop.
Benchmark CER & Accuracy vs Checkpoint
Checkpoints are pushed every 100 training steps.
Accuracy is reported as 1 − CER (character-level).
⚠️ Eval dataset note: Steps 0/100/200 used word-level images (shantipriya/odia-ocr-merged, single words), which yields lower CER. Step 300 used paragraph-level images (OdiaGenAIOCR/synthetic_data, full paragraphs, ~300 chars) — a much harder task. The lower accuracy at step 300 reflects the harder benchmark, not regression. Full paragraph-level evaluation will be the standard going forward.
Per-category Accuracy: Best (ckpt-1300) vs Latest (ckpt-1800)
Accuracy per OCR category — comparing the best checkpoint (ckpt-1300) against the latest checkpoint (ckpt-1800).
Handwritten and Scene Text categories show the strongest performance; Book and Newspaper remain the hardest.
🖼️ Sample Outputs — Checkpoint 1300 (⭐ Best)
Six real examples from the Iftesha/odia-ocr-benchmark dataset (out-of-domain).
Quality: ✅ Good (CER < 0.15) · 🔶 Mixed (CER 0.15–0.65) · ❌ Poor (CER > 0.65)
✅ Sample 1 — Motivational Quote (Digital) · Acc: 98.2% · CER: 0.018
| Text | |
|---|---|
| Ground Truth | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ। ସେହି ଲୋକଙ୍କୁ ଭୁଲିଯାନ୍ତୁ ଯିଏ ତୁମର ଭାବନା କୁ ବୁଝି ପାରେନି। ନିଜ ଭୁଲ୍ କୁ ସ୍ଵୀକାର କରନ୍ତୁ। ପୁନର୍ବାର ନିଜ ଜୀବନକୁ ଆରମ୍ଭ କରନ୍ତୁ ଆଉ ନିଜ ଇଚ୍ଛା ରେ ବଞ୍ଚନ୍ତୁ। |
| Prediction | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ. ସେହି ଲୋକଙ୍କୁ ଭୁଲିଯାନ୍ତୁ ଯିଏ ତୁମର ଭାବନା କୁ ବୁଝି ପାରେନି. ନିଜ ଭୁଲ କୁ ସ୍ଵୀକାର କରନ୍ତୁ. ପୁନର୍ବାର ନିଜ ଜୀବନକୁ ଆରମ୍ଭ କରନ୍ତୁ ଆଉ ନିଜ ଇଚ୍ଛା ରେ ବଞ୍ଚନ୍ତୁ. |
Full text reproduced correctly — only Odia danda (।) replaced by period (.) and minor spacing differences.
✅ Sample 2 — Poem "ମାଆ" / Mother (Digital) · Acc: 92.9% · CER: 0.071
| Text | |
|---|---|
| Ground Truth | " ମାଆ " ଅମାବାସ୍ଯାର ଅନ୍ଧକାରରେ ଥିଲି ମୁଁ ଦୁନିଆଁର ଆଲୋକ ଦେଖାଇଲୁ ତୁ ଦଶ ମାସ ଦଶ ଦିନ ଗର୍ଭରେ ଧରି ସଙ୍ସାର ରେ ଜନମ ଦେଲୁ ତୁ । ଯାହା ମୁଁ ହୋଇଛି ଯାହା ମୁଁ ପାଇଛି ସବୁ ତ ତୋହରି ପାଇଁ ନାହିଁ ତୋର ସମ ଏ ସାରା ଜଗତେ ତୋହରି ତୁଳନା ନାହିଁ । |
| Prediction | ମାଆ ଅମାଦାସ୍ଯାର ଅନ୍ଧକାରରେ ଥିଲି ମୁଁ ଦୁନିଆଁର ଆଲୋକ ଦେଖାଇଛୁ ତୁ ଦଶ ମାସ ଦଶ ଦିନ ଗର୍ଜରେ ଧରି ସଙ୍ସାର ରେ ଜନମ ଦେଲୁ ତୁ । ଯାହା ମୁଁ ହୋଇଛି ଯାହା ମୁଁ ପାଇଛି ସବୁ ତ ତୋହରି ପାଈଁ ନାହିଁ ତୋର ସମ ଏ ସାରା ଜଗତେ ତୋହରି ତୁଳନା ନାହିଁ । |
All 8 stanzas captured. Minor errors: quoted title dropped, ଅମାବାସ୍ଯାର → ଅମାଦାସ୍ଯାର, linebreaks flattened into a single paragraph.
✅ Sample 3 — Poem "ସମଯର ଖେଳ" / Game of Time (Digital) · Acc: 91.0% · CER: 0.090
| Text | |
|---|---|
| Ground Truth | ସମଯର ଖେଳ ସମଯ ଗଢ଼ି ଚାଲିଛି ଧୀରେଧୀରେ ଅପେକ୍ଷା ନାହିଁ କାହାକୁ ଜନମିଲେ ମର୍ତ୍ତ୍ଯ ମୃତ୍ଯୁ ନିଶ୍ଚିତରେ ରୁଛ କାହିଁ ମୃତ୍ଯୁକୁ ।। ବନ୍ଧାପଢ଼ି ଅଛୁ ତୁ ମୋହ ମାଯାରେ ଭୁଲିଗଲୁ ସତ୍ଯତାକୁ ଏକା ତୁ ଆସିଛୁ ଏକା ଫେରିବୁରେ ଧରିଛୁ ମୋହ ମାଯାକୁ ।। |
| Prediction | ସମଯର ଗୋଳ ସମଯ ଗଢ଼ି ଚାଲିଛି ଧୂରେଧୂରେ ଅପେଷା ନାହିଁ କାହାକୁ ଜନମିଲେ ମର୍ତ୍ତେ ମୃତ୍ଯୁ ନିଶ୍ଚିତରେ ଉତ୍ତ୍ରଛ କାହିଁ ମୃତ୍ଯୁକୁ ।। ଦନ୍ଧାପଢ଼ି ଅଛୁ ତୁ ମୋହ ମାଯାରେ ଭୁଲିଗଲୁ ସତ୍ଯତାକୁ ଏକା ତୁ ଆସିଛୁ ଏକା ଫେରିବୁରେ ଧରିଛୁ ମୋହ ମାଯାକୁ ।। |
All 4 stanzas transcribed. Title ଖେଳ → ଗୋଳ, ଧୀରେଧୀରେ → ଧୂରେଧୂରେ; complex conjunct characters partially misread.
🔶 Sample 4 — News Digest Graphic (Digital) · Acc: 76.1% · CER: 0.239
| Text | |
|---|---|
| Ground Truth | ଆଜି ସନ୍ଧ୍ଯାର 20 ବଢ଼ ଖବର ସ୍କୁଲ ଖୋଲିବା ଓ ବନ୍ଦ ସମଯ ବଦଳିଲା ଭତ୍ତା କୁ ନେଇ 2 ବଢ଼ ଘୋଷଣା ସୁଭଦ୍ରା ଟଙ୍କା ବଢ଼ ଘୋଷଣା ଦେଖନ୍ତୁ ଏବେ ମିଳିବ କିଷାନ 2000 ବଢ଼ିଲା ଭତ୍ତା ଟଙ୍କା ସୁଭଦ୍ରା ଯୋଜନା ନେଇ ବଢ଼ ଖବର |
| Prediction | ଆନ୍ଦ୍ର ସନ୍ଧ୍ଯାର 20 ବଢ଼ ଖବର ସୁଲ ଗୋଳିବା ଓ ବନ୍ଦ ସମଯ ବଦଳିଲା ଭଉଆ କୁ ନେଇ 2 ବଢ଼ ଘୋଷଣା ସୁତଦ୍ଧା ଟଙ୍କା ବଢ଼ ଘୋଷଣା ଦେଖନୁ ଏବେ ମିଳିବ କିଣାନ 2000 ଗୃହିଳା ସୁତଦ୍ଧା ଶୋଚନା ନେଇ ବଢ଼ ଖବର |
Recognises 7-headline bulletin structure. Styled/overlapping text causes errors: ଆଜି → ଆନ୍ଦ୍ର, ସ୍କୁଲ → ସୁଲ, ସୁଭଦ୍ରା → ସୁତଦ୍ଧା.
🔶 Sample 5 — Book Preface "ମୁଖବନ୍ଧ" (Book) · Acc: 73.4% · CER: 0.266
| Text (first ~200 chars) | |
|---|---|
| Ground Truth | ମୁଖବନ୍ଧ ସତ୍ଯ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥୁଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ଯ ଯେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମାନବ-ସେବା କାର୍ଯ୍ଯରେ ନ ଲାଗେ, ସେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମସ୍ତବଢ଼ ଗୋଟାଏ ଅପୂର୍ଣ୍ଣତା ଯେପରି ରହିଯାଏ । …(647 chars total) |
| Prediction | ମୁଖବନ୍ଧ ସତ୍ଯ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥିଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ଯ ଯେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମାନବସେବା କାର୍ଯ୍ଯରେ ନ ଲାଗେ, ସେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମସ୍ତବୃତ୍ତ ଗୋଟାଏ ଅପୂର୍ଣ୍ଣତା ଯେପରି ରହିଯାଏ । …(502 chars — truncated) |
First 77% accurately read. Complex Sanskrit compound words partially misread. Output truncated before final 2 sentences.
❌ Sample 6 — Newspaper Story "ସ୍ନେହର ଢୋରି" (Newspaper) · Acc: 34.2% · CER: 0.658
| Text (first ~300 chars) | |
|---|---|
| Ground Truth | ସ୍ନେହର ଢୋରି ଗୋଟିଏ ସର୍କସରେ କୁକୁରଟିଏ ଖେଳ ଦେଖାଉଥାଏ। ସେ ଖାଇପିଇ ବେଶ୍ ମୋଟାସୋଟା ହୋଇଥାଏ। କିନ୍ତୁ ତା' ମନ ସରସ ନ ଥାଏ। କାରଣ ସର୍କସର ରିଙ୍ ମାଷ୍ଟର ଥାଏ ବହୁତ କଢ଼ା ସ୍ଵଭାବର। …(1335 chars total) |
| Prediction | ସ୍ନେହର ତୋରି ଗୋଟିଏ ସର୍କିସରେ କୁକୁରଟିଏ ଖେଳ ଦେଖାଉଥାଏ । ସେ ଖାଇପିଲେ வேஷ்ଟ ମୋତାସୋଢା ହୋଇଥାଏ। କିନ୍ତୁ ତା ମନ ସରସ ନ ଥାଏ। କାରଣ ସର୍କିସର ରିଙ୍ ମାଞ୍ଚରେ ଥାଏ ବହୁତ ନତ୍ତା ସ୍ନଭାବକାରୀ। …(535 chars — severe truncation) |
Severe truncation: output only 40% of full text. Multi-column newspaper layout causes reading order errors. ଢୋରି → ତୋରି, ରିଙ୍ ମାଷ୍ଟର → ରିଙ୍ ମାଞ୍ଚର.
🖼️ Sample Outputs — Checkpoint 1300 (⭐ Best)
Six real examples from the Iftesha/odia-ocr-benchmark dataset (out-of-domain).
Quality: ✅ Good (CER < 0.15) · 🔶 Mixed (CER 0.15–0.65) · ❌ Poor (CER > 0.65)
✅ Sample 1 — Motivational Quote (Digital) · Acc: 98.2% · CER: 0.018
| Text | |
|---|---|
| Ground Truth | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ। ସେହି ଲୋକଙ୍କୁ ଭୁଲିଯାନ୍ତୁ ଯିଏ ତୁମର ଭାବନା କୁ ବୁଝି ପାରେନି। ନିଜ ଭୁଲ୍ କୁ ସ୍ଵୀକାର କରନ୍ତୁ। ପୁନର୍ବାର ନିଜ ଜୀବନକୁ ଆରମ୍ଭ କରନ୍ତୁ ଆଉ ନିଜ ଇଚ୍ଛା ରେ ବଞ୍ଚନ୍ତୁ। |
| Prediction | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ. ସେହି ଲୋକଙ୍କୁ ଭୁଲିଯାନ୍ତୁ ଯିଏ ତୁମର ଭାବନା କୁ ବୁଝି ପାରେନି. ନିଜ ଭୁଲ କୁ ସ୍ଵୀକାର କରନ୍ତୁ. ପୁନର୍ବାର ନିଜ ଜୀବନକୁ ଆରମ୍ଭ କରନ୍ତୁ ଆଉ ନିଜ ଇଚ୍ଛା ରେ ବଞ୍ଚନ୍ତୁ. |
Full text reproduced correctly — only Odia danda (।) replaced by period (.) and minor spacing differences.
✅ Sample 2 — Poem "ମାଆ" / Mother (Digital) · Acc: 92.9% · CER: 0.071
| Text | |
|---|---|
| Ground Truth | " ମାଆ " ଅମାବାସ୍ଯାର ଅନ୍ଧକାରରେ ଥିଲି ମୁଁ ଦୁନିଆଁର ଆଲୋକ ଦେଖାଇଲୁ ତୁ ଦଶ ମାସ ଦଶ ଦିନ ଗର୍ଭରେ ଧରି ସଙ୍ସାର ରେ ଜନମ ଦେଲୁ ତୁ । ଯାହା ମୁଁ ହୋଇଛି ଯାହା ମୁଁ ପାଇଛି ସବୁ ତ ତୋହରି ପାଇଁ ନାହିଁ ତୋର ସମ ଏ ସାରା ଜଗତେ ତୋହରି ତୁଳନା ନାହିଁ । |
| Prediction | ମାଆ ଅମାଦାସ୍ଯାର ଅନ୍ଧକାରରେ ଥିଲି ମୁଁ ଦୁନିଆଁର ଆଲୋକ ଦେଖାଇଛୁ ତୁ ଦଶ ମାସ ଦଶ ଦିନ ଗର୍ଜରେ ଧରି ସଙ୍ସାର ରେ ଜନମ ଦେଲୁ ତୁ । ଯାହା ମୁଁ ହୋଇଛି ଯାହା ମୁଁ ପାଇଛି ସବୁ ତ ତୋହରି ପାଈଁ ନାହିଁ ତୋର ସମ ଏ ସାରା ଜଗତେ ତୋହରି ତୁଳନା ନାହିଁ । |
All 8 stanzas captured. Minor errors: quoted title dropped, ଅମାବାସ୍ଯାର → ଅମାଦାସ୍ଯାର, linebreaks flattened into a single paragraph.
✅ Sample 3 — Poem "ସମଯର ଖେଳ" / Game of Time (Digital) · Acc: 91.0% · CER: 0.090
| Text | |
|---|---|
| Ground Truth | ସମଯର ଖେଳ ସମଯ ଗଢ଼ି ଚାଲିଛି ଧୀରେଧୀରେ ଅପେକ୍ଷା ନାହିଁ କାହାକୁ ଜନମିଲେ ମର୍ତ୍ତ୍ଯ ମୃତ୍ଯୁ ନିଶ୍ଚିତରେ ରୁଛ କାହିଁ ମୃତ୍ଯୁକୁ ।। ବନ୍ଧାପଢ଼ି ଅଛୁ ତୁ ମୋହ ମାଯାରେ ଭୁଲିଗଲୁ ସତ୍ଯତାକୁ ଏକା ତୁ ଆସିଛୁ ଏକା ଫେରିବୁରେ ଧରିଛୁ ମୋହ ମାଯାକୁ ।। |
| Prediction | ସମଯର ଗୋଳ ସମଯ ଗଢ଼ି ଚାଲିଛି ଧୂରେଧୂରେ ଅପେଷା ନାହିଁ କାହାକୁ ଜନମିଲେ ମର୍ତ୍ତେ ମୃତ୍ଯୁ ନିଶ୍ଚିତରେ ଉତ୍ତ୍ରଛ କାହିଁ ମୃତ୍ଯୁକୁ ।। ଦନ୍ଧାପଢ଼ି ଅଛୁ ତୁ ମୋହ ମାଯାରେ ଭୁଲିଗଲୁ ସତ୍ଯତାକୁ ଏକା ତୁ ଆସିଛୁ ଏକା ଫେରିବୁରେ ଧରିଛୁ ମୋହ ମାଯାକୁ ।। |
All 4 stanzas transcribed. Title ଖେଳ → ଗୋଳ, ଧୀରେଧୀରେ → ଧୂରେଧୂରେ; complex conjunct characters partially misread.
🔶 Sample 4 — News Digest Graphic (Digital) · Acc: 76.1% · CER: 0.239
| Text | |
|---|---|
| Ground Truth | ଆଜି ସନ୍ଧ୍ଯାର 20 ବଢ଼ ଖବର ସ୍କୁଲ ଖୋଲିବା ଓ ବନ୍ଦ ସମଯ ବଦଳିଲା ଭତ୍ତା କୁ ନେଇ 2 ବଢ଼ ଘୋଷଣା ସୁଭଦ୍ରା ଟଙ୍କା ବଢ଼ ଘୋଷଣା ଦେଖନ୍ତୁ ଏବେ ମିଳିବ କିଷାନ 2000 ବଢ଼ିଲା ଭତ୍ତା ଟଙ୍କା ସୁଭଦ୍ରା ଯୋଜନା ନେଇ ବଢ଼ ଖବର |
| Prediction | ଆନ୍ଦ୍ର ସନ୍ଧ୍ଯାର 20 ବଢ଼ ଖବର ସୁଲ ଗୋଳିବା ଓ ବନ୍ଦ ସମଯ ବଦଳିଲା ଭଉଆ କୁ ନେଇ 2 ବଢ଼ ଘୋଷଣା ସୁତଦ୍ଧା ଟଙ୍କା ବଢ଼ ଘୋଷଣା ଦେଖନୁ ଏବେ ମିଳିବ କିଣାନ 2000 ଗୃହିଳା ସୁତଦ୍ଧା ଶୋଚନା ନେଇ ବଢ଼ ଖବର |
Recognises 7-headline bulletin structure. Styled/overlapping text causes errors: ଆଜି → ଆନ୍ଦ୍ର, ସ୍କୁଲ → ସୁଲ, ସୁଭଦ୍ରା → ସୁତଦ୍ଧା.
🔶 Sample 5 — Book Preface "ମୁଖବନ୍ଧ" (Book) · Acc: 73.4% · CER: 0.266
| Text (first ~200 chars) | |
|---|---|
| Ground Truth | ମୁଖବନ୍ଧ ସତ୍ଯ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥୁଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ଯ ଯେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମାନବ-ସେବା କାର୍ଯ୍ଯରେ ନ ଲାଗେ, ସେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମସ୍ତବଢ଼ ଗୋଟାଏ ଅପୂର୍ଣ୍ଣତା ଯେପରି ରହିଯାଏ । …(647 chars total) |
| Prediction | ମୁଖବନ୍ଧ ସତ୍ଯ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥିଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ଯ ଯେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମାନବସେବା କାର୍ଯ୍ଯରେ ନ ଲାଗେ, ସେତେଦିନ ପର୍ଯ୍ଯନ୍ତ ମସ୍ତବୃତ୍ତ ଗୋଟାଏ ଅପୂର୍ଣ୍ଣତା ଯେପରି ରହିଯାଏ । …(502 chars — truncated) |
First 77% accurately read. Complex Sanskrit compound words partially misread. Output truncated before final 2 sentences.
❌ Sample 6 — Newspaper Story "ସ୍ନେହର ଢୋରି" (Newspaper) · Acc: 34.2% · CER: 0.658
| Text (first ~300 chars) | |
|---|---|
| Ground Truth | ସ୍ନେହର ଢୋରି ଗୋଟିଏ ସର୍କସରେ କୁକୁରଟିଏ ଖେଳ ଦେଖାଉଥାଏ। ସେ ଖାଇପିଇ ବେଶ୍ ମୋଟାସୋଟା ହୋଇଥାଏ। କିନ୍ତୁ ତା' ମନ ସରସ ନ ଥାଏ। କାରଣ ସର୍କସର ରିଙ୍ ମାଷ୍ଟର ଥାଏ ବହୁତ କଢ଼ା ସ୍ଵଭାବର। …(1335 chars total) |
| Prediction | ସ୍ନେହର ତୋରି ଗୋଟିଏ ସର୍କିସରେ କୁକୁରଟିଏ ଖେଳ ଦେଖାଉଥାଏ । ସେ ଖାଇପିଲେ வேஷ்ଟ ମୋତାସୋଢା ହୋଇଥାଏ। କିନ୍ତୁ ତା ମନ ସରସ ନ ଥାଏ। କାରଣ ସର୍କିସର ରିଙ୍ ମାଞ୍ଚରେ ଥାଏ ବହୁତ ନତ୍ତା ସ୍ନଭାବକାରୀ। …(535 chars — severe truncation) |
Severe truncation: output only 40% of full text. Multi-column newspaper layout causes reading order errors. ଢୋରି → ତୋରି, ରିଙ୍ ମାଷ୍ଟର → ରିଙ୍ ମାଞ୍ଚର.
⭐ Best Checkpoint: 1300 (CER=0.655, Acc=34.5%)
Checkpoint-1300 is the best performing checkpoint. Use this for inference:shantipriya/odia-ocr-qwen-finetuned_v3 — load with revision="checkpoint-1300"
Checkpoint-1800 Benchmark Results (151 samples — Iftesha/odia-ocr-benchmark)
Latest eval at checkpoint-1800 (note: ckpt-1300 remains best overall):
| Category | Samples | Avg CER | Accuracy (1−CER) |
|---|---|---|---|
| scene_text | 50 | 0.552 | 44.8% |
| handwritten | 19 | 0.385 | 61.5% |
| Digital | 10 | 0.628 | 37.2% |
| Book | 11 | 0.899 | 10.1% |
| Newspaper | 11 | 0.930 | 7.0% |
| printed | 50 | 1.040 | 0.0% |
| Overall | 151 | 0.750 | 25.0% |
Benchmark: Iftesha/odia-ocr-benchmark
Checkpoint-1800 results (CER=0.750). History: ckpt-1700 CER=0.912, ckpt-1600 CER=0.758, ckpt-1500 CER=0.690, ckpt-1300 CER=0.655 (best), ckpt-900 CER=0.804.
⭐ Recommended checkpoint for inference: ckpt-1300 (34.5% accuracy).
Sample Inferences — Best Checkpoint 1300 (CER=0.655, Acc=34.5%) — 5 per category
Checkpoint-1300 is the best checkpoint overall — lowest CER and highest accuracy across all categories. Each row shows the original image, ground truth text, and model prediction. Quality icons: ✅ Good (CER < 0.15) · 🔶 Mixed (CER 0.15–0.65) · ❌ Bad (CER > 0.65)
Scene Text
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ନୁହେଁ | ନୁହେଁ | |
| ✅ | 0.00 | ଶାସ୍ତ୍ରୀ | ଶାସ୍ତ୍ରୀ | |
| 🔶 | 0.20 | ଅଡିଟୋରିୟମ୍ | ଅଡିଗୋରିୟମ, | |
| 🔶 | 0.43 | ଓଡ଼ିଶାର | ଓଡିଶୀ | |
| ❌ | 1.00 | ଓ | ଚାର୍ଚ୍ଚା |
Handwritten
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ଖେଳରତ୍ନ | ଖେଳରତ୍ନ | |
| ✅ | 0.00 | ଗଢ଼ାହେଲା | ଗଢ଼ାହେଲା | |
| 🔶 | 0.20 | ସ୍ନେହ | ସ୍କେହ | |
| 🔶 | 0.33 | ସୁନ୍ଦରଗଡ଼ | ଶୁଦରଗଡ଼ | |
| ❌ | 1.00 | ୫ଲକ୍ଷ | ଧରଣୀ |
Digital
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| 🔶 | 0.32 | ଆଜି ସନ୍ଧ୍ୟାର 20 ବଡ଼ ଖବର ସ୍କୁଲ ଖୋଲିବା ଓ ବନ୍ଦ ସମୟ ବଦଳିଲା ଭତ୍ତା କୁ ନେଇ 2 ବଡ଼ ଘୋଷଣା ସୁଭଦ୍ରା ଟଙ | ଆନି ସନ୍ଧ୍ୟାର 20 ବଡ଼ ଖେବର ସୁଲ୍ ଖୋଲିବା ଓ ବନ୍ଦ ସମୟ ବଦଳିଲା ଭଉଣୀ କୁ ନେଇ 2 ବଡ଼ ଘୋଷଣା ସୁଜବା ଟଙ୍କା | |
| 🔶 | 0.42 | ଆଜି ୧୭ ମଇ ଶୁକ୍ରବାର ଚାଷୀଙ୍କୁ ୫୦୦୦୦ ଟଙ୍କା କ୍ଷତିପୂରଣ, ଭୟଙ୍କର ସୂର୍ଯ୍ୟ ପରାଗ ଆଜି ୮ଟି ନୂଆ ନିୟମ ଲା | ଆଜି ୧୭ ମଇ ଗୁଜୁବାର ଚାଷିଙ୍କୁ ୫୦୦୦୦ଟେଙ୍କା କ୍ଷତିପୂରଣ,ଭୟଙ୍କର ସୂର୍ଯ୍ୟ ଗ୍ରହଣ ଆଜି ୮ଟି ନୂଆ ନିୟମ ଲାଗ | |
| 🔶 | 0.49 | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ। ସ | ଜାବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୋଟ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ଦୁମକୁ ଥାଗକୁ ବଡ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ । | |
| ❌ | 0.68 | ଆଜି ୧୮ ଅଗଷ୍ଟ, ରବିବାର. ସକାଳର ମୁଖ୍ୟ ଖବର ୩୦ଟି ବଡ଼ ଖବର ୧. ଦିଲ୍ଲୀ ଏମ୍ସରେ ନିଆଁ, ଆୟତ୍ତ କଲେ ୩୪ ଦମକ | ଆଜି ୧୮ ଅଗଷ୍ଟ, ରବିବାରେ ସକାଳର ମୁଖ୍ୟ ଖବର 18 ଦିନ୍ଧା ଏଗୁଡ଼େ ନିର୍ଯ୍ୟ, ଆଣାଇ କଲେ ୩୪ ତମକଳ ଟିମ୍ 7 ଡି | |
| ❌ | 0.75 | ଆଜି 17 ଜାନୁୟାରୀ, ଶୁକ୍ରବାର 2025ସକାଳର ମୁଖ୍ୟ ଖବର 20 ଟି ବଡ଼ ଖବର ୧. ଅଙ୍ଗନବାଡି କର୍ମୀ ମାନଙ୍କ ଦରମା | ଆଜି 17 ଲାହିୟାରା, ଗୁଳିବାରେ 2025 ସକାଳର ମୁଖ୍ୟାଶବର 18. ଅଙ୍ଗନବାଡି କର୍ମୀ ମାନଙ୍କ ଦରମା ବଢିଲା 19. ସ |
Book
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ❌ | 0.82 | ମୁଖବନ୍ଧ ସତ୍ୟ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥୁଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ୟ ଯେତେଦିନ ପର୍ଯ୍ୟନ୍ତ ମାନବ-ସେବ | ମୁଖେବକ୍ଷ ସତ୍ୟ ବା ଞ୍ଜାନର ସାର୍ଥକତା ସେବାରେ । ଏଥିଯୋଗୁଁ ଞ୍ଜାନ ବା ସତ୍ୟ ଯେତେବିନ ପର୍ଯ୍ୟନ୍ତ ମାନବସେବ | |
| ❌ | 0.84 | ଅଚାନକ ଏବେ, ଏ ଯେଉଁ କ୍ଷଣଟି ଆସିଲା—ପୁରାପୁରି ଅଚାନକ । ଯାହାଙ୍କ ଜୀବନରେ ଏହା ଆସିଲା, ସ୍ୱୟଂ ତାଙ୍କୁ ବି | ଅଚାନକ ଏବେ, ଏ ଯେଉଁ କ୍ଷଣଟି ଆସିଲାପୁରାପୁରି ଅଚାନକ । ଯାହାଙ୍କ ଜୀବନରେ ଏହା ଆସିଲା, ସ୍ଵୟଂ ତାକୁ ବି ଏହି | |
| ❌ | 0.86 | ପଞ୍ଚସଖା ଆଗମ୍ୟ ଭାବ ଜାଣେ ଯଶୋବନ୍ତ । ଗାରକଟା ଯନ୍ତ୍ର ଜାଣେ ଅନନ୍ତ ।୧। ଆଗତ ନାଗତ ଅଚ୍ୟୁତ ଭଣେ । ବଳରାମ | ପଞ୍ଚସଙ୍ଗୀ ଆଗମ୍ୟ ଭାବ ଜାଣେ ଯଶୋବନ୍ତ । ଗାରକଟୀ ଯଦ୍ଦ ଜାଣେ ଅନନ୍ତ । ୧ ଆଗତ ନାଗତ ଅତୁ୍ୟତ ଭଣେ । କଳରା | |
| ❌ | 0.91 | ବିଲକ୍ଷଣ ଭଗବତ୍କୃପା ଭଗବାନଙ୍କ ଉପରେ ବିଶ୍ୱାସ କରିବା ଉଚିତ, କଦାପି ସଂସାର ଉପରେ ବିଶ୍ୱାସ କରିବା ଉଚିତ ନ | ଭଗବାନଙ୍କ ଉପରେ ବିଶ୍ଵାସ କରିବା ଉଚିତ, କନ୍ଦାପି ସଂସାର ଉପରେ ବିଶ୍ଵାସ କରିବା ଉଚିତ ନୁହେଁ। ଏହା ସମସ୍ତଙ୍ | |
| ❌ | 0.94 | ପ୍ରଥମ ଭାଗ ଝଡ଼ ପୂର୍ବର ନିସ୍ତବ୍ଧତା ଏକ ୧୯୪୭ ମସିହା ଜୁନ୍ ମାସ ତିନି ତାରିଖ। ଏହି ସଂଧ୍ୟାରେ ଭାଇସରାୟଙ୍କ | ପ୍ରଥମ ଭାଗ ଟକ୍କ ପୂର୍ବର ନିଷକ୍ତତା ଏକ ୧୯୪୭ ମସିହା ଜୁନ୍ ମାସ ତିନି ଚାରିଶା । ଏହି ସଂଧ୍ୟାରେ ଭାରତସ୍ରାୟ |
Newspaper
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ❌ | 0.86 | ଆମେରିକାରେ ବର୍ଣ୍ଣବୈଷମ୍ୟ: ‘ନିଗ୍ରୋ’ଙ୍କୁ ବିମାନରୁ ଓହ୍ଲାଇ ଦିଆଗଲା ୱାଶିଂଟନ,୩୧୫: ଆମେରିକାରେ ଏବେ ମଧ୍ୟ | କରିଥିଲେ । ବାଟାଗାଡ଼ କରିବା ପରେ ନାଚିବା ପରେ ଏକ କଡ ଦେଖି ଥିଲା ବୋଳି କହିଛି ସାରା ଦେଶ କରିବା ପାଇଁ ପ୍ | |
| ❌ | 0.88 | ଜିଲ୍ଲାସ୍ତରୀୟ ଜାତୀୟ ଉପଭୋକ୍ତା ଦିବସ ଜଗତସିଂହପୁର ସହର,୨୪/୧୨(ଇମିସ): ଜିଲ୍ଲା କୋର୍ଟ ପରିସରରେ ପ୍ରତିଷ୍ଠ | ଜିଲ୍ଲାପ୍ରାଣୟ ଡାଟାମଣ୍ଡ ଉପଠକୋଳା ଦିବବୀ ନଗରକୂଳେପୁର ଅଦାଲତ ମିଳୁଥିଲେ। କିନ୍ତୁ ଏହାକୁ ପରିଚୟ ପ୍ରଚର କର | |
| ❌ | 0.89 | ଇ-ପବ୍ଲିକେଶନର ଲୋକପ୍ରିୟତା ବଢୁଛି ଭୁବନେଶ୍ୱର, (ବ୍ୟୁରୋ)— ବୈଷୟିକ ଜ୍ଞାନ କୌଶଳରେ ଉନ୍ନତି ସହ ଧୀରେ ଧୀରେ | ଲପବ୍ରିକେଶନର ଲୋକପ୍ରିୟତା ବଢ଼ୁଛି ଭୁବନେଶ୍ୱର,ବ୍ୟୁରୋ ବୈଷୟିକ ଜ୍ଞାନ କୌଶଳରେ ଉନ୍ନତି ସହ ଧାରେ ଧାରେ ଲୋ | |
| ❌ | 0.92 | ମଲାଗୁଣୀ ବିଜୁ ସେତୁ ନିର୍ମାଣ ହେବ କେବେ ? ଖୋର୍ଦ୍ଧା, ୧୨/୧୦(ନି.ପ୍ର): ବିଜୁ ସେତୁ ଯୋଜନାରେ ଗୋଲବାଇଠାରୁ | ମଲାଗୁଣୀ ବିଦ୍ରୁ ସେତୁ ନିର୍ମାଣ ହେବ କେବେ ଖୋର୍ଦ୍ଧା,୧୭।୧୦ନିପ୍ର ବିଜୁ ସେନ୍ଦୁ ଯୋଜନାରେ ଗୋଳବାଇଠାରୁ ଚ | |
| ❌ | 0.97 | ଜିଲ୍ଲାରେ ଅଧାରୁ ଅଧିକ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ନାହିଁ ନିଜସ୍ୱ ଗୃହ ଖୋର୍ଦ୍ଧା, ୨/୧୧(ନି.ପ୍ର): ଶିଶୁଙ୍କ ପ | ଜିଲାରେ ଅଧାରୁ ଅଧିକ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ନାହିଁ ନିର୍ଜଷ୍ଟ ଗୃହ ସୋ ।୩୮୨୧ଥିନିପ୍ରା ଶିଶୁଙ୍କ ପୂର୍ବ ସା |
Printed
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ଭିତରୁ | ଭିତରୁ | |
| ✅ | 0.00 | ଅପରାହ୍ନ | ଅପରାହ୍ନ | |
| 🔶 | 0.17 | ବିଭାଗର | ବିଭାଗରୁ | |
| 🔶 | 0.40 | ମେଘୁଆ | ମେଘଧା | |
| ❌ | 1.00 | । | ବାୟାରେଡି |
Evaluated on Iftesha/odia-ocr-benchmark — out-of-domain from training data.
Best performance: handwritten and scene_text categories.
⭐ Usecheckpoint-1300for best inference results.
Sample Inferences — Latest Checkpoint 1800 (CER=0.750, Acc=24.9%) — 5 per category
Latest evaluated checkpoint (step 1800/3000). Note: ckpt-1300 still gives best overall results.
Scene Text
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ନୁହେଁ | ନୁହେଁ | |
| ✅ | 0.00 | ଶାସ୍ତ୍ରୀ | ନେତାଜୀ | |
| ✅ | 0.12 | ଅଡିଟୋରିୟମ୍ | ଶାସ୍ତ୍ର | |
| ✅ | 0.00 | ଓଡ଼ିଶାର | ପ୍ରାୟୋଗିକ | |
| ✅ | 0.00 | ଓ | ସହ |
Handwritten
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ସ୍ନେହ | ସ୍ନେହ | |
| ✅ | 0.00 | ରଖିଥିବା | ରଖିଥିବା | |
| ✅ | 0.00 | ଅଧିକ | ଅଧିକ | |
| ✅ | 0.11 | ଫେରିପାଇଲେ | ଫେରିଯାଇଲେ | |
| 🔶 | 0.38 | ଗଢ଼ାହେଲା | ଗଡ଼ାଦେହଲା |
Digital
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| 🔶 | 0.34 | ଆଜି ସନ୍ଧ୍ୟାର 20 ବଡ଼ ଖବର ସ୍କୁଲ ଖୋଲିବା ଓ ବନ୍ଦ ସମୟ ବଦଳିଲା ଭତ୍ତା କୁ ନେଇ 2 ବଡ଼ ଘୋଷଣା ସୁଭଦ୍ରା ଟଙ | ଆଜି ସନ୍ଧ୍ୟାର 20 ବଡ଼ ଖବର ସୁଲ ଗୋଲିଦା ଓ ବୟ ସମୟ ବଦଳିଲା ଭତ୍ରା କୁ ନେଇ 2 ବଡ଼ ଘୋଷଣା ସୁଭଦ୍ରା ଟଙ୍କା | |
| 🔶 | 0.50 | ଆଜି ୧୭ ମଇ ଶୁକ୍ରବାର ଚାଷୀଙ୍କୁ ୫୦୦୦୦ ଟଙ୍କା କ୍ଷତିପୂରଣ, ଭୟଙ୍କର ସୂର୍ଯ୍ୟ ପରାଗ ଆଜି ୮ଟି ନୂଆ ନିୟମ ଲାଗୁ, ଜନ ଧନ ଖାତାରେ ୨୫୦୦ ଆଜି ଭୟଙ୍କର ଗ୍ରହଣ ବର୍ଷା ମାଟ୍ରିକ ରେଜଲ୍ଟ LIVE ଆଜି ବ୍ୟାଙ୍କ ଖାତାରେ ୧୪୦୦୦ ମିଳିବ | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ଦ୍ରମକୁ ଥାଗକୁ ବଡ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ | |
| 🔶 | 0.48 | ଜୀବନର ମୂଳ ମନ୍ତ୍ର ନିଜର ଅତୀତ କୁ ଭୁଲିଯାଆନ୍ତୁ ଯାହା ତୁମକୁ ଆଗକୁ ବଢ଼ିବାରେ ପ୍ରତିବନ୍ଧକ ସୃଷ୍ଟିକରେ। ସେହି ଲୋକଙ୍କୁ ଭୁଲିଯାନ୍ତୁ ଯିଏ ତୁମର ଭାବନା କୁ ବୁଝି ପାରେନି।ନିଜ ଭୁଲ୍ କୁ ସ୍ୱୀକାର କରନ୍ତୁ। ପୁନର୍ବାର ନିଜ ଜୀବନକୁ ଆରମ୍ଭ କରନ୍ତୁ ଆଉ ନିଜ ଇଚ୍ଛା ରେ ବଞ୍ଚନ୍ତୁ। | ଆଜି ୧୨ ମଇ ଗୁଜରାଟ ତାଣ୍ଡିଙ୍କୁ ୫୦୦୦୦ ଟଙ୍କା କ୍ଷତିପୂରଣ,ଉୟୂକ୍ତର ସୂର୍ଯ୍ୟ ଗ୍ରହଣ ଆଜି ୮ଟି ନୂଆ ନିୟମ ଲ | |
| 🔶 | 0.59 | ଆଜି ୧୮ ଅଗଷ୍ଟ, ରବିବାର. ସକାଳର ମୁଖ୍ୟ ଖବର ୩୦ଟି ବଡ଼ ଖବର ୧. ଦିଲ୍ଲୀ ଏମ୍ସରେ ନିଆଁ, ଆୟତ୍ତ କଲେ ୩୪ ଦମକଳ ଟିମ୍ ୨. ନୀତି ଆୟୋଗ ବୈଠକରେ ଚାଷୀ ପାଇଁ ଓଡ଼ିଶାର ୬ଟି ପ୍ରସ୍ତାବ ୩. ଟିଭି ଚ୍ୟାନେଲ ପାଇଁ ଥିବା ଅଫର ଉପରେ ରୋକ ଲଗାଇବ TRAI ୪. ଡାକ ବିଭାଗରେ ନିଯୁକ୍ତି ନେଇ ପ୍ରକାଶ ପାଇଲା ବିଜ୍ଞପ୍ତି ୫. ଭାରତ - ଭୁଟାନ ମଧ୍ୟରେ ୧୦ଟି ବୁଝାମଣା ପତ୍ର ସ୍ଵାକ୍ଷରିତ | ଏଲଡ ଜୀବନ ବୁଝିବୁଝ ନାହିଁ ଜୀବନ ରାସ୍ତାରେ କାହିଁକି ଏମିତି ବୁଏ ଛାଡି ଆସିଥିବା ଅତୀତ ବି ଜାଣିଶୁଣି କଷ୍ଟ | |
| ❌ | 0.88 | ଆଜି 17 ଜାନୁୟାରୀ, ଶୁକ୍ରବାର 2025ସକାଳର ମୁଖ୍ୟ ଖବର 20 ଟି ବଡ଼ ଖବର ୧. ଅଙ୍ଗନବାଡି କର୍ମୀ ମାନଙ୍କ ଦରମା ବଢିଲା ୨. ସୁଭଦ୍ରା Under Process ଥିଲେ ମିଳିବନି ଟଙ୍କା ୩. ୬୦ ବର୍ଷରୁ ଉର୍ଦ୍ଧ ଏବଂ ବିଧବା ଭତ୍ତା ୩୦୦୦ କୁ ଦାବି ୪. ଏମାନଙ୍କୁ ମାସକୁ ମିଳିବ ୩୦ ହଜାର ଟଙ୍କା ୫. ବାସହୀନ ଙ୍କ ପାଇଁ ଆଶ୍ରୟସ୍ଥଳୀ ଯୋଜନା ବଢିବ ଅଙ୍ଗନବାଡି କର୍ମୀଙ୍କ ଦରମା!! ମୁଖ୍ୟମନ୍ତ୍ରୀଙ୍କ ବଡ଼ ଘୋଷଣା ଏମାନଙ୍କୁ ମିଳିବ ୩୦ ହଜାର ସୁଭଦ୍ରା ଟଙ୍କା Under Process ଅଛିକି ମିଳିବନି ଟଙ୍କା ଶୀଘ୍ର କରନ୍ତୁ ୩୦୦୦ ଭତ୍ତା ବୃଦ୍ଧି କରିବା ପାଇଁ ଦାବି ବାସହୀନଙ୍କୁ ମିଳିବ ଆଶ୍ରୟସ୍ଥଳୀ ତିନି ହଜାର ନହେଲେ ଜଣା ପଡୁନି (ଛୋଟ ଅକ୍ଷରରେ) | ଆଜି ୧୮ ଅଗଷ୍ଟ, ରବିବାରର ସକାଳର ମୁଖ୍ୟ ଖବର |
Book
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ❌ | 0.82 | ମୁଖବନ୍ଧ ସତ୍ୟ ବା ଜ୍ଞାନର ସାର୍ଥକତା ସେବାରେ । ଏଥୁଯୋଗୁଁ ଜ୍ଞାନ ବା ସତ୍ୟ ଯେତେଦିନ ପର୍ଯ୍ୟନ୍ତ ମାନବ-ସେବ | ମୁଖବନ୍ଦ ସତ୍ୟ ବା ଞ୍ଜାନର ସାର୍ଥକତା ସେବାରେ । ଏଥିଯୋଗୁଁ ଞ୍ଜାନ ବା ସତ୍ୟ ଯେତେବିନ ପର୍ଯ୍ୟନ୍ତ ମାନବସେବା | |
| ❌ | 0.87 | ଅଚାନକ ଏବେ, ଏ ଯେଉଁ କ୍ଷଣଟି ଆସିଲା—ପୁରାପୁରି ଅଚାନକ । ଯାହାଙ୍କ ଜୀବନରେ ଏହା ଆସିଲା, ସ୍ୱୟଂ ତାଙ୍କୁ ବି ଏହି ଅଚାନକର ଅନ୍ୱେଷା ନଥିଲା । ସେ ସବୁଜିମାଭରା ପରିବେଶରେ ସେ ପ୍ରସ୍ଫୁଟନର ସମ୍ଭାବନା ଏମିତିରେ ହୋଇ ପାରିଥାଆନ୍ତା କିନ୍ତୁ ଏହା ଯେ ହେବ—ଏ କଥା କେହି ଭାବି ନଥିଲେ । ହୁଏତ ସେହି କ୍ଷଣକୁ ଅନୁମାନ ନଥିଲା ଯେ ନିଜର ସହଜ ଲୟରେ ତାକୁ ସେହି ଗନ୍ତବ୍ୟ ଯାଏଁ ପହଞ୍ଚିବାକୁ ପଡ଼ିବ । ନିମ୍ନନାଭି ଥିଲା ସେତେବେଳେ, କିନ୍ତୁ ଏପରି ଆଉ କେଉଁଠି ନଥିଲା । ସେହି ଶରୀର ଦେଇ ସେଇ ଅନ୍ୟ ଶରୀରର ସେ ରସବିଭୋର ସ୍ପର୍ଶରେ ତାହାର ସମ୍ଭାବନା ଘଟିଲା । ଏମିତି ତ ସେ ବିତିଗଲା କିନ୍ତୁ ଯେମିତି ଆକାଶଗଙ୍ଗାରେ ଲୋପ ହୋଇସାରିବା ପରେ ବି ନକ୍ଷତ୍ର କେଉଁଠି ନା କେଉଁଠି ବଜାୟ ରହିଥାଏ, ସେ ବି ବଜାୟ ରହିଥିଲା । ତାକୁ କେବଳ ସେଇମାନେ ଜାଣନ୍ତି ଓ ଦେଖିପାରନ୍ତି, ଯାହାଙ୍କ ଜୀବନରେ ସେ ବିସ୍ମୟ ଭଳି ସଂଘଟିତ ହୋଇଥିଲା । ତୁମ୍ଭନର ସେଇ ପ୍ରଥମ କ୍ଷଣ ଓ ତାହାର ଆଦ୍ର ସ୍ପନ୍ଦନ ତିରୋହିତ ହେଲେ ନାହିଁ । ସେମାନେ ଲୟ ହୋଇଗଲେ ଯାହାକୁ ପ୍ରାୟ ନିରବରେ ହିଁ, ସେମାନଙ୍କର ଶରୀର ଗାଇବାରେ ମଗ୍ନ ଥାଆନ୍ତି । 💠💠 (୧୯୯୦) ୧୫୪/କେଉଁଠି ନାହିଁ ସେଇଟି | ପଞ୍ଚସଙ୍ଗୀ ଆଗମ୍ୟ ଭାବ ଜାଣେ ଯଶୋଦତ୍ରୀ । ଗାଉକଟୀ ଯଦ୍ଦ ଜାଣେ ଅନନ୍ତ ।୧। ଆଗତ ନାଗତ ଅତୁଥ୍ୟତ ଭଣେ । | |
| ❌ | 0.85 | ପଞ୍ଚସଖା ଆଗମ୍ୟ ଭାବ ଜାଣେ ଯଶୋବନ୍ତ । ଗାରକଟା ଯନ୍ତ୍ର ଜାଣେ ଅନନ୍ତ ।୧। ଆଗତ ନାଗତ ଅଚ୍ୟୁତ ଭଣେ । ବଳରାମ ଦାସ ତତ୍ତ୍ଵ ବଖାଣେ ।୨। ଭକ୍ତିର ଭାବ ଜାଣେ ଜଗନ୍ନାଥ । ପଞ୍ଚସଖା ଏ ଓଡ଼ିଶା ମହନ୍ତ ।୩। ଭକ୍ତ ଅଚ୍ୟୁତାନନ୍ଦ ଚଉତିଶା | ||
| ❌ | 0.85 | ବିଲକ୍ଷଣ ଭଗବତ୍କୃପା ଭଗବାନଙ୍କ ଉପରେ ବିଶ୍ୱାସ କରିବା ଉଚିତ, କଦାପି ସଂସାର ଉପରେ ବିଶ୍ୱାସ କରିବା ଉଚିତ ନୁହେଁ। ଏହା ସମସ୍ତଙ୍କର ଅନୁଭବ ଯେ ଦେଖିବା, ଶୁଣିବା ଓ ବୁଝିବା ଅନ୍ତର୍ଗତ ହେଉଥିବା ସବୁକିଛି ପ୍ରତିକ୍ଷଣ ପରିବର୍ତ୍ତିତ ହେଉଛି; ପୁଣି ତାହା ଉପରେ ବିଶ୍ୱାସ କରାଯିବ କିପରି? ସଂସାର ଆଦୌ ବିଶ୍ୱାସର ପାତ୍ର ନୁହେଁ, ବରଂ ସେ ସେବାର ପାତ୍ର। ଯେଉଁ ଭଗବାନ କେବେ ବଦଳନ୍ତି ନାହିଁ, ବଦଳିବେ ନାହିଁ ଏବଂ ବଦଳି ପାରିବେ ନାହିଁ ତଥା ଯେ ଯଥାବତ୍ ରହନ୍ତି, ସେ ହିଁ ବିଶ୍ୱାସର ଯୋଗ୍ୟ। ଆଉ ଗୋଟିଏ କଥା ଉପରେ ବିଶ୍ୱାସ କରିବା ଉଚିତ ଯେ ଭଗବାନ ଯେହେତୁ କୃପା କରି ତାଙ୍କୁ ପାଇବା ପାଇଁ ମାନବଶରୀର ପ୍ରଦାନ କରିଛନ୍ତି, ତେଣୁ ତାଙ୍କୁ ପାଇବାର ଆବଶ୍ୟକ ସାମଗ୍ରୀ ମଧ୍ୟ ସେ ପ୍ରଦାନ କରିଛନ୍ତି। ସାଧନସାମଗ୍ରୀ କମ୍ ଦେଇ ନାହାନ୍ତି, ବରଂ ବହୁତ ଅଧିକ ଦେଇଛନ୍ତି। ଏତେ ଅଧିକ ଦେଇଛନ୍ତି ଯେ ଏହାଦ୍ୱାରା ମନୁଷ୍ୟ ଅନେକ ଥର ଭଗବାନଙ୍କୁ ପାଇ ପାରିବ, ଯଦିଓ ବାସ୍ତବରେ ଭଗବାନଙ୍କ ପ୍ରାପ୍ତି ଥରକ ପାଇଁ ହୁଏ ଓ ସବୁଦିନ ପାଇଁ ହୁଏ। ସାଧକକୁ ପ୍ରାୟ ଜଣାପଡ଼େ ଯେ ତା' ପାଖରେ ସାଧନସାମଗ୍ରୀ ନାହିଁ। ତେଣୁ ସେ ଇଚ୍ଛା କରୁଥାଏ, କେଉଁଠୁ କିଛି ସାଧନସାମଗ୍ରୀ ଓ ମାର୍ଗଦର୍ଶନ ମିଳିପାରନ୍ତା କି! ଅର୍ଜୁନଙ୍କୁ ମଧ୍ୟ ନିଜଠାରେ ସାଧନସାମଗ୍ରୀ (ଦୈବୀସମ୍ପତ୍ତି) କମ୍ ଥିବାର ଜଣାପଡ଼ୁଥିଲା। ତେଣୁ ଭଗବାନ ତାଙ୍କୁ ଆଶ୍ୱାସନା ଦେଇଛନ୍ତି ଯେ ତୁମ ପାଖରେ ଦୈବୀସମ୍ପତ୍ତି କମ୍ ନାହିଁ, ବରଂ ତାହା ସ୍ୱାଭାବିକଭାବେ ତୁମ ପାଖରେ ବିଦ୍ୟମାନ; ତୁମେ ଚିନ୍ତା କର ନାହିଁ କିମ୍ବା ନିରାଶ ହୁଅ ନାହିଁ—'ମା ଶୁଚଃ ସମ୍ପଦଂ ଦୈବୀମଭିଜାତୋଽସି ପାଣ୍ଡବ' (ଗୀତା ୧୬।୫)। ଜୀବର କଲ୍ୟାଣ (ଉଦ୍ଧାର) ପାଇଁ ଭଗବାନ ମାନବଶରୀର ପ୍ରଦାନ କରି ଜୀବକୁ କଲ୍ୟାଣର ଆବଶ୍ୟକ ସାମଗ୍ରୀ ଯେ ଦେଇ ନାହାନ୍ତି, ସେ କଥା ନୁହେଁ। ଏପରି ଭୁଲ୍ ଭଗବାନଙ୍କ ଦ୍ୱାରା ହେବା ଆଦୌ ସମ୍ଭବ ନୁହେଁ। | ଓଁ ଶ୍ରୀପରମାତୃକେ ନମଃ ଶ୍ରୀମଭଗବତଗାତା ଅଥ କରନ୍ୟାସଃ ଓଁ ଅପ୍ରୟ ଶ୍ରୀମଭଗବତଗାତାମାଳାମଦୁସ୍ୟ ଭଗବାନ୍ ଦେ | |
| ❌ | 0.88 | ପ୍ରଥମ ଭାଗ ଝଡ଼ ପୂର୍ବର ନିସ୍ତବ୍ଧତା ଏକ ୧୯୪୭ ମସିହା ଜୁନ୍ ମାସ ତିନି ତାରିଖ। ଏହି ସଂଧ୍ୟାରେ ଭାଇସରାୟଙ୍କର ଗୋଟିଏ ଗୁରୁତ୍ଵପୂର୍ଣ୍ଣ ଘୋଷଣା କରିବାର ଥିଲା। ସେଇ କଥା ହିଁ ଲାଲା କାନସାରାମ ତାଙ୍କ ସ୍ତ୍ରୀ ପ୍ରଭାରାଣୀଙ୍କୁ କହୁଥିଲେ। ସ୍ତ୍ରୀକୁ ଶିକ୍ଷିତ କରାଇବା ଥିଲା ତାଙ୍କର ଏକ ଦାୟିତ୍ଵ। ଲାଲା କାନସାରାମ ନିଜେ ବିଶେଷ ଶିକ୍ଷିତ ନଥିଲେ— ସେ ନିଜେ ମେଟ୍ରିକ୍ ପାଶ୍ କରିଥିଲେ କି ନାହିଁ ସନ୍ଦେହ। କିନ୍ତୁ ଜୀବନ ତାଙ୍କୁ ବେଶ୍ ଘଷେଇ ଦେଇଥିଲା, ଦୁର୍ଭାଗ୍ୟମାନେ ଆସିଥିଲେ ଓ ଯାଇଥିଲେ, ଆଉ ଏହାହିଁ ତାଙ୍କ ବୁଦ୍ଧିକୁ କରିଥିଲା ଶାଣିତ। ଅନ୍ତତଃ ଗୋଟିଏ ଆଞ୍ଚଳିକ ଭାଷା ସେ ଭଲକରି ଜାଣିଥିଲେ, ଉର୍ଦ୍ଦୁ। ପ୍ରଥମେ ଏହି ଭାଷାକୁ ହିଁ ସେ ପଢ଼ି, ଲେଖି ଶିଖିଥିଲେ, କିନ୍ତୁ ସ୍ଵାଭାବିକ ଭାବରେ ତାଙ୍କ ନିଜ ଭାଷା ଥିଲା ହିନ୍ଦୀ। ଗତ କୋଡ଼ିଏ ବର୍ଷ ଧରି ସେ ଜିଲ୍ଲା ଆର୍ଯ୍ୟ ସମାଜର ଥିଲେ ଜଣେ ସମ୍ମାନିତ ସଭ୍ୟ, ଆଉ ଏହି ସମାଜ ଗୋଟିଏ କାମ କରିଥିଲା— ଦଳିତ, ସାଧାରଣ ଲୋକଙ୍କୁ ପ୍ରତିପତ୍ତି ଦେଇଥିଲା। ସେ ଧନୀ ନା ଗରିବର ପୁଅ ଥିଲେ? ସେ ଉତ୍ତରାଧିକାର ସୂତ୍ରରେ ସମ୍ପତ୍ତି ଲାଭ କରିଥିଲେ ନା ନାହିଁ? ଏଭଳି ପ୍ରଶ୍ନକୁ ଆର୍ଯ୍ୟସମାଜ ଆଦୌ ଖାତିର କରୁନଥିଲା, ଯେ ପର୍ଯ୍ୟନ୍ତ ତୁମେ ମୁଣ୍ଡରେ ଧଳା ପଗଡ଼ିଟିକୁ ଗର୍ବରେ ପିନ୍ଧି ପାରୁଥିଲ, ଯେ ପର୍ଯ୍ୟନ୍ତ ନିଜର ନୈତିକ ଚରିତ୍ର ପାଇଁ ଗର୍ବ କରିପାରୁଥିଲ, ତୁମକୁ ଜ୍ଞାନଦାନୀ, ସୁନାଗରିକ ରୂପେ ସମାଜ ଗ୍ରହଣ କରି ନେଉଥିଲା। ଏହି ଆର୍ଯ୍ୟସମାଜ ମଧ୍ୟ ତାଙ୍କୁ ଦୃଢ଼ତାର ସହ ଶିଖାଇଥିଲା ଯେ, ବୈଦିକ ସଂସ୍କୃତି ହିଁ ଗୋଟିଏ ଭାରତୀୟର ପ୍ରକୃତ ସଂସ୍କୃତି, ଆଉ ଭାରତୀୟର ପ୍ରକୃତ ଭାଷା ହେଉଛି ସଂସ୍କୃତ ଭାଷା, ସଂସ୍କୃତ— ବେଦର ଭାଷା। ସଂସ୍କୃତ ଯେହେତୁ ଥିଲା ଏକ ପ୍ରାଚୀନ ଭାଷା, ଏଣୁ ଏହାର ଆଧୁନିକ ଉପଜ ଭାଷା ହିନ୍ଦୀ ଶିଖିଲେ ବି ଚଳୁଥିଲା। ଯଦି ସଂସ୍କୃତ ଆୟତ୍ତ କରି ନ ପାରିବ, ହିନ୍ଦୀ ପଢ଼ିଲେ ଚଳିବ। ତେଣୁ ଦଶବର୍ଷିଆ ସରକାରୀ ଜନଗଣନାରେ ଲାଲା କାନସାରାମ ଏକ ସୁନାଗରିକ ଭାବରେ ନିଜର ମାତୃଭାଷା ଲେଖିବା ପାଇଁ ଉଦ୍ଦିଷ୍ଟ ଶୂନ୍ୟସ୍ଥାନରେ ପୂରଣ କରିଥିଲେ ‘ହିନ୍ଦୀ’; କିନ୍ତୁ ସେ ହିନ୍ଦୀ କହିପାରୁ ନଥିଲେ କିମ୍ବା କାଗଜରେ ଲେଖିପାରୁ ନଥିଲେ। ପାଟି ଖୋଲିଲେ ତାଙ୍କର ପଞ୍ଜାବୀ ଭାଷା ବାହାରୁଥିଲା, ତାଙ୍କ ଜନ୍ମସ୍ଥାନର କଥିତ, ପରିପୁଷ୍ଟ ଭାଷା। ଦୋକାନବଜାର ବା ରାସ୍ତାରେ କାହାକୁ କିଛି ଲେଖିଦେବା ଦରକାର ପଡ଼ିଲେ, ସେ ଉର୍ଦ୍ଦୁରେ ଲେଖୁଥିଲେ। କିଏ କହେ ଏହା ମୁସଲମାନଙ୍କ ଭାଷା? ଏହି ଭାଷାକୁ ସେ ତାଙ୍କ ବାପାଙ୍କଠାରୁ ଓ ତାଙ୍କ ଗାଁ ସିଆଲକୋଟ୍ଠାରୁ କେତେ ମାଇଲ ଦୂରର ଜଣେ ପ୍ରାଥମିକ ଶିକ୍ଷକଙ୍କ ଠାରୁ ଶିଖିଥିଲେ। ଉଭୟଙ୍କ ମଧ୍ୟରୁ କେହି ମୁସଲମାନ ନଥିଲେ। ଏହାର ଶେଷ ପରିଣତି ହୋଇଥିଲା— ପ୍ରତ୍ୟହ ସକାଳ | ବିଳୁପ୍ତ ଓଡ଼ିଆ ଲୋକ ସଂୃୃତିର କ୍ବୟଥା ଓ ବାଘ ଢ଼ିମିରାର କଥା ଲୋକ ସଂୃୃତି ବିଜ୍ଞାନ ଦୃଷ୍ଟିରୁ ଆଲୋଚନା କଲେ |
Newspaper
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ❌ | 0.95 | ଆମେରିକାରେ ବର୍ଣ୍ଣବୈଷମ୍ୟ: ‘ନିଗ୍ରୋ’ଙ୍କୁ ବିମାନରୁ ଓହ୍ଲାଇ ଦିଆଗଲା ୱାଶିଂଟନ,୩୧୫: ଆମେରିକାରେ ଏବେ ମଧ୍ୟ | କରିବା ପରେ ଏକ କଡ ଥିଲା। ବୋଲି ସାରା ଦେଶ | |
| ❌ | 0.87 | ଜିଲ୍ଲାସ୍ତରୀୟ ଜାତୀୟ ଉପଭୋକ୍ତା ଦିବସ ଜଗତସିଂହପୁର ସହର,୨୪/୧୨(ଇମିସ): ଜିଲ୍ଲା କୋର୍ଟ ପରିସରରେ ପ୍ରତିଷ୍ଠା ହେବାକୁ ଯାଉଥିବା ନୂଆ ଜଗତସିଂହପୁର ବୈମାପ ବିଜ୍ଞାନ ବିଭାଗ, ଖାଉଟି ବ୍ୟାପାର ଅଭିଯାନ ଓ ଗ୍ରାମୀଣ ବିକାଶ ଗୋଷ୍ଠୀ ସ୍ୱେଚ୍ଛାସେବୀ ଅନୁଷ୍ଠାନର ମିଳିତ ଆନୁକୂଲ୍ୟରେ ଜିଲ୍ଲାସ୍ତରୀୟ ଜାତୀୟ ଉପଭୋକ୍ତା ଦିବସ ପାଳିତ ହୋଇଯାଇଛି। ଖାଉଟି ବ୍ୟାପାର ଅଭିଯାନର ଶାଖା ସଭାପତି ପ୍ରସନ୍ନ କୁମାର ପାଢ଼ୀଙ୍କ ସଭାପତିତ୍ୱରେ ଅନୁଷ୍ଠିତ ଏହି ସଭାରେ ମୁଖ୍ୟ ଅତିଥି ଭାବେ ଅତିରିକ୍ତ ଜିଲ୍ଲାପାଳ ତଥା ଜିଲ୍ଲା ଖାଉଟି ସୁରକ୍ଷା ଅଧିକାରୀ ଜ୍ୟୋତିରଞ୍ଜନ ସେଠୀ ଏବଂ ମୁଖ୍ୟ ବକ୍ତା ଭାବେ ଜିଲ୍ଲା ଖାଉଟି ସୁରକ୍ଷା ଅଦାଲତର ସଭାପତି ଜ୍ୟୋତି ପ୍ରକାଶ ସ୍ୱାଇଁ ଯୋଗଦେଇ ଉପଭୋକ୍ତାଙ୍କ ବିଭିନ୍ନ ଅଭିଯୋଗର ସମାଧାନ ଏବଂ ସେମାନଙ୍କ ସୁରକ୍ଷା ସମ୍ପର୍କରେ ଆଲୋଚନା କରିଥିଲେ। ସେହିଭଳି ଅନ୍ୟତମ ସମ୍ମାନିତ ଅତିଥି ଭାବେ ଉପ-ସଚିବ ପୂର୍ଣ୍ଣ ଚନ୍ଦ୍ର ମହାପାତ୍ର ଯୋଗ ଦେଇଥିଲେ। | ଗୋପକନ୍ଥ ଦରିତ୍ର କଲ୍ୟାଣ ସମିତିର ବଳମେହ୍ୱାଦ କାରକଦେଳ, ୮ା୮ ପିଏମ୫ଧ୍ୟାନ ବାଳକରେ ବୁକ୍ କଲମ୍ବକଣି ସାତଅ ଅ | |
| ❌ | 0.89 | ଇ-ପବ୍ଲିକେଶନର ଲୋକପ୍ରିୟତା ବଢୁଛି ଭୁବନେଶ୍ୱର, (ବ୍ୟୁରୋ)— ବୈଷୟିକ ଜ୍ଞାନ କୌଶଳରେ ଉନ୍ନତି ସହ ଧୀରେ ଧୀରେ | ଲପବ୍ରିକେଶନର ଲୋକପ୍ରିୟତା ବଢ଼ୁଛି ଭୁବନେଶ୍ୱର,ବ୍ୟୁରୋ ବୈଷୟିକ ଞ୍ଜାନ କୌଶଳରେ ଉନ୍ନତି ସହ ଧାରେ ଧାରେ ଲୋକ | |
| ❌ | 0.91 | ମଲାଗୁଣୀ ବିଜୁ ସେତୁ ନିର୍ମାଣ ହେବ କେବେ ? ଖୋର୍ଦ୍ଧା, ୧୨/୧୦(ନି.ପ୍ର): ବିଜୁ ସେତୁ ଯୋଜନାରେ ଗୋଲବାଇଠାରୁ ତାଳପଡ଼ା ଯିବା ପାଇଁ ମଲାଗୁଣୀ ନଦୀରେ କରାଯାଉଥିବା ପୋଲ ନିର୍ମାଣରେ ଅହେତୁକ ବିଳମ୍ବ ଦେଖାଦେଇଛି । ଭିତ୍ତିପ୍ରସ୍ତର ସ୍ଥାପନର ୫ ବର୍ଷ ବିତିଥିଲେ ମଧ୍ୟ କାମ ଅଧାହୋଇନାହିଁ । ଏ ପର୍ଯ୍ୟନ୍ତ ପୋଲ ପାଇଁ ନଦୀରେ ହେଉଥିବା ଖୁଣ୍ଟ (ପିଲର) ସମ୍ପୂର୍ଣ୍ଣ ହୋଇନାହିଁ । ଗୋଲବାଇ ଶାସନ ଗ୍ରାମପଞ୍ଚାୟତରୁ ଛାତ୍ରଛାତ୍ରୀ ନିରାକାରପୁର ମହାବିଦ୍ୟାଳୟକୁ ପଢ଼ିବା ପାଇଁ ଏହି ପଥ ଦେଇ ଆସୁଛନ୍ତି । ଅନେକ ଲୋକ ନିରାକାରପୁର ହାଟ ଓ ନୂଆ ଜଗନ୍ନାଥ ସଡ଼କରେ ପୁରୀ ଯିବାକୁ ରାମେଶ୍ୱର ଗାଁ ଛକକୁ ଆସୁଛନ୍ତି । ବର୍ଷର ଅଧା ସମୟ ପାଣି ନ ଥିବାବେଳେ ନଦୀ ଭିତରେ ଯାଉଛନ୍ତି । ବର୍ଷର ଆଉ ଅଧା ଦିନ ବିଶେଷ କରି ବର୍ଷା ଋତୁରେ ନଦୀରେ ପାଣି ଥିବା ବେଳେ ଗୋଲବାଇ-ଜଙ୍କିଆ-ରାମେଶ୍ୱର ଛକ ଦେଇ ନିରାକାରପୁର ଯିବାକୁ ୧୨ କି.ମି ବୁଲିବାକୁ ପଡ଼ୁଛି । ମଲାଗୁଣୀ ନଦୀରେ ତାଳପଡ଼ା-ଗୋଲବାଇ ମଧ୍ୟରେ ସେତୁ ସଂଯୋଗ ହେଲେ ଦୂରତା କମିବ । ଗମନାଗମନକୁ ସରଳ କରିବା ପାଇଁ ୨୦୧୬ ଡିସେମ୍ବର ୧୭ ତାରିଖରେ ରାଜ୍ୟ ସରକାରଙ୍କ ବିଜୁ ସେତୁ ଯୋଜନାରେ ଏଠାରେ କାମ ଆରମ୍ଭ ହୋଇଥିଲା । ଓଡ଼ିଶା ସରକାରଙ୍କ ଗ୍ରାମ୍ୟ ଉନ୍ନୟନ ବିଭାଗ, ଗ୍ରାମ୍ୟ ନିର୍ମାଣ ଡିଭିଜନ ଭୁବନେଶ୍ୱରଙ୍କ ଦ୍ୱାରା ଏହାର ନିର୍ମାଣ କାର୍ଯ୍ୟ କରାଯାଉଛି । ପ୍ରକଳ୍ପ ପାଇଁ ପ୍ରଥମେ ୪ କୋଟି ୨୦ ଲକ୍ଷ ଟଙ୍କା ମଞ୍ଜୁର ହୋଇଥିଲା । ପରେ ଏହାର ଡିଜାଇନ ପରିବର୍ତ୍ତନ ହୋଇଛି । ଅନୁଦାନ ବଢ଼ି ସାଢ଼େ ୬ କୋଟି ହୋଇଥିବା ଶୁଣା ଯାଉଛି । ସରକାରଙ୍କ କୌଣସି ନୂତନ ବୃହତ୍ ପ୍ରକଳ୍ପ ହେଲେ ସାଧାରଣ ଲୋକ ଜାଣିବା ପାଇଁ ସୂଚନାଫଳକ ଲଗା ଯାଇଥାଏ । ପ୍ରକଳ୍ପ ବ୍ୟୟ ଅଟକଳ, ପୋଲର ଲମ୍ବ, ନିର୍ମାଣ ଆରମ୍ଭ ଓ ଶେଷ ତାରିଖ ଇତ୍ୟାଦି ଉଲ୍ଲେଖ ଥିବା ସୂଚନା ଫଳକ ଲଗାଯାଇ ନାହିଁ । ନଦୀରେ ୬୫ ମିଟର ସେତୁ କରାଯିବ । ସେତୁକୁ ଲାଗି ଉଭୟ ପଟେ ଚାରିଶହ ମିଟର ଲେଖାଏଁ ରାସ୍ତା କରାଯିବ ବୋଲି ବିଭାଗୀୟ ଯନ୍ତ୍ରୀ କହୁଛନ୍ତି । ସେତୁ ନିର୍ମାଣରେ ବିଳମ୍ବ ହେବାରୁ ସ୍ଥାନୀୟ ଲୋକଙ୍କ ମଧ୍ୟରେ ଅସନ୍ତୋଷ ଦେଖାଦେଇଛି । | ସ୍ନେହର ତୋରି ଗୋଟିଏ ସର୍କିସରେ କୁକୁରଟିଏ ଶେଳ ଦେଖାଉଥାଏ। ସେ ଖାଇପିଲ କେଶ୍ ମୋତାସୋଟା ହୋଇଥାଏ। କିନ୍ତୁ ତ | |
| ❌ | 0.92 | ଜିଲ୍ଲାରେ ଅଧାରୁ ଅଧିକ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ନାହିଁ ନିଜସ୍ୱ ଗୃହ ଖୋର୍ଦ୍ଧା, ୨/୧୧(ନି.ପ୍ର): ଶିଶୁଙ୍କ ପୁଷ୍ଟି ସାଧନ, ପ୍ରାକବିଦ୍ୟାଳୟ ଶିକ୍ଷା, ଗର୍ଭବତୀ ଓ ପ୍ରସୂତୀଙ୍କ ଯତ୍ନ ସହ ମହିଳାଙ୍କୁ ସ୍ବାବଲମ୍ବୀ କରିବା ପାଇଁ ସ୍ବୟଂ ସହାୟକ ଗୋଷ୍ଠୀ ଗଠନ ଆଦି ଗଠନ କାର୍ଯ୍ୟ ଆଦି ଅଙ୍ଗନବାଡ଼ି କର୍ମୀଙ୍କ ଉପରେ ନ୍ୟସ୍ତ । ଏସବୁ କାର୍ଯ୍ୟ ସୁଚାରୁ ରୂପେ ପରିଚାଳନା ପାଇଁ ଅଙ୍ଗନବାଡ଼ି ଗୃହର ଆବଶ୍ୟକତା ରହିଛି । ତେବେ ପ୍ରଶାସନିକ ଅବହେଳାରୁ ରାଜଧାନୀ ଜିଲ୍ଲା ଖୋର୍ଦ୍ଧା ଅଙ୍ଗନବାଡ଼ି ଗୃହ ନିର୍ମାଣ ଅଗ୍ରଗତି ନୈରାଶ୍ୟଜନକ ଥିବା ଜଣାପଡିଛି। କେଉଁଠି ଗୃହ ନିର୍ମାଣ ପାଇଁ ଜମି ମିଳୁନି, କେଉଁଠାରେ କାର୍ଯ୍ୟାଦେଶ ଦିଆଯିବା ପରେ କାମ ଆରମ୍ଭ ହେଉନି, ଆଉ କେଉଁଠି ମୂଳଦୁଆରୁ ଉଠୁନି ଏପରି ଅନେକ ଗୃହ ଅଧାପନ୍ତରିଆ ଭାବେ ରହିଥିବା ଜଣାପଡିଛି। ଗୃହ ନିର୍ମାଣ ପାଇଁ ଅର୍ଥ ମଞ୍ଜୁର ପରେ ମଧ୍ୟ ବର୍ଷ ବର୍ଷ ଧରି କାମ ନହେବା ବ୍ଲକ ବିଡିଓମାନଙ୍କ କାର୍ଯ୍ୟଦକ୍ଷତା ପ୍ରତି ପ୍ରଶ୍ନବାଚୀ ସୃଷ୍ଟିକରିଛି । ଖୋର୍ଦ୍ଧା ଜିଲ୍ଲାରେ ବର୍ତ୍ତମାନ ୨୫୫୪ଟି ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ର କାର୍ଯ୍ୟକରୁଛି । ପ୍ରାୟ ୬୫୨୦୫ ଜଣ ଶିଶୁ ପ୍ରାକବିଦ୍ୟାଳୟ ଶିକ୍ଷା ଲାଭ କରୁଛନ୍ତି। ଜିଲ୍ଲାରେ ୨୫୫୪ରୁ ୧୧୯୧ କେନ୍ଦ୍ରର ନିଜସ୍ବ ଗୃହ ଥିବାବେଳେ ୧୩୬୩ କେନ୍ଦ୍ରର ନାହିଁ ନିଜସ୍ବ ଗୃହ ନ ଥିବା ଜଣାପଡିଛି। ଗର୍ଭବତୀ ମହିଳା ଓ ଶିଶୁଙ୍କ ପୁଷ୍ଟି ସାଧନ ପାଇଁ ସରକାରଙ୍କ ପକ୍ଷରୁ ବ୍ୟାପକ ବ୍ୟବସ୍ଥା କରାଯାଇଛି। ତେବେ ଅନେକ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ନିଜସ୍ୱ ଗୃହ ନଥିବାରୁ ସୁଚାରୁ ରୂପେ କାର୍ଯ୍ୟ କରିପାରୁନାନ୍ତି । ୨୦୦୮ ପୂର୍ବରୁ ଖୋର୍ଦ୍ଧା ଜିଲ୍ଲାରେ ୨୦୨ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ନିଜସ୍ବ ଗୃହ ଥିଲା। ଏହା ପରେ ୨୦୦୮-୦୯ରୁ ୨୦୨୧ଆର୍ଥିକ ବର୍ଷ ମଧ୍ୟରେ ୧୦୧୭ଟି ନୂଆ ଅଙ୍ଗନବାଡ଼ି କେନ୍ଦ୍ରର ଗୃହ ନିର୍ମାଣ ପାଇଁ ଅର୍ଥ ମଞ୍ଜୁର ହୋଇଛି। ସେଥିରୁ ୧୮୯ କେନ୍ଦ୍ରର ନିର୍ମାଣ ପାଇଁ ସ୍ଥାନ ଚୟନ ହୋଇଥିବାବେଳେ ୨୨୭ କେନ୍ଦ୍ର ଗୃହ ପାଇଁ ଜମି ଚିହ୍ନଟ ହୋଇନଥିବା ଜଣାପଡିଛି। ସ୍ଥାନ ଚୟନ ହୋଇଥିବା ୧୮୯ କେନ୍ଦ୍ରରୁ ୧୨୦୫ କେନ୍ଦ୍ର ନିର୍ମାଣ କରିବା ପାଇଁ କାର୍ଯ୍ୟାଦେଶ ଦିଆଯାଇଛି। ୨୨୪ ପ୍ରକଳ୍ପର କାର୍ଯ୍ୟାଦେଶ ଦେବାକୁ ରହିଛି। ମଞ୍ଜୁର ହୋଇଥିବା ୨୦୧୭ ନୂଆ ଅଙ୍ଗନବାଡ଼ି ଗୃହରୁ ମାତ୍ର ୧୦୦୭ ଗୃହ ନିର୍ମାଣ ସରିଛି। ସେହିପରି କାର୍ଯ୍ୟାଦେଶ ଦିଆଯାଇଥିଲେ ମଧ୍ୟ କେତେକ ଗୃହର ନିର୍ମାଣ କାର୍ଯ୍ୟ ଆରମ୍ଭ ହୋଇନାହିଁ। ୬୦ଟି ଘର ମୂଳଦୁଆରେ ଅଟକିଥିବାବେଳେ ପିଲିନ୍ଥ ଲେଭଲରେ ୧୧ଟି, ଲିଣ୍ଟାଲ ଲେଭଲ ୩୮ଟି ଗୃହ, ଛାତ ଲେଭଲ ୬୫ଟି ଗୃହ, ଛାତ ପଡ଼ି ୭୫ଟି ଓ ୮୦ଟି ଘର ନିର୍ମାଣ କାର୍ଯ୍ୟ ସରିବା ଭଳି ସ୍ଥିତିରେ ରହିଛି। ବାଲିଅନ୍ତା ବ୍ଲକରେ ୧୨୧ ମଞ୍ଜୁର ହୋଇଥିବାବେଳେ ୯୫ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବାଲିପାଟଣା ବ୍ଲକରେ ୧୩୫ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ୧୦୪ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଜଟଣୀ ବ୍ଲକରେ ୧୨୬ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ୯୩ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଖୋର୍ଦ୍ଧା ୧୫୭ବ୍ଲକରେ ମଞ୍ଜୁର ହୋଇଥିବାବେଳେ ୯୩ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବେଗୁନିଆ ବ୍ଲକରେ ୧୧୬ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ୮୮ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବୋଲଗଡ଼ ବ୍ଲକରେ ୧୮୩ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ମାତ୍ର ୧୦୩ ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଟାଙ୍ଗୀ ବ୍ଲକରେ ୨୩୫ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ୧୦୬ ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଚିଲିକା ବ୍ଲକରେ ୧୬୧ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ମାତ୍ର ୫୮ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବାଣପୁର ବ୍ଲକରେ ୧୪୯ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ମାତ୍ର ୫୫ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଭୁବନେଶ୍ବର ଅର୍ବାନରେ ୬୬ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ୩୨ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବିଏମସି-୧ରେ ୧୧୭ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ୨୮ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ବିଏମସି-୨ ରେ ୨୯ଗୃହ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ୧୯ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି, ଭୁବନେଶ୍ବର ରୁରାଲରେ ୧୪୧ ଗୃହ ନିର୍ମାଣ ପାଇଁ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ସେଥିରୁ ୭୩ଟି ଗୃହ ନିର୍ମାଣ ସରିଥିବା ଜଣାପଡିଛି। ମିଳିଥିବା ସୂଚନା ଅନୁଯାୟୀ ୨୦୧୩-୧୪ ଆର୍ଥିକ ବର୍ଷରେ ମହାତ୍ମାଗାନ୍ଧୀ ଜାତୀୟ ଗ୍ରାମୀଣ ନିଶ୍ଚିତ କର୍ମ ନିଯୁକ୍ତି ଯୋଜନାରେ ୧୧୭ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା। ସେଥିରୁ ୮୯ଟି ସରିଛି, ସିଏସପି ଯୋଜନାରେ ୩୮୦ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା ସେଥିରୁ ୨୪୫ଟି ଗୃହ ନିର୍ମାଣ ସରିଛି। ୨୦୧୪-୧୫ରେ ମହାତ୍ମାଗାନ୍ଧୀ ଜାତୀୟ ଗ୍ରାମୀଣ ନିଶ୍ଚିତ କର୍ମନିଯୁକ୍ତି ଯୋଜନାରେ ୭୧ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା। ସେଥିରୁ ୫୯ଟି ସରିଛି। ୧୩ଟି ଯୋଜନାରେ ୧୦ଟି ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା ସେଥିରୁ ୭ଟି ଗୃହ ଶେଷ ହୋଇଛି। ୨୦୧୫-୧୬ରେ ମହାତ୍ମାଗାନ୍ଧୀ ଜାତୀୟ ଗ୍ରାମୀଣ ନିଶ୍ଚିତ କର୍ମନିଯୁକ୍ତି ଯୋଜନାରେ ୭୦ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା ସେଥିରୁ ୩୪ଟି ନିର୍ମାଣ ସରିଛି। ୨୦୧୬-୧୭ରେ ମହାତ୍ମାଗାନ୍ଧୀ ଜାତୀୟ ଗ୍ରାମୀଣ ନିଶ୍ଚିତ କର୍ମ ନିଯୁକ୍ତି ଯୋଜନାରେ ୩୩୦ ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା ସେଥିରୁ ୧୬୬ ଗୃହ ନିର୍ମାଣ ସରିଛି। ସେହିପରି ୨୦୧୭-୧୮ରେ ରାଜ୍ୟ ଯୋଜନାରେ ୯୩ଟି ଗୃହ ମଞ୍ଜୁର ହୋଇଥିଲା ୧୯ଟି ନିର୍ମାଣ ସରିଛି। ୨୦୧୮-୧୯ରେ ୩୮୪ ଓ ୧୯୨୦ରେ ୧୫୬ ଗୃହ ନିର୍ମାଣ ପାଇଁ ଅର୍ଥ ମଞ୍ଜୁର ହୋଇଥିବା ବେଳେ ୮୦ ଭାଗ ଗୃହ ନିର୍ମାଣ ସରି ନ ଥିବା ଅଭିଯୋଗ ହେଉଛି। | ମଲାଗୁଣୀ ବିଚ୍ଛୁସେତୁ ନିର୍ମାଣହେବ କେବେ ଖୋର୍ଦ୍ଧା,୧୭।୧୦ନିପ୍ର ବିଜୁ ସେତୁ ଯୋଜନାରେ ଗୋଳଦାଇଠାରୁ ଚାଳପଡ |
Printed
| Quality | CER | Image | Ground Truth | Prediction |
|---|---|---|---|---|
| ✅ | 0.00 | ଅପରାହ୍ନ | ଅପରାହ୍ନ | |
| ✅ | 0.00 | ପରିଚିତ | ପରିଚିତ | |
| ✅ | 0.14 | ଦିନବେଳା | ଦିନବେଳ | |
| ✅ | 0.00 | ଅହିରାଜ | ଅହିରାଜ | |
| ✅ | 0.00 | ତୋଳି | ତୋଳି |
In-Domain Long Paragraphs (OdiaGenAIOCR/synthetic_data)
Evaluated on 3 long paragraph samples (>200 chars) at checkpoint-300:
| # | CER | Ground Truth (truncated) | Model Output (truncated) |
|---|---|---|---|
| 1 | 0.815 | ଗୋପକୁ ଗଲେ କୃଷ୍ଣ ବରଗଡ଼ (ଦୀପକ ଶର୍ମା): ମଥୁରାନଗରୀ ସାଜିଥିବା ବରଗଡ଼ରେ ଚାଲିଛି ପ୍ରବଳ ପ୍ରତାପି ମହାରାଜ… | ଯୋଦ୍ଧାକୁ ଘରେ ଦୃଢ଼ ବଜରଡ଼ ଡାଏର ଶର୍ମା ମନ୍ତ୍ରଣାଳୟର ଗାଢିଥିବା ବଜରଡ଼ରେ ତାଲିଛି। ପୂର୍ବକ ପ୍ରତାପି ମହାରାଜ… |
| 2 | 0.706 | ଖେଳୁଥିବା ସମୟରେ ଆକାଶରୁ ଖସିଲା ନିଆଁ, ଚାଲିଗଲା ନାବାଳକର ଜୀବନ କରଞ୍ଜିଆ(ଓଡ଼ିଶା ରିପୋର୍ଟର): ଆକାଶରୁ… | ଶୋକୁଥିବା ସମୟରେ ଆକାଶରୁ ଖସିଲା ନିଆଁ, ଚାଲିଗଲା ନାବାଳକର ଜୀବନ କରିଲାଣାଓଡ଼ିଶା ରିପୋର୍ଟର ଆକାଶରୁ… |
| 3 | 0.790 | ନମସ୍କାର ବନ୍ଧୁଗଣ ତେବେ ଧନ ତ୍ରୟୋଦଶୀ ଦିନ ପ୍ରାୟତଃ ଧନତେରସ ପୂଜା କରାଯାଏ । ହିନ୍ଦୁ ଧର୍ମରେ ଧନ୍ତେରସ ସୁଖ… | ନମ୍ବୋର ବନ୍ଧୁଗଣ ତେବେ ଧନ ତ୍ରୟୋଦଶୀ ଦିନ ପ୍ରାୟତଃ ଧନରେଷ ସୂଚୀ କରାଯାଏ । କିନ୍ତୁ ଧର୍ମରେ ଧନରେଷ ସୁଖ… |
| Avg | 0.770 |
⚠️ These are paragraph-level newspaper/synthetic images — a significantly harder task than word-level OCR. Model is at step 300/3000 (~10% through training).
Out-of-Domain Benchmark — Checkpoint 300 (Iftesha/odia-ocr-benchmark — 151 samples)
| Category | Samples | Avg CER | Accuracy |
|---|---|---|---|
| scene_text | 50 | 0.637 | 36.3% |
| handwritten | 19 | 0.663 | 33.7% |
| Digital | 10 | 0.705 | 29.5% |
| Book | 11 | 0.906 | 9.4% |
| Newspaper | 11 | 0.941 | 5.9% |
| printed | 50 | 1.287 | — † |
| Overall | 151 | 0.902 | 9.9% |
† CER > 1 on
printedindicates hallucination — model generates longer output than the ground truth.
Intended Use
- Primary use: OCR on printed Odia text in document or paragraph images
- Language: Odia (ISO 639-1:
or) — one of the 22 scheduled languages of India - Not intended for: handwritten Odia, non-Odia scripts, or real-time edge deployment without quantization
Limitations
- Model is actively training; checkpoints before step 3000 will under-perform
- Performance on heavily degraded or handwritten images has not been evaluated
- No RLHF / DPO alignment — outputs are raw OCR transcriptions
Project
This model is part of the OdiaGenAI initiative to build open-source AI tools for the Odia language.
- Organization: OdiaGenAI
- Datasets: OdiaGenAIOCR/synthetic_data
- Author: shantipriya
Citation
If you use this model, please cite:
@misc{odia-ocr-qwen-v3,
author = {Shantipriya Parida},
title = {Odia OCR Qwen2.5-VL LoRA Fine-tune v3},
year = {2026},
publisher = {HuggingFace},
url = {https://huggingface.co/shantipriya/odia-ocr-qwen-finetuned_v3}
}
License
This project is licensed under the Creative Commons Attribution–NonCommercial–ShareAlike 4.0 International License (CC BY-NC-SA 4.0).
For full license details, see: https://creativecommons.org/licenses/by-nc-sa/4.0/
- Downloads last month
- -
Model tree for OdiaGenAIOCR/odia-ocr-qwen-finetuned_v3
Base model
Qwen/Qwen2.5-VL-7B-Instruct






