🖋️ Urdu Poetry TrOCR (General Edition)

یہ ماڈل ایک خصوصی Vision Encoder-Decoder (TrOCR) ہے جسے اردو شاعری (خصوصاً نستعلیق رسم الخط) کی پہچان کے لیے تیار کیا گیا ہے۔ یہ ماڈل شعری اصناف، پیچیدہ نستعلیق جوڑوں اور مصرعوں کی ترتیب کو سمجھنے میں مہارت رکھتا ہے۔

📊 تجرباتی نتائج (Visual Performance Gallery)

درج ذیل اشعار اس ماڈل کے تازہ ترین ورژن پر ٹیسٹ کیے گئے ہیں:

اصل تصویر (Original Image) ماڈل کی پہچان (OCR Prediction)
sher_1 سنا ہے لوگ اسے آنکھ بھر کے دیکھتے ہیں
سو اس کے شہر میں کچھ دن ٹھہر کے دیکھتے ہیں
sher_2 سنا ہے ربط ہے اس کو خراب حالوں سے
سو اپنے آپ کو برباد کر کے دیکھتے ہیں
sher_3 سنا ہے درد کی گاہک ہے چشم ناز اس کی
سو ہم بھی اس کی گلی سے گزر کے دیکھتے ہیں
sher_4 سنا ہے اس کو بھی ہے شعر و شاعری سے شغف
سو ہم بھی معجزے اپنے ہنر کے دیکھتے ہیں
sher_5 سنا ہے بولے تو باتوں سے پھول جھڑتے ہیں
یہ بات ہے تو چلو بات کر کے دیکھتے ہیں

🛠️ استعمال کا طریقہ (Python Code)

بہترین نتائج کے لیے درج ذیل پیرامیٹرز (Parameters) استعمال کریں، جو نستعلیق کی پیچیدگیوں کو مدنظر رکھ کر ترتیب دیے گئے ہیں:

import torch
from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image

# ماڈل لوڈ کریں
repo_id = "Khurram123/urdu-poetry-trocr"
processor = TrOCRProcessor.from_pretrained(repo_id)
model = VisionEncoderDecoderModel.from_pretrained(repo_id).to("cuda" if torch.cuda.is_available() else "cpu")

def get_prediction(image_path):
    image = Image.open(image_path).convert("RGB")
    pixel_values = processor(image, return_tensors="pt").pixel_values.to(model.device)
    
    generated_ids = model.generate(
        pixel_values,
        max_length=256,
        num_beams=5,
        repetition_penalty=3.0, 
        length_penalty=2.0,
        early_stopping=False
    )
    return processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
Downloads last month
76
Safetensors
Model size
0.3B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support