Spaces:

eoeooe
/

libmeka

Sleeping

App Files Files Community

eoeooe commited on Sep 11, 2025

Commit

279c6b7

verified ·

1 Parent(s): 78e386f

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -53

app.py CHANGED Viewed

@@ -1,54 +1,29 @@
 import gradio as gr
-from transformers import DetrImageProcessor, DetrForObjectDetection
-from PIL import Image, ImageDraw
-import torch
-import io
-# โหลดโมเดล Hugging Face DETR
-processor = DetrImageProcessor.from_pretrained("facebook/detr-resnet-50")
-model = DetrForObjectDetection.from_pretrained("facebook/detr-resnet-50")
-def detect_and_crop(image: Image.Image):
-    # เตรียม input
-    inputs = processor(images=image, return_tensors="pt")
-    with torch.no_grad():
-        outputs = model(**inputs)
-    # postprocess
-    target_sizes = torch.tensor([image.size[::-1]])  # (height, width)
-    results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.9)[0]
-    if len(results["boxes"]) == 0:
-        return image, []
-    # วาดกรอบบนภาพต้นฉบับ
-    image_with_boxes = image.copy()
-    draw = ImageDraw.Draw(image_with_boxes)
-    cropped_images = []
-    for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
-        box = [round(i, 2) for i in box.tolist()]
-        label_name = model.config.id2label[label.item()]
-        draw.rectangle(box, outline="red", width=3)
-        draw.text((box[0], box[1] - 10), f"{label_name} ({score:.2f})", fill="red")
-        # Crop และเก็บใน list
-        cropped = image.crop(box)
-        cropped_images.append(cropped)
-    return image_with_boxes, cropped_images
-# UI ด้วย Gradio
-interface = gr.Interface(
-    fn=detect_and_crop,
-    inputs=gr.Image(type="pil", label="อัปโหลดภาพ"),
-    outputs=[
-        gr.Image(type="pil", label="ภาพที่มีกรอบวัตถุ"),
-        gr.Gallery(label="Crop วัตถุที่เจอ").style(grid=3, height="auto")
-    ],
-    title="🔍 ตรวจจับวัตถุด้วย DETR (Hugging Face) และ Crop",
-    description="อัปโหลดภาพ แล้วระบบจะตรวจจับวัตถุ (threshold > 90%) และแสดงภาพที่ crop แล้ว"
-)
-interface.launch()

 import gradio as gr
+from PIL import Image
+from transformers import TrOCRProcessor, VisionEncoderDecoderModel
+# โหลด model และ processor จาก Hugging Face
+processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten")
+model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")
+def ocr_on_cropped(image: Image.Image):
+    if image is None:
+        return "กรุณาอัปโหลดและครอบภาพก่อน"
+    # แปลงภาพเป็น input ของ HuggingFace model
+    pixel_values = processor(images=image, return_tensors="pt").pixel_values
+    generated_ids = model.generate(pixel_values)
+    generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return generated_text.strip()
+with gr.Blocks() as demo:
+    gr.Markdown("## 🤗 OCR ด้วย HuggingFace - อัปโหลดและครอบภาพ")
+    with gr.Row():
+        image_input = gr.Image(type="pil", interactive=True, label="อัปโหลดและครอบภาพ")
+        ocr_result = gr.Textbox(label="ข้อความที่ตรวจพบ")
+    image_input.change(fn=ocr_on_cropped, inputs=image_input, outputs=ocr_result)
+demo.launch()