Spaces:

gijl
/

g

Sleeping

App Files Files Community

gijl commited on 22 days ago

Commit

a4ad16e

verified ·

1 Parent(s): 21a5a8f

Create app.py

Browse files

Files changed (1) hide show

app.py +51 -0

app.py ADDED Viewed

	@@ -0,0 +1,51 @@

+import gradio as gr
+import torch
+from transformers import AutoProcessor, AutoModelForImageTextToText
+from PIL import Image
+# اسم النموذج
+model_id = "gijl/gemma-4-E4B-it"
+# تحميل المعالج والنموذج
+# استخدمنا torch.bfloat16 و low_cpu_mem_usage لمحاولة تقليل استهلاك الذاكرة قدر الإمكان
+processor = AutoProcessor.from_pretrained(model_id)
+model = AutoModelForImageTextToText.from_pretrained(
+    model_id,
+    torch_dtype=torch.bfloat16,
+    low_cpu_mem_usage=True,
+    device_map="auto"
+)
+def process_image_and_text(image, text):
+    if image is None:
+        return "الرجاء رفع صورة."
+    if not text:
+        text = "Describe this image." # نص افتراضي إذا لم يقم المستخدم بإدخال نص
+    # تجهيز المدخلات
+    inputs = processor(text=text, images=image, return_tensors="pt")
+    inputs = {k: v.to(model.device) for k, v in inputs.items()}
+    # توليد النص
+    with torch.no_grad():
+        generated_ids = model.generate(**inputs, max_new_tokens=100)
+    # فك تشفير النص الناتج
+    generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return generated_text
+# بناء واجهة المستخدم باستخدام Gradio
+demo = gr.Interface(
+    fn=process_image_and_text,
+    inputs=[
+        gr.Image(type="pil", label="رفع الصورة"),
+        gr.Textbox(label="أدخل سؤالك أو طلبك هنا", placeholder="مثال: ماذا يوجد في هذه الصورة؟")
+    ],
+    outputs=gr.Textbox(label="النتيجة"),
+    title="Gemma Image-to-Text Model",
+    description="تطبيق لتشغيل نموذج gijl/gemma-4-E4B-it للرؤية والنصوص."
+)
+# تشغيل الواجهة
+if __name__ == "__main__":
+    demo.launch()