omni-image-editor-API

Sleeping

App Files Files Community

Saravutw commited on Feb 5

Commit

e0ed766

verified ·

1 Parent(s): fd73d22

Update app.py

Browse files

Files changed (1) hide show

app.py +57 -31

app.py CHANGED Viewed

@@ -1,45 +1,71 @@
 import torch
-from diffusers import AutoPipelineForText2Image
-# การตั้งค่าเบื้องต้น
-model_id = "stabilityai/sdxl-turbo"
-# 1. โหลดโมเดล
-# ใช้ torch.float32 สำหรับ CPU เพื่อความเสถียรสูงสุด (CPU บางตัวไม่รองรับ half-precision ได้ดี)
-# low_cpu_mem_usage=True จะช่วยลดการกระชากของ RAM ตอนโหลดโมเดล (ต้องมี accelerate library)
 pipe = AutoPipelineForText2Image.from_pretrained(
-    model_id,
-    torch_dtype=torch.float32,
-    variant="fp16", # โหลด weight แบบ fp16 เพื่อลดขนาดไฟล์ดาวน์โหลด แต่รันจริงบน float32
-    use_safetensors=True
 )
-# 2. ย้ายไปที่ CPU (ระบุชัดเจน)
 pipe.to("cpu")
-# การปรับแต่ง Memory เพิ่มเติม (ถ้า RAM 18GB เต็มจริงๆ อาจต้องเปิดใช้ attention slicing แต่มันจะทำให้เจนภาพช้าลง)
-# pipe.enable_attention_slicing()
-def generate_image(prompt_text):
-    # SDXL Turbo ปกติเทรนมาที่ 512x512 การดันไป 1024x1024 บน CPU จะใช้เวลานานขึ้นและกิน RAM สูง
-    # แต่สามารถทำได้โดยการกำหนด height/width
-    image = pipe(
-        prompt=prompt_text,
-        num_inference_steps=2,  # SDXL Turbo ต้องการแค่ 1-4 step (2 คือจุดสมดุลที่ดีสำหรับ 1024px)
-        guidance_scale=0.0,     # สำคัญ: Turbo ไม่ใช้ CFG (Guidance Scale) ต้องตั้งเป็น 0.0 เพื่อให้ภาพไม่เละและอิสระตามโมเดล
-        width=1024,
-        height=1024,
-    ).images[0]
     return image
-# ส่วนของการทดสอบรัน (ตัวอย่าง)
-if __name__ == "__main__":
-    # ใส่ Prompt ที่ต้องการทดสอบตรงนี้
-    user_prompt = "A cinematic shot of a cyberpunk street in rain, neon lights, highly detailed, 8k"
-    print("Starting generation... (CPU may take time)")
-    result = generate_image(user_prompt)
-    result.save("output_1024.png")
-    print("Image saved as output_1024.png")

 import torch
+import gradio as gr
+import os
+from diffusers import AutoPipelineForText2Image, DPMSolverMultistepScheduler
+# เปลี่ยนเป็นโมเดลตระกูล XL ที่เน้นความสมจริงและรันไว (Lightning/Turbo)
+# ตัวนี้ยังอยู่ในตระกูลเดียวกับที่ทำไว้ แต่ให้งานผิวและแสงที่ต่างออกไป
+MODEL_ID = "SG_161222/RealVisXL_V4.0_Lightning"
+print(f"Loading {MODEL_ID} using existing CPU-optimized structure...")
 pipe = AutoPipelineForText2Image.from_pretrained(
+    MODEL_ID,
+    torch_dtype=torch.float32,
+    low_cpu_mem_usage=True
 )
 pipe.to("cpu")
+# ใช้บรรทัดฐานเดิมที่ทำให้เรา Never OOM
+pipe.scheduler = DPMSolverMultistepScheduler.from_config(pipe.scheduler.config)
+pipe.enable_attention_slicing("max")
+pipe.enable_vae_tiling()
+torch.set_num_threads(os.cpu_count())
+STYLE_MAP = {
+    "สมจริง (Photo)": "cinematic photo, highly detailed, 8k wallpaper, realistic skin texture",
+    "ศิลปะ (Artistic)": "digital art, masterpiece, intricate details, vibrant",
+    "ไม่เน้นสไตล์": ""
+}
+def gen(prompt, style_name, negative_prompt, steps, cfg, width, height):
+    if not prompt: return None
+    style_prompt = STYLE_MAP.get(style_name, "")
+    full_prompt = f"{prompt}, {style_prompt}"
+    with torch.no_grad():
+        image = pipe(
+            prompt=full_prompt,
+            negative_prompt=negative_prompt,
+            num_inference_steps=int(steps),
+            guidance_scale=float(cfg),
+            width=int(width),
+            height=int(height)
+        ).images[0]
     return image
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown(f"### 🚀 CPU Optimized: {MODEL_ID}")
+    with gr.Row():
+        with gr.Column():
+            prompt = gr.Textbox(label="Prompt", lines=2)
+            style_name = gr.Radio(choices=list(STYLE_MAP.keys()), value="สมจริง (Photo)", label="Style")
+            with gr.Accordion("Advanced Settings", open=False):
+                negative = gr.Textbox(label="Negative", value="low quality, blurry, deformed")
+                steps = gr.Slider(1, 10, 4, step=1, label="Steps (Lightning/Turbo use 4-8)")
+                cfg = gr.Slider(0.0, 2.0, 1.0, step=0.1, label="CFG (Lightning use 1.0-2.0)")
+                width = gr.Slider(256, 512, 384, step=64, label="Width")
+                height = gr.Slider(256, 512, 512, step=64, label="Height")
+            btn = gr.Button("Generate", variant="primary")
+        with gr.Column():
+            output_img = gr.Image(label="Result")
+    btn.click(fn=gen, inputs=[prompt, style_name, negative, steps, cfg, width, height], outputs=[output_img])
+demo.launch()