Spaces:

gijl
/

sdk

Paused

App Files Files Community

gijl commited on 13 days ago

Commit

114c977

verified ·

1 Parent(s): c2805ad

Update run.sh

Browse files

Files changed (1) hide show

run.sh +21 -18

run.sh CHANGED Viewed

@@ -17,11 +17,11 @@ mkdir -p /data/webui
 # ===================================================================
 # تحميل النموذج من Hugging Face (إن لم يكن موجوداً)
-# نحفظه مباشرة في /data/models بدون نسخ إضافية
 # ===================================================================
 if [ ! -f "$MODELS_DIR/$MODEL_FILE" ]; then
     echo ">>> النموذج غير موجود، جارٍ التحميل من Hugging Face..."
-    huggingface-cli download gijl/gemma-4-E2B-it-GGUF "$MODEL_FILE" \
         --local-dir "$MODELS_DIR" \
         --local-dir-use-symlinks False
     echo ">>> تم تحميل النموذج بنجاح."
@@ -32,9 +32,12 @@ fi
 # تحميل ملف الرؤية (mmproj) إن لم يكن موجوداً
 if [ ! -f "$MODELS_DIR/$MMPROJ_FILE" ]; then
     echo ">>> تحميل ملف الرؤية (mmproj)..."
-    huggingface-cli download gijl/gemma-4-E2B-it-GGUF "$MMPROJ_FILE" \
         --local-dir "$MODELS_DIR" \
         --local-dir-use-symlinks False
 fi
 # ===================================================================
@@ -47,24 +50,24 @@ fi
 # - يدعم OpenAI API مباشرة
 #
 # خيارات الذاكرة:
-# --mmap       : يعيّن الملف في الذاكرة بدلاً من تحميله كاملاً (افتراضي)
-# --no-mlock   : يسمح للنظام بتبادل الصفحات (swap) عند الضغط
-# --flash-attn : يقلل استهلاك ذاكرة الـ attention
 # ===================================================================
 echo ">>> تشغيل خادم llama.cpp على المنفذ $LLAMA_PORT..."
 python3 -m llama_cpp.server \
-    --model          "$MODELS_DIR/$MODEL_FILE" \
     --clip_model_path "$MODELS_DIR/$MMPROJ_FILE" \
-    --host           0.0.0.0 \
-    --port           $LLAMA_PORT \
-    --n_ctx          8192 \
-    --n_threads      2 \
-    --n_gpu_layers   0 \
-    --chat_format    gemma \
-    --flash_attn     true \
-    --use_mmap       true \
-    --use_mlock      false \
-    --verbose        false &
 LLAMA_PID=$!
 echo ">>> PID خادم llama.cpp: $LLAMA_PID"
@@ -101,4 +104,4 @@ export HOST=0.0.0.0
 # ===================================================================
 echo ">>> تشغيل Open WebUI..."
 cd /app/backend
-exec bash start.sh

 # ===================================================================
 # تحميل النموذج من Hugging Face (إن لم يكن موجوداً)
+# huggingface-cli أصبح deprecated — نستخدم "hf" الجديد
 # ===================================================================
 if [ ! -f "$MODELS_DIR/$MODEL_FILE" ]; then
     echo ">>> النموذج غير موجود، جارٍ التحميل من Hugging Face..."
+    hf download gijl/gemma-4-E2B-it-GGUF "$MODEL_FILE" \
         --local-dir "$MODELS_DIR" \
         --local-dir-use-symlinks False
     echo ">>> تم تحميل النموذج بنجاح."
 # تحميل ملف الرؤية (mmproj) إن لم يكن موجوداً
 if [ ! -f "$MODELS_DIR/$MMPROJ_FILE" ]; then
     echo ">>> تحميل ملف الرؤية (mmproj)..."
+    hf download gijl/gemma-4-E2B-it-GGUF "$MMPROJ_FILE" \
         --local-dir "$MODELS_DIR" \
         --local-dir-use-symlinks False
+    echo ">>> تم تحميل ملف الرؤية بنجاح."
+else
+    echo ">>> ملف الرؤية موجود مسبقاً، تخطي التحميل."
 fi
 # ===================================================================
 # - يدعم OpenAI API مباشرة
 #
 # خيارات الذاكرة:
+# --use_mmap  true  : يعيّن الملف في الذاكرة بدلاً من تحميله كاملاً
+# --use_mlock false : يسمح للنظام بتبادل الصفحات (swap) عند الضغط
+# --flash_attn true : يقلل استهلاك ذاكرة الـ attention
 # ===================================================================
 echo ">>> تشغيل خادم llama.cpp على المنفذ $LLAMA_PORT..."
 python3 -m llama_cpp.server \
+    --model           "$MODELS_DIR/$MODEL_FILE" \
     --clip_model_path "$MODELS_DIR/$MMPROJ_FILE" \
+    --host            0.0.0.0 \
+    --port            $LLAMA_PORT \
+    --n_ctx           8192 \
+    --n_threads       2 \
+    --n_gpu_layers    0 \
+    --chat_format     gemma \
+    --flash_attn      true \
+    --use_mmap        true \
+    --use_mlock       false \
+    --verbose         false &
 LLAMA_PID=$!
 echo ">>> PID خادم llama.cpp: $LLAMA_PID"
 # ===================================================================
 echo ">>> تشغيل Open WebUI..."
 cd /app/backend
+exec bash start.sh