Spaces:

gijl
/

sdk

Paused

App Files Files Community

gijl commited on 12 days ago

Commit

3b6e7de

verified ·

1 Parent(s): 114c977

Update run.sh

Browse files

Files changed (1) hide show

run.sh +4 -17

run.sh CHANGED Viewed

@@ -2,7 +2,7 @@
 set -e
 # ===================================================================
-# إعدادات المسارات (نفس هيكل التخزين السابق)
 # ===================================================================
 MODELS_DIR="/data/models"
 MODEL_FILE="gemma-4-E2B-it-UD-Q5_K_XL.gguf"
@@ -17,13 +17,12 @@ mkdir -p /data/webui
 # ===================================================================
 # تحميل النموذج من Hugging Face (إن لم يكن موجوداً)
-# huggingface-cli أصبح deprecated — نستخدم "hf" الجديد
 # ===================================================================
 if [ ! -f "$MODELS_DIR/$MODEL_FILE" ]; then
     echo ">>> النموذج غير موجود، جارٍ التحميل من Hugging Face..."
     hf download gijl/gemma-4-E2B-it-GGUF "$MODEL_FILE" \
-        --local-dir "$MODELS_DIR" \
-        --local-dir-use-symlinks False
     echo ">>> تم تحميل النموذج بنجاح."
 else
     echo ">>> النموذج موجود مسبقاً، تخطي التحميل."
@@ -33,8 +32,7 @@ fi
 if [ ! -f "$MODELS_DIR/$MMPROJ_FILE" ]; then
     echo ">>> تحميل ملف الرؤية (mmproj)..."
     hf download gijl/gemma-4-E2B-it-GGUF "$MMPROJ_FILE" \
-        --local-dir "$MODELS_DIR" \
-        --local-dir-use-symlinks False
     echo ">>> تم تحميل ملف الرؤية بنجاح."
 else
     echo ">>> ملف الرؤية موجود مسبقاً، تخطي التحميل."
@@ -42,17 +40,6 @@ fi
 # ===================================================================
 # تشغيل خادم llama.cpp
-#
-# مزايا على Ollama:
-# - بلا daemon ثقيل في الخلفية
-# - يقرأ ملف GGUF مباشرة (بدون نسخ أو blobs)
-# - يستخدم mmap لتعيين الملف في الذاكرة (توفير RAM)
-# - يدعم OpenAI API مباشرة
-#
-# خيارات الذاكرة:
-# --use_mmap  true  : يعيّن الملف في الذاكرة بدلاً من تحميله كاملاً
-# --use_mlock false : يسمح للنظام بتبادل الصفحات (swap) عند الضغط
-# --flash_attn true : يقلل استهلاك ذاكرة الـ attention
 # ===================================================================
 echo ">>> تشغيل خادم llama.cpp على المنفذ $LLAMA_PORT..."
 python3 -m llama_cpp.server \

 set -e
 # ===================================================================
+# إعدادات المسارات
 # ===================================================================
 MODELS_DIR="/data/models"
 MODEL_FILE="gemma-4-E2B-it-UD-Q5_K_XL.gguf"
 # ===================================================================
 # تحميل النموذج من Hugging Face (إن لم يكن موجوداً)
+# --local-dir-use-symlinks أُزيل من CLI الجديد، نستخدم --local-dir فقط
 # ===================================================================
 if [ ! -f "$MODELS_DIR/$MODEL_FILE" ]; then
     echo ">>> النموذج غير موجود، جارٍ التحميل من Hugging Face..."
     hf download gijl/gemma-4-E2B-it-GGUF "$MODEL_FILE" \
+        --local-dir "$MODELS_DIR"
     echo ">>> تم تحميل النموذج بنجاح."
 else
     echo ">>> النموذج موجود مسبقاً، تخطي التحميل."
 if [ ! -f "$MODELS_DIR/$MMPROJ_FILE" ]; then
     echo ">>> تحميل ملف الرؤية (mmproj)..."
     hf download gijl/gemma-4-E2B-it-GGUF "$MMPROJ_FILE" \
+        --local-dir "$MODELS_DIR"
     echo ">>> تم تحميل ملف الرؤية بنجاح."
 else
     echo ">>> ملف الرؤية موجود مسبقاً، تخطي التحميل."
 # ===================================================================
 # تشغيل خادم llama.cpp
 # ===================================================================
 echo ">>> تشغيل خادم llama.cpp على المنفذ $LLAMA_PORT..."
 python3 -m llama_cpp.server \