Spaces:

TruVlad
/

flaskAPI

Paused

TruVlad commited on Feb 28

Commit

bcaf6d9

verified ·

1 Parent(s): 9088a98

Upload folder using huggingface_hub

Files changed (4) hide show

Dockerfile CHANGED Viewed

@@ -28,6 +28,8 @@ RUN apt-get install git g++ python3 python3-pip -y && apt-get clean
 COPY requirements.txt requirements.txt
 COPY pull06.sh pull06.sh
 RUN /bin/bash -x pull06.sh
 COPY pull8.sh pull8.sh
 # RUN /bin/bash -x pull8.sh
 COPY pull14.sh pull14.sh

 COPY requirements.txt requirements.txt
 COPY pull06.sh pull06.sh
 RUN /bin/bash -x pull06.sh
+COPY pull4.sh pull4.sh
 COPY pull8.sh pull8.sh
 # RUN /bin/bash -x pull8.sh
 COPY pull14.sh pull14.sh

main.py CHANGED Viewed

@@ -16,13 +16,13 @@ def test_world():
     response: ListResponse = ollist()
     ansver = []
     for model in response.models:
-      ansver.append(f'Name:{model.model}')
       ansver.append(f'\t Size (MB): {(model.size.real / 1024 / 1024):.2f}')
       if model.details:
-        ansver.append(f'  Format: {model.details.format}')
-        ansver.append(f'  Family:  {model.details.family}')
-        ansver.append(f'  Parameter Size:  {model.details.parameter_size}')
-        ansver.append(f'  Quantization Level:{model.details.quantization_level}')
     result = [f'<p>{answ}</p>' for answ in ansver ]
     return '\n'.join(result)
@@ -31,10 +31,9 @@ def test_world():
 def ps():
     from ollama import ProcessResponse, chat, ps, pull
     ansver = []
     response: ProcessResponse = ps()
     for model in response.models:
-          ansver.append(f'Model:  {model.model}')
           ansver.append(f'  Digest:  {model.digest}')
           ansver.append(f'  Expires at: {model.expires_at}')
           ansver.append(f'  Size:  {model.size}')
@@ -49,8 +48,7 @@ def ps():
 def test_time():
     return time_model('qwen3:0.6b')
-@app.route('/tim4')
 def test_time4():
   return time_model('qwen3:4b')

     response: ListResponse = ollist()
     ansver = []
     for model in response.models:
+      ansver.append(f'<h4>Name:{model.model}</h4>')
       ansver.append(f'\t Size (MB): {(model.size.real / 1024 / 1024):.2f}')
       if model.details:
+        ansver.append(f'\t  Format: {model.details.format}')
+        ansver.append(f'\t  Family:  {model.details.family}')
+        ansver.append(f'\t  Parameter Size:  {model.details.parameter_size}')
+        ansver.append(f'\t  Quantization Level:{model.details.quantization_level}')
     result = [f'<p>{answ}</p>' for answ in ansver ]
     return '\n'.join(result)
 def ps():
     from ollama import ProcessResponse, chat, ps, pull
     ansver = []
     response: ProcessResponse = ps()
     for model in response.models:
+          ansver.append(f'<h4>Model</h4>:  {model.model}')
           ansver.append(f'  Digest:  {model.digest}')
           ansver.append(f'  Expires at: {model.expires_at}')
           ansver.append(f'  Size:  {model.size}')
 def test_time():
     return time_model('qwen3:0.6b')
+@app.route('/time4')
 def test_time4():
   return time_model('qwen3:4b')

start.sh CHANGED Viewed

@@ -6,6 +6,7 @@ while true
   done >/dev/null 2>&1 &
 echo  sleep 3
 sleep 3
 /bin/bash pull8.sh
 /bin/bash pull14.sh
 python3 main.py

   done >/dev/null 2>&1 &
 echo  sleep 3
 sleep 3
+/bin/bash pull4.sh
 /bin/bash pull8.sh
 /bin/bash pull14.sh
 python3 main.py

util.py CHANGED Viewed

@@ -8,7 +8,7 @@ def ps():
     response: ProcessResponse = ps()
     for model in response.models:
-          ansver.append(f'Model:  {model.model}')
           ansver.append(f'\t Digest:  {model.digest}')
           ansver.append(f'\t  Expires at: {model.expires_at}')
           ansver.append(f'\t  Size:  {model.size}')
@@ -41,7 +41,7 @@ def time_model(model_name='qwen3:0.6b'):
   response_len = len(response['message']['content'])
   ansver.append(f' lehgth {response_len}')
   response_speed=response_len/int(response_time.seconds)
-  ansver.append(f' token/sek {response_len}')
   ansver.append(response['message']['content'])
   result = [f'<p>{answ}</p>' for answ in ansver ]
   return '\n'.join(result)

     response: ProcessResponse = ps()
     for model in response.models:
+          ansver.append(f'<h3>Mode<h3>:  {model.model}')
           ansver.append(f'\t Digest:  {model.digest}')
           ansver.append(f'\t  Expires at: {model.expires_at}')
           ansver.append(f'\t  Size:  {model.size}')
   response_len = len(response['message']['content'])
   ansver.append(f' lehgth {response_len}')
   response_speed=response_len/int(response_time.seconds)
+  ansver.append(f' token/sek {response_speed}')
   ansver.append(response['message']['content'])
   result = [f'<p>{answ}</p>' for answ in ansver ]
   return '\n'.join(result)