AlexandreScriptsMT commited on
Commit
11c56e3
·
verified ·
1 Parent(s): fd3622a

Update Dockerfile

Browse files
Files changed (1) hide show
  1. Dockerfile +11 -25
Dockerfile CHANGED
@@ -1,36 +1,22 @@
1
- # Use uma imagem Python leve
2
  FROM python:3.10-slim
3
 
4
- # Instalar dependências de build necessárias para compilar o llama-cpp
5
- RUN apt-get update && apt-get install -y \
6
- build-essential \
7
- cmake \
8
- python3-dev \
9
- curl \
10
- && rm -rf /var/lib/apt/lists/*
11
-
12
- # Definir diretório de trabalho
13
  WORKDIR /app
14
 
15
- # Instalar llama-cpp-python otimizado para CPU
16
- # Usamos flags para garantir que não tente usar CUDA (GPU)
17
- RUN CMAKE_ARGS="-DLLAMA_BLAS=ON -DLLAMA_BLAS_VENDOR=OpenBLAS" \
18
- pip install llama-cpp-python huggingface_hub[cli] gradio
19
-
20
- # Criar pasta para o modelo
21
- RUN mkdir -p /app/models
22
 
23
- # Baixar o modelo Llama-3.1-8B-Instruct Q4_K_M durante o build
24
- # Isso evita downloads demorados toda vez que o Space reiniciar
25
- RUN huggingface-cli download bartowski/Meta-Llama-3.1-8B-Instruct-GGUF \
26
- --include "Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf" \
27
- --local-dir /app/models
28
 
29
- # Copiar seu script de interface (app.py) para o container
30
  COPY app.py .
31
 
32
- # Hugging Face Spaces roda na porta 7860 por padrão
33
  EXPOSE 7860
34
 
35
- # Comando para rodar a aplicação
36
  CMD ["python", "app.py"]
 
1
+ # Imagem leve
2
  FROM python:3.10-slim
3
 
 
 
 
 
 
 
 
 
 
4
  WORKDIR /app
5
 
6
+ # Instala apenas o essencial para rodar, sem compilar nada pesado
7
+ RUN apt-get update && apt-get install -y \
8
+ libopenblas-dev \
9
+ && rm -rf /var/lib/apt/lists/*
 
 
 
10
 
11
+ # A MÁGICA: Instalando a biblioteca pronta para CPU (evita os 25 min de build)
12
+ RUN pip install --no-cache-dir \
13
+ https://github.com \
14
+ gradio huggingface_hub
 
15
 
16
+ # Copia o script de execução
17
  COPY app.py .
18
 
19
+ # Porta padrão do Hugging Face
20
  EXPOSE 7860
21
 
 
22
  CMD ["python", "app.py"]