Spaces:

tddf
/

end

Sleeping

App Files Files Community

tddf commited on 22 days ago

Commit

5aecba1

verified ·

1 Parent(s): b6335f5

Upload 5 files

Browse files

Files changed (5) hide show

.gitattributes +35 -35
Dockerfile +18 -20
README.md +13 -20
app.py.txt +73 -0
requirements.txt.txt +4 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,35 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

Dockerfile CHANGED Viewed

@@ -1,20 +1,18 @@
-FROM python:3.13.5-slim
-WORKDIR /app
-RUN apt-get update && apt-get install -y \
-    build-essential \
-    curl \
-    git \
-    && rm -rf /var/lib/apt/lists/*
-COPY requirements.txt ./
-COPY src/ ./src/
-RUN pip3 install -r requirements.txt
-EXPOSE 8501
-HEALTHCHECK CMD curl --fail http://localhost:8501/_stcore/health
-ENTRYPOINT ["streamlit", "run", "src/streamlit_app.py", "--server.port=8501", "--server.address=0.0.0.0"]

+FROM python:3.10-slim
+# Создаём непривилегированного пользователя (требование Hugging Face)
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user PATH=/home/user/.local/bin:$PATH
+# Устанавливаем рабочую директорию
+WORKDIR $HOME/app
+# Копируем все файлы из текущей папки в контейнер
+COPY --chown=user . $HOME/app
+# Устанавливаем зависимости Python
+RUN pip install --no-cache-dir -r requirements.txt
+# Запускаем Streamlit на порту 7860 (этот порт ожидает Hugging Face)
+CMD ["streamlit", "run", "app.py", "--server.port=7860", "--server.address=0.0.0.0"]

README.md CHANGED Viewed

@@ -1,20 +1,13 @@
----
-title: End
-emoji: 🚀
-colorFrom: red
-colorTo: red
-sdk: docker
-app_port: 8501
-tags:
-- streamlit
-pinned: false
-short_description: Streamlit template space
-license: apache-2.0
----
-# Welcome to Streamlit!
-Edit `/src/streamlit_app.py` to customize this app to your heart's desire. :heart:
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).

+---
+title: English OCR App
+emoji: 🔤
+colorFrom: blue
+colorTo: indigo
+sdk: docker
+app_file: app.py
+pinned: false
+---
+# English OCR with LightOnOCR
+Upload an image containing English text, and the model will extract it.

app.py.txt ADDED Viewed

	@@ -0,0 +1,73 @@

+import io
+import os
+import streamlit as st
+import torch
+from PIL import Image
+from transformers import AutoProcessor, AutoModelForSeq2SeqLM
+# --- Настройка кэша для модели (чтобы не скачивать при каждом запуске) ---
+# Hugging Face Spaces даёт нам постоянную папку /data, если включить Persistent Storage.
+# Если /data существует, используем её, иначе временную папку /tmp.
+CACHE_DIR = "/data/.huggingface" if os.path.exists("/data") else "/tmp/.huggingface"
+os.makedirs(CACHE_DIR, exist_ok=True)
+# --- Функция загрузки модели с кэшированием через Streamlit ---
+@st.cache_resource  # Эта декорация сохраняет модель в памяти между запусками
+def load_model():
+    model_name = "lightonai/LightOnOCR-1B-1025"
+    # Определяем, есть ли GPU (CUDA)
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    st.write(f"Using device: {device}")  # Для отладки в логах
+    # Загружаем процессор (преобразует изображение в тензоры) и модель
+    processor = AutoProcessor.from_pretrained(model_name, cache_dir=CACHE_DIR)
+    model = AutoModelForSeq2SeqLM.from_pretrained(model_name, cache_dir=CACHE_DIR)
+    model = model.to(device)  # Перемещаем модель на GPU/CPU
+    return processor, model, device
+# --- Интерфейс загрузки изображения ---
+def load_image():
+    uploaded_file = st.file_uploader(
+        'Выберите изображение с английским текстом',
+        type=['png', 'jpg', 'jpeg']
+    )
+    if uploaded_file is not None:
+        # Читаем байты и показываем картинку
+        image_data = uploaded_file.getvalue()
+        st.image(image_data, use_column_width=True)
+        # Конвертируем в RGB (на всякий случай)
+        return Image.open(io.BytesIO(image_data)).convert('RGB')
+    return None
+# --- Заголовок приложения ---
+st.title('🇬🇧 Распознавание английского текста (LightOnOCR)')
+# --- Загружаем модель (один раз) ---
+with st.spinner('Загрузка модели... Это может занять 1-2 минуты при первом запуске'):
+    processor, model, device = load_model()
+# --- Загружаем изображение ---
+img = load_image()
+# --- Кнопка распознавания ---
+if st.button('Распознать текст') and img is not None:
+    with st.spinner('Распознавание...'):
+        # Преобразуем изображение в формат, понятный модели
+        inputs = processor(images=img, return_tensors="pt").to(device)
+        # Генерируем текст (без вычисления градиентов, чтобы экономить память)
+        with torch.no_grad():
+            generated_ids = model.generate(
+                **inputs,
+                max_new_tokens=512,   # Максимум символов на выходе
+                do_sample=False,      # Детерминированный режим (лучше для OCR)
+                num_beams=1
+            )
+        # Декодируем ID токенов обратно в строку
+        generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+        st.success('✅ Распознано!')
+        st.markdown('**📝 Текст на изображении:**')
+        st.markdown(f'`{generated_text}`')

requirements.txt.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+streamlit
+torch
+transformers
+pillow