HeavensHackDev commited on
Commit
dd2a138
·
verified ·
1 Parent(s): f521886

Delete README.md

Browse files
Files changed (1) hide show
  1. README.md +0 -36
README.md DELETED
@@ -1,36 +0,0 @@
1
- Моя нейросеть (~10M параметров)
2
- Это приложение реализует трансформерную модель с ~10M параметров для генерации текста. Модель использует PyTorch и предоставляет интерфейс через Gradio.
3
- Установка
4
-
5
- Убедитесь, что все зависимости установлены:
6
-
7
- torch==2.0.1
8
- gradio==4.44.0
9
- torchtext==0.15.2
10
-
11
-
12
- Для работы приложения требуется файл весов model.pt. Чтобы обучить модель:
13
-
14
- Запустите train.py локально или на облачной платформе (например, Google Colab) с вашим датасетом.
15
- Скопируйте полученный model.pt в корень репозитория.
16
-
17
-
18
-
19
- Использование
20
-
21
- Запустите приложение через Hugging Face Spaces или локально:python app.py
22
-
23
-
24
- Введите начальный текст в интерфейсе Gradio, и модель продолжит его.
25
-
26
- Обучение
27
-
28
- Для обучения замените sample_data в train.py на ваш текстовый датасет (например, WikiText).
29
- Запустите train.py на машине с GPU для ускорения.
30
- После обучения загрузите model.pt в репозиторий.
31
-
32
- Замечания
33
-
34
- Модель оптимизирована для работы на бесплатном оборудовании Hugging Face Spaces. Если возникают проблемы с памятью, уменьшите EMBED_SIZE или NUM_LAYERS в app.py и train.py.
35
- Для улучшения качества генерации увеличьте размер датасета и количество эпох обучения.
36
-