Update README.md
Browse files
README.md
CHANGED
|
@@ -14,13 +14,13 @@ language:
|
|
| 14 |
license: cc-by-nc-4.0
|
| 15 |
---
|
| 16 |
|
| 17 |
-
#
|
| 18 |
|
| 19 |
## Model Details
|
| 20 |
|
| 21 |
### Model Description
|
| 22 |
|
| 23 |
-
Haredi-Aya-3B הוא מודל שפה ממוזג (Merged) המבוסס על Tiny-Aya-Global. המודל עבר כוונון עדין (Fine-tuning) ממוקד כדי להתאים את תגובותיו לערכי הציבור החרדי, תוך דגש על סינון תכנים שאינם הולמים, מניעת עיסוק בנושאי כפירה, עבודה זרה, ושמירה על גדרי הצניעות
|
| 24 |
|
| 25 |
- **Developed by:** EMD123
|
| 26 |
- **Model type:** Causal Language Model (Fine-tuned with QLoRA)
|
|
@@ -53,7 +53,7 @@ Haredi-Aya-3B הוא מודל שפה ממוזג (Merged) המבוסס על Tiny-
|
|
| 53 |
```python
|
| 54 |
from transformers import AutoModelForCausalLM, AutoTokenizer
|
| 55 |
|
| 56 |
-
model_id = "[EMD123]/
|
| 57 |
tokenizer = AutoTokenizer.from_pretrained(model_id)
|
| 58 |
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype="auto")
|
| 59 |
|
|
@@ -68,7 +68,7 @@ print(tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=Tru
|
|
| 68 |
### Training Data
|
| 69 |
המודל אומן על דאטה-סט ייעודי שנבנה ידנית וכולל כ-520 דוגמאות:
|
| 70 |
|
| 71 |
-
דוגמאות סינון: הנחיות לסירוב מנומס ומנומק לנושאים שאינם צנועים, כפירה,
|
| 72 |
|
| 73 |
דוגמאות שימור: שאלות בידע כללי, קוד ושפה כדי לשמר את יכולות הליבה של המודל.
|
| 74 |
|
|
|
|
| 14 |
license: cc-by-nc-4.0
|
| 15 |
---
|
| 16 |
|
| 17 |
+
# tiny-aya-kosher-3.3B: מודל שפה מותאם לערכי הצניעות וההלכה
|
| 18 |
|
| 19 |
## Model Details
|
| 20 |
|
| 21 |
### Model Description
|
| 22 |
|
| 23 |
+
Haredi-Aya-3B הוא מודל שפה ממוזג (Merged) המבוסס על Tiny-Aya-Global. המודל עבר כוונון עדין (Fine-tuning) .ממוקד כדי להתאים את תגובותיו לערכי הציבור החרדי, תוך דגש על סינון תכנים שאינם הולמים, מניעת עיסוק בנושאי כפירה, עבודה זרה, ושמירה על גדרי הצניעות .
|
| 24 |
|
| 25 |
- **Developed by:** EMD123
|
| 26 |
- **Model type:** Causal Language Model (Fine-tuned with QLoRA)
|
|
|
|
| 53 |
```python
|
| 54 |
from transformers import AutoModelForCausalLM, AutoTokenizer
|
| 55 |
|
| 56 |
+
model_id = "[EMD123]/tiny-aya-kosher-3.3B"
|
| 57 |
tokenizer = AutoTokenizer.from_pretrained(model_id)
|
| 58 |
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype="auto")
|
| 59 |
|
|
|
|
| 68 |
### Training Data
|
| 69 |
המודל אומן על דאטה-סט ייעודי שנבנה ידנית וכולל כ-520 דוגמאות:
|
| 70 |
|
| 71 |
+
דוגמאות סינון: הנחיות לסירוב מנומס ומנומק לנושאים שאינם צנועים, כפירה, ודתות אחרות.
|
| 72 |
|
| 73 |
דוגמאות שימור: שאלות בידע כללי, קוד ושפה כדי לשמר את יכולות הליבה של המודל.
|
| 74 |
|