Text Retrieval
sentence-transformers
Safetensors
Amharic
xlm-roberta
sparse-encoder
sparse
splade
Generated from Trainer
dataset_size:245876
loss:SpladeLoss
loss:SparseMultipleNegativesRankingLoss
loss:FlopsLoss
Eval Results (legacy)
Instructions to use rasyosef/splade-amharic-medium with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use rasyosef/splade-amharic-medium with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("rasyosef/splade-amharic-medium") sentences = [ "The weather is lovely today.", "It's so sunny outside!", "He drove to the stadium." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] - Notebooks
- Google Colab
- Kaggle
Improve model card: update pipeline tag and add paper/code links (#1)
Browse files- Improve model card: update pipeline tag and add paper/code links (2847d64ca6ab7aa8bbe451224cab041bfaf74a4f)
Co-authored-by: Niels Rogge <nielsr@users.noreply.huggingface.co>
README.md
CHANGED
|
@@ -1,124 +1,11 @@
|
|
| 1 |
---
|
|
|
|
|
|
|
|
|
|
| 2 |
language:
|
| 3 |
- am
|
| 4 |
-
license: mit
|
| 5 |
-
tags:
|
| 6 |
-
- sentence-transformers
|
| 7 |
-
- sparse-encoder
|
| 8 |
-
- sparse
|
| 9 |
-
- splade
|
| 10 |
-
- generated_from_trainer
|
| 11 |
-
- dataset_size:245876
|
| 12 |
-
- loss:SpladeLoss
|
| 13 |
-
- loss:SparseMultipleNegativesRankingLoss
|
| 14 |
-
- loss:FlopsLoss
|
| 15 |
-
base_model: rasyosef/roberta-medium-amharic
|
| 16 |
-
widget:
|
| 17 |
-
- text: የኢንዱስትሪ ፓርኮች ፈተና እና ተስፋ
|
| 18 |
-
- text: >-
|
| 19 |
-
ከሳምንት በፊት በመፈንቅለ መንግሥት ሥልጣናቸውን አጥተዋል፡፡ አሁን በቁም እስር ላይ ናቸው፡፡
|
| 20 |
-
|
| 21 |
-
|
| 22 |
-
ከስማቸው አወዛጋቢነት እስከ አገሪቱ ትክክለኛ የስም አጠራር ድረስ የቀድሞዋ በርማ የአሁኗ ሚየንማር፣ የቀድሞዋ የሰብአዊ
|
| 23 |
-
መብት እመቤት፣ የአሁኗ እስረኛ የሰሞኑ የሚዲያ ዐቢይ ጉዳይ ሆነዋል፡፡
|
| 24 |
-
|
| 25 |
-
|
| 26 |
-
በእርግጥ የሴትዮዋ ‹ሌጋሲ› በትክክል ምንድነው? በሚለው ጉዳይ ሚዲያዎችና ተቋማት ተስማምተው አያውቁም፡፡
|
| 27 |
-
|
| 28 |
-
|
| 29 |
-
ለመሆኑ ኦን ሳን ሱ ቺ ማን ናቸው?
|
| 30 |
-
|
| 31 |
-
|
| 32 |
-
አን ሳን ሱ ቺ አባታቸው የበርማ የነጻነት አባት የሚባሉት የጄኔራል ኦን ሳን ሴት ልጅ ናቸው፡፡
|
| 33 |
-
|
| 34 |
-
|
| 35 |
-
ታላቋ ብሪታኒያ በርማን (በአዲሱ ስሟ ሚየንማር) ለአንድ ክፍለ ዘመን ያህል ጊዜ በቅኝ ገዝታታለች፡፡
|
| 36 |
-
|
| 37 |
-
|
| 38 |
-
ጄኔራል ኦን ሰን ለበርማ ነጻነት ተዋድቀዋል፡፡ የተገደሉትም በ1947 በተቀናቃኞቻቸው ነበር፡፡ ያን ጊዜ ሳን ሱ ቺ ገና
|
| 39 |
-
2 ዓመቷ ነበር፡፡ አን ሳን ሱ ቺ በሰኔ 19፣ 1945 ነበር የተወለዱት፡፡
|
| 40 |
-
|
| 41 |
-
|
| 42 |
-
ኦን ሳን ሱ ቺ በ1960ዎቹ መጀመርያ ከእናታቸው ዳው ኪን ኬዪ ጋር ወደ ሕንድ ሄዱ፡፡ እናታቸው በደልሂ የበርማ
|
| 43 |
-
አምባሳደር ተደርገው በመሾማቸው ነበር ወደዚያ ያቀኑት፡፡
|
| 44 |
-
|
| 45 |
-
|
| 46 |
-
ሕንድ አራት ዓመት ከኖሩ በኋላ ወደ ታላቋ ብሪታኒያ በማቅናት በሥመጥሩ ኦክስፎርድ ዩኒቨርስቲ ፍልስፍናን፣ ፖለቲካንና
|
| 47 |
-
ምጣኔ ሀብትን አጥንተዋል፡፡
|
| 48 |
-
|
| 49 |
-
|
| 50 |
-
አን ሳን ሱ ቺ በኦክስፎርድ ዩኒቨርስቲ ሳሉ የወደፊት ባለቤታቸው ጋር ተገናኙ፡፡ እንግሊዛዊው ባለቤታቸው ማይክል አሪስ
|
| 51 |
-
የታሪክ ተመራማሪ ፕሮፌሰር ነበሩ፡፡ አሁን በሕይወት የሉም፡፡
|
| 52 |
-
|
| 53 |
-
|
| 54 |
-
ኦን ሳን ሱ ቺ ከትምህርት በኋላ በቡታን እና በጃፓን በተለያዩ ሥራዎች ላይ ተሳትፈዋል፡፡ ከዚያ በኋላ ወደ ታላቋ
|
| 55 |
-
ብሪታኒያ በመሄድ ጎጆ መሥርተው አሌክሳንደርና ኪም የሚባሉ ልጆችን አፍርተዋል፡፡
|
| 56 |
-
|
| 57 |
-
|
| 58 |
-
በ1988 ከታላቋ ብሪታኒያ ወደ ሚየንማር ዋና ከተማ ያንጎን ሲመለሱ በጠና ታመው የነበሩትን እናታቸውን ለማስታመም
|
| 59 |
-
ነበር፡፡
|
| 60 |
-
|
| 61 |
-
|
| 62 |
-
የአጋጣሚ ነገር ሆኖ በበዚያ ወቅት በሚየንማር በርካታ የዲሞክራሲ ጥያቄዎችን ያነሱ ወጣቶች አደባባይ ወጥተው ተቃውሞ
|
| 63 |
-
ያስነሱበት ጊዜ ነበር፡፡
|
| 64 |
-
|
| 65 |
-
|
| 66 |
-
ተቃዋሚዎቹ ወጣቶች ብቻ ሳይሆኑ የቡድሀ መነኮሳት፣ የቢሮ ሰራተኞችና ተማሪዎችም ይገኙበት ነበር፡፡
|
| 67 |
-
|
| 68 |
-
|
| 69 |
-
ይህን ተቃውሞ ተከትሎ አን ሳን ሱ ቺ ጠቅልለው በሚየንማር መኖር ጀመሩ፡፡
|
| 70 |
-
|
| 71 |
-
|
| 72 |
-
አን ሳን ሱቺ ከቀድሞ ባለቤታቸው ጋር በለንደን
|
| 73 |
-
|
| 74 |
-
|
| 75 |
-
ከ2 ዓመት በኋላ በ1990 አዲስ በተመሠረተው የናሽናል ሊግ ፓርቲ ውስጥ ገብተው ተቃውሞ ውስጥ በቀጥታ መሳተፍ ጀመሩ፡፡
|
| 76 |
-
በአካባቢ ምርጫ ተወዳድረውም አሸነፉ፡፡
|
| 77 |
-
|
| 78 |
-
|
| 79 |
-
በከፍተኛ ድምጽ የኦን ሳን ሱ ቺ በምርጫ ማሸነፍ ያስቆጣው ወታደራዊው መንግሥት ሴትዮዋን ለሚቀጥሉት 20 ዓመታት በቁም
|
| 80 |
-
እስር አስቀመጣቸው፡፡
|
| 81 |
-
|
| 82 |
-
|
| 83 |
-
በ1991 ኦን ሳን ሱ ቺ በቁም እስር ላይ ሳሉ የኖቤል ሽልማትን አሸነፉ፡፡ ይህም ወታደራዊውን መንግሥት በይበልጥ
|
| 84 |
-
አስቆጣ፡፡
|
| 85 |
-
|
| 86 |
-
|
| 87 |
-
በ2010 ኦን ሳን ሱ ቺ ከቁም እስር ነጻ ተባሉ፡፡
|
| 88 |
-
|
| 89 |
-
|
| 90 |
-
በ2012 አን ሳን ሱ ቺና ፓርቲያቸው በአካባቢ ምርጫ እንዲሳተፉ ወታደራዊው መንግሥት ፈቀደ፡፡
|
| 91 |
-
|
| 92 |
-
|
| 93 |
-
በ2015 የብሔራዊ ሊግ ለዲሞክራሲ (NLD) ፓርቲያቸው ለመጀመርያ ጊዜ በተደረገ ከፍተኛ ፉክክር በታየበት ምርጫ
|
| 94 |
-
አሸነፈ፡፡
|
| 95 |
-
|
| 96 |
-
|
| 97 |
-
አን ሳን ሱ ቺ በሚየንማር ���ሮሒንጋ ሙስሊሞች ላይ ወታደሩ ያደረሰውን ግፍና ጭፍጨፋ ለማውገዝ አለመፍቀዳቸው በዓለም አቀፍ
|
| 98 |
-
የሰብአዊ መብት ተሟጋቾች ዘንድ ቁጣን ቀሰቀሰ፡፡ በመቶ ሺ የሚቆጠሩ የሮሒንጋ ሙስሊሞች ከሚየንማር ሞትን ሽሽት ወደ
|
| 99 |
-
ባንግላዴሽ ተሰደዋል፡፡
|
| 100 |
-
|
| 101 |
-
|
| 102 |
-
በዓለም አቀፉ ማኅበረሰብ ዘንድ ክብራቸው ዝቅ ይበል እንጂ አን ሳን ሱ ቺ በአገራቸው ቡድሀዎች ዘንድ እጅግ ተወዳጅ
|
| 103 |
-
ናቸው፡፡
|
| 104 |
-
|
| 105 |
-
|
| 106 |
-
አን ሳን ሱ ቺ በ2015 የተደረገውን ምርጫ አሸንፈው መንግሥት ቢመሠርቱም የአገሪቱ ፕሬዝዳንት መሆን...
|
| 107 |
-
- text: >-
|
| 108 |
-
አዲስ አበባ ፣ ነሃሴ 23 ፣ 2012 (ኤፍ ቢ ሲ) ኢትዮጵያ፣ ሱዳን እና ግብጽ በታላቁ የህዳሴ ግድብ አሞላል እና ውሃ
|
| 109 |
-
አለቃቀቅ ደንብ ላይ የሚያደርጉት የሶስትዮሽ ስብሰባ መስከረም ወር ላይ እንደሚቀጥል የውሃ መስኖና ኢነርጅ ሚኒስቴር
|
| 110 |
-
አስታወቀ፡፡ሚኒስቴሩ የሶስቱ ሃገራት የውሃ ጉዳይ ሚኒስትሮች በትናንትናው እለት ስብሰባ ማካሄዳቸውን
|
| 111 |
-
አስታውቋል፡፡በስብሰባው ላይ የሂደቱ ታዛቢ የሆኑት የደቡብ አፍሪካ፣ የአውሮፓ ህብረት እና የአሜሪካ ተወካዮች እንዲሁም
|
| 112 |
-
ከአፍሪካ ህብረት የተወከሉ ባለሙያዎች መሳተፋቸውንም ገልጿል፡፡በወቅቱም ላላፈው አንድ ሳምንት በሃገራቱ ባለሙያዎች በታላቁ
|
| 113 |
-
የህዳሴ ግድብ አሞላልና የውሃ አለቃቀቅ ደንብ ላይ ሲከናወን የነበረው የባለሙያዎች ድርድር ሪፖርት መቅረቡንም
|
| 114 |
-
ጠቅሷል፡፡በቀጣይ የሚኖረውን ሂደት በሚመለከትም ሃገራቱ የድርድሩን ሂደት የሚገልጽ ደብዳቤ ለደቡብ አፈሪካዋ ዓለም አቀፍ
|
| 115 |
-
ግንኙነት እና ትብብር ሚኒስትር እና የአፍሪካ ህብረት አስፈጻሚ ምክር ቤት የወቅቱ ሊቀ መንበር ዶክተር ናዴሊ ፓንዶል
|
| 116 |
-
ለመላክ መስማማታቸውንም ነው የገለጸው፡፡በዚህም ሱዳን የምትሰጠው ማረጋገጫ እንደሚጠበቅ የገለጸው ሚኒስቴሩ የሶስትዮሽ
|
| 117 |
-
ስብሰባው መስከረም 4 ቀን 2013 ዓ.ም እንደሚቀጥል አስታውቋል፡፡
|
| 118 |
-
- text: "በፕሪሚየር ሊጉ ኢትዮጵያ ቡና እና ወልቂጤ ከተማ\_አቻ ተለያዩ \_"
|
| 119 |
-
- text: ፕሪሚየር ሊግ ፡ ሲዳማ ከሜዳው ውጪ ጣፋጭ ድል ሲያስመዘግብ አርባምንጭ ከ ዳሽን ቢራ አቻ ተለያይተዋል
|
| 120 |
-
pipeline_tag: feature-extraction
|
| 121 |
library_name: sentence-transformers
|
|
|
|
| 122 |
metrics:
|
| 123 |
- dot_accuracy@1
|
| 124 |
- dot_accuracy@3
|
|
@@ -139,6 +26,57 @@ metrics:
|
|
| 139 |
- query_sparsity_ratio
|
| 140 |
- corpus_active_dims
|
| 141 |
- corpus_sparsity_ratio
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 142 |
model-index:
|
| 143 |
- name: SPLADE-RoBERTa-Amharic-Medium
|
| 144 |
results:
|
|
@@ -146,8 +84,8 @@ model-index:
|
|
| 146 |
type: sparse-information-retrieval
|
| 147 |
name: Sparse Information Retrieval
|
| 148 |
dataset:
|
| 149 |
-
name:
|
| 150 |
-
type:
|
| 151 |
metrics:
|
| 152 |
- type: dot_accuracy@1
|
| 153 |
value: 0.6285881663737551
|
|
@@ -206,31 +144,31 @@ model-index:
|
|
| 206 |
- type: corpus_sparsity_ratio
|
| 207 |
value: 0.9963146789694772
|
| 208 |
name: Corpus Sparsity Ratio
|
| 209 |
-
datasets:
|
| 210 |
-
- rasyosef/Amharic-Passage-Retrieval-Dataset-V2
|
| 211 |
---
|
| 212 |
|
| 213 |
# SPLADE-Amharic-Medium
|
| 214 |
|
| 215 |
-
This is a [SPLADE Sparse Encoder](https://www.sbert.net/docs/sparse_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It maps sentences & paragraphs to a 32000-dimensional sparse vector space
|
|
|
|
|
|
|
|
|
|
| 216 |
## Model Details
|
| 217 |
|
| 218 |
### Model Description
|
| 219 |
- **Model Type:** SPLADE Sparse Encoder
|
| 220 |
-
- **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic)
|
| 221 |
- **Maximum Sequence Length:** 510 tokens
|
| 222 |
- **Output Dimensionality:** 32000 dimensions
|
| 223 |
- **Similarity Function:** Dot Product
|
| 224 |
-
<!-- - **Training Dataset:** Unknown -->
|
| 225 |
- **Language:** am
|
| 226 |
- **License:** mit
|
| 227 |
|
| 228 |
### Model Sources
|
| 229 |
|
|
|
|
|
|
|
| 230 |
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 231 |
- **Documentation:** [Sparse Encoder Documentation](https://www.sbert.net/docs/sparse_encoder/usage/usage.html)
|
| 232 |
-
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
| 233 |
-
- **Hugging Face:** [Sparse Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=sparse-encoder)
|
| 234 |
|
| 235 |
### Full Model Architecture
|
| 236 |
|
|
@@ -260,8 +198,8 @@ model = SparseEncoder("rasyosef/splade-amharic-medium")
|
|
| 260 |
# Run inference
|
| 261 |
sentences = [
|
| 262 |
'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
|
| 263 |
-
'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል።
|
| 264 |
-
'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር።
|
| 265 |
]
|
| 266 |
embeddings = model.encode(sentences)
|
| 267 |
print(embeddings.shape)
|
|
@@ -275,30 +213,6 @@ print(similarities)
|
|
| 275 |
# [ 0.0000, 2.4125, 69.0888]])
|
| 276 |
```
|
| 277 |
|
| 278 |
-
<!--
|
| 279 |
-
### Direct Usage (Transformers)
|
| 280 |
-
|
| 281 |
-
<details><summary>Click to see the direct usage in Transformers</summary>
|
| 282 |
-
|
| 283 |
-
</details>
|
| 284 |
-
-->
|
| 285 |
-
|
| 286 |
-
<!--
|
| 287 |
-
### Downstream Usage (Sentence Transformers)
|
| 288 |
-
|
| 289 |
-
You can finetune this model on your own dataset.
|
| 290 |
-
|
| 291 |
-
<details><summary>Click to expand</summary>
|
| 292 |
-
|
| 293 |
-
</details>
|
| 294 |
-
-->
|
| 295 |
-
|
| 296 |
-
<!--
|
| 297 |
-
### Out-of-Scope Use
|
| 298 |
-
|
| 299 |
-
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
| 300 |
-
-->
|
| 301 |
-
|
| 302 |
## Evaluation
|
| 303 |
|
| 304 |
### Metrics
|
|
@@ -329,39 +243,14 @@ You can finetune this model on your own dataset.
|
|
| 329 |
| corpus_active_dims | 117.9303 |
|
| 330 |
| corpus_sparsity_ratio | 0.9963 |
|
| 331 |
|
| 332 |
-
<!--
|
| 333 |
-
## Bias, Risks and Limitations
|
| 334 |
-
|
| 335 |
-
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
| 336 |
-
-->
|
| 337 |
-
|
| 338 |
-
<!--
|
| 339 |
-
### Recommendations
|
| 340 |
-
|
| 341 |
-
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
| 342 |
-
-->
|
| 343 |
-
|
| 344 |
## Training Details
|
| 345 |
|
| 346 |
-
<details>
|
| 347 |
-
|
| 348 |
### Training Dataset
|
| 349 |
|
| 350 |
-
####
|
| 351 |
|
| 352 |
* Size: 245,876 training samples
|
| 353 |
* Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
|
| 354 |
-
* Approximate statistics based on the first 1000 samples:
|
| 355 |
-
| | anchor | positive | negative |
|
| 356 |
-
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 357 |
-
| type | string | string | string |
|
| 358 |
-
| details | <ul><li>min: 3 tokens</li><li>mean: 16.29 tokens</li><li>max: 101 tokens</li></ul> | <ul><li>min: 30 tokens</li><li>mean: 324.02 tokens</li><li>max: 510 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 330.65 tokens</li><li>max: 510 tokens</li></ul> |
|
| 359 |
-
* Samples:
|
| 360 |
-
| anchor | positive | negative |
|
| 361 |
-
|:------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 362 |
-
| <code>ክልሎች ለስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ሰነድ ለመስጠት ፈቃደኛ አለመሆናቸው ታወቀ</code> | <code>የክልሎቹ አቋም ስኳር ፋብሪካዎቹን ለመሸጥ የተያዘውን ዕቅድ እንዳይስተጓጎል ሥጋት ፈጥሯልጠቅላይ ሚኒስትሩ መፍትሔ እንዲያሰጡ ተጠይቋልበፌዴራል መንግሥት ለተቋቋሙ ነባርና በግንባታ ላይ ለሚገኙ አዳዲስ የስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ሰነድ እንዲሰጡ ተደጋጋሚ ጥያቄ ለሚመለከታቸው ክልሎች ቢቀርብም፣ ክልሎች ፈቃደኛ አለመሆናቸውን ሪፖርተር ያገኘው መረጃ አመለከተ፡፡የተገኘው የሰነድ መረጃ እንደሚያመለክተው የፌዴራል መንግሥት ከበርካታ ዓመታት በፊት ላቋቋማቸው ነባር የስኳር ፋብሪካዎችም ሆነ፣ በአሁኑ ወቅት በግንባታ ላይ ለሚገኙት የስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ማግኘት ባለመቻሉ መንግሥት ፋብሪካዎቹን ወደ ግል ለማዘዋወር እያደረገ ያለውን ጥረት እንዳያስተጓጉል ሥጋት ፈጥሯል፡፡መንግሥት በያዘው ዕቅድ መሠረት ከዘንድሮ ጀምሮ ሁሉንም የስኳር ፋብሪካዎች ወደ ግል ለማዘዋወር፣ የፋብሪካዎቹን ሀብት በተናጠል እንዲገመት ከማድረግ አንስቶ በርካታ የቅድመ ፕራይቬታይዜሽን ተግባራትን እያከናወነ ቢሆንም፣ ፕራይቬታይዜሽኑን ዕውን ለማድረግ መሠረታዊ የሆነውን የይዞታ ማረጋገጫ ማሟላት እንዳልተቻለ ሰነዱ ያመለክታል፡፡በኢትዮጵያ ስኳር ኮርፖሬሽን ሥር የሚተዳደሩ ነባርና በግንባታ ሒደት ላይ የሚገኙ በጥቅሉ 13 ስኳር ፋብሪካዎች ቢኖሩም፣ ከእነዚህ መካከል የተሟላ የይዞታ ማረጋገጫ ሰነድ ያላቸው ሁለት ስኳር ፋብሪካዎች ብቻ እንደሆኑ ለማወቅ ተችሏል፡፡‹‹ነባርና አዳዲስ ፕሮጀክቶች ላይ የይዞታ ማረጋገጫ ሰነድ ለማግኘት ከጅምሩ አንስቶ በድርጅቶቹና በኮርፖሬሽን አማካይነት ያላሰለሰ ጥረት ቢደረግም፣ ከወንጂ ሸዋና ከፊንጫ ስኳር ፋብሪካዎች በስተቀር ነባሩን የመተሐራ ስኳር ፋብሪካ ጨምሮ ሌሎቹ ነባርና በግንባታ ላይ የሚገኙ የስኳር ልማት ፕሮጀክቶች የይዞታ ማረጋገጫ ሰነድ ማግኘት አልተቻለም፤...</code> | <code> በባህል ቱሪዝምና ስፖርት ሚኒስቴር እና ስፖርት ኮሚሽን መካከል በተጠሪነት ላይ የግልጽነት መጓደል መኖሩ የባሀልና ስፖርት ሚኒስቴር የስፖርት ልማት ዘርፍ ዴኤታ አ�� ሃብታሙ ሲሳይ ገለጹ። አቶ ሃብታሙ ለአዲስ ዘመን ጋዜጣ እንደተናገሩት ፤የፌዴራል አስፈጻሚ አካላት ስልጣንና ተግባርን ለመወሰን የወጣ አዋጅ በአግባቡ አውቆ ከመጠቀም አኳያ ውስንነት አለ። ስፖርት ኮሚሽን ለበርካታ ዓመታት ሚኒስቴር ነበር። የአብዛኛው አመራርና ሰራተኛ እሳቤ የሚኒስቴር እሳቤን የያዘ እንደመሆኑ ‹ እኛ ኮሚሽን ነን›የሚለውን በፍጥነት ለመቀበል ግርታን መፈጠሩም የሚጠበቅ መሆኑን ገልጸው፤ እንዲህ አይነቱ ጉድለት ደግሞ ‹ስልጣናችን እየተጋፋን ነው ›የሚሉ አዋጁን ካለመገንዘብ የመነጩ ቅሬታዎች አሉ ብለዋል። የስፖርቱ አደረጃጀት አንድ ጊዜ ከአንዱ ፤ሌላ ጊዜ ደግሞ ከሌላው የመጣበቅ ዝንባሌዎች በተደጋጋሚ መኖሩን ጠቅሰው ፤አደረጃጀቱ ወጥ ሆኖ ያለመቆየትም ከዚሁ ጋር አብሮ የሚታይ እንደሆነ ተናግረዋል። በዚህም ጠንካራ የስፖርት ምክር ቤት አለመፈጠሩ ስፖርቱ ህዝባዊ መሰረት እንዳይኖረው ማድረጉንም አክለው ገልጸዋል። እንደ አቶ ሃብታሙ ማብራሪያ ፤ ስፖርቱን የሚመራው ህዝባዊ አደረጃጀቱ እንደሆነ በፖሊሲው ተቀምጧል። ህዝባዊ አደረጃጀት የሚባለው፤ ኦሎምፒክ ኮሚቴ፤ ፌዴሬሽኖቹ፤ ክለቦቹ፤ እንዲሁም የስፖርት ምክር ቤቶች ናቸው። በሀገራችን ወቅታዊ ሁኔታ የስፖርት ምክር ቤቶች የት ናቸው? ስፖርቱን በአግባቡ መምራት በሚችሉበት ቁመና አይገኙም። በፌዴራል ደረጃ የስፖርት ምክር ቤት ተቋቁሞ ወደ ስራ የገባው በ60ዎቹ አካባቢ ቢሆንም፤ በፌዴራል ደረጃ ከ2007 ዓ.ም ጀምሮ ጠፍተዋል። ብሄራዊ የስፖርት ምክር ቤት በ2011 ዓ.ም ነው ገና እንዳዲስ የተቋቋመው፤ በክልሎችም ተመሳሳይ ሁኔታ ይንጸባረቃል። «በዓመ...</code> |
|
| 363 |
-
| <code>መዳ ወላቡ ዩኒቨርሲቲ ያሰለጠናቸው 19 ሐኪሞች አስመረቀ</code> | <code>አዲስ አበባ ፣ ህዳር 12 ፣ 2013 (ኤፍ ቢ ሲ) መዳ ወላቡ ዩኒቨርሲቲ በህክምና ዶክትሬት የትምህርት ዘርፍ ያሰለጠናቸው 19 ተማሪዎችን ዛሬ አስመረቀ፡፡ዩኒቨርሲቲው የዛሬ ተመራቂዎችን ጨምሮ 99 የህክምና ዶክተሮችን አሰልጥኖ አስመርቋል።በዩኒቨርሲቲው ምክትል ፕሬዝዳንት ማዕረግ የጎባ ሪፈራል ሆስፒታል ዋና ዳይሬክተር ዶክተር ጄይላን ቃሲም ሆስፒታሉ ለአካባቢው ማህበረሰብ ከሚሰጠው የህክምና አገልግሎት በተጓዳኝ በተለያዩ የህክምና ሙያዎች ስልጠና እየሰጠ እንዳለ መግለጻቸውን ኢዜአ ዘግቧል።በ1999 ዓ.ም 742 ተማሪዎች ተቀብሎ ስራ የጀመረው መዳ ወላቡ ዩኒቨርሲቲ አሁን ላይ ከ24 ሺህ የሚበልጡ ተማሪዎች አሉት።</code> | <code>የአዲስ አበባ ከተማ አስተዳደር የሙያ ትምህርትና ስልጠና ቢሮ በ2009 ዓም በተለያዩ ሙያ ዘርፎች ያሰለጠናቸውን ከ8ሺህ 800 በላይ ሰልጣኞች ዛሬ በሚሊንየም አዳራሽ አስመረቀ ፡፡በምረቃ ስነ ስርዓቱ ላይ የተገኙት የአዲስ አበባ ከተማ አስተዳደር አፈ ጉባኤ ዶክተር ታቦር ገብረመድህን እንደገለጹት ፤ተመራቂዎች በስልጠና ቆይታቸው ያገኙዋቸውን መሰረታዊ ዕውቀትና ክህሎት በየጊዜው በማዳበር ለአገራቸው የሚገባቸውን አስተዋጽኦ ማበርከት ይገባቸዋል ፡፡በስራው ዓለም የይቻላል መንፈስን በማጎልበትና የቴክኖሎጂ ፈጠራ ክህሎትን በማዳበር ቀጣይ ለአገሪቱ ኢኮኖሚ ዕድገት የድርሻቸውን ሊወጠ ይገባል ፡፡በከተማ የወጣቶች ተጠቃሚነትን ለማጎልበት መንገስት በፈቀደው የተንቀሳቃሽ ፈንድ ምቹ አጋጣሚ ሰልጣኞቹ እንዲጠቀሙበትም ጥሪ አቅርበዋል ፡፡የከተማው አስተዳደር የቴክኒክና ሙያ ስልጠና ኃላፊ አቶ ዘርኡ ስሙር በበኩላቸው እንደገለጹት ፤ከደረጃ አንድ እስከ ደረጃ አምስት ከሰለጠኑት 8ሺ 837 ተመራቂዎች ውስጥ 34 በመቶ ሴቶች መሆናቸውን ገልጸዋል ፡፡ቢሮው ባለፉት ሁለት ዓመታም 47 ሺህ የሚሆኑት አጫጭር ስልጠናዎች ማግኘታቸውን ጠቁመዋል ፡፡በአዲስ አበባ ከተማ የሚገኙ የቴክና ሙያ ማሰልጠኛ ተቋማትና ኮሌጆች ዜጎች በተለያዩ የሙያ ዘርፎች ተገቢ የሙያ ክህሎት እንዲያገኙ ተገቢውን አስተዋጽኦ እያበረከቱ መሆናቸውን አስረድተዋል፡፡የቴክኒክና ሙያ ተቋማትም የተሻለ የሙያ ክህሎት ያላቸው ሰልጣኞችን በማፍራት ረገድ ያደረጉት ርብርቦሽም አመስግነዋል ፡፡ሰልጣኞቹ በአነስተኛና ጥቃቅን በመደራጀትና በመስራት የተጣለባቸውን ሀገራዊ ሃላፊነት እንዲወጡ ጥሪ አቅርበዋል ፡፡በመጨረሻም በተለያዩ ዘርፎች የክህሎት ውድድርና የላቀ አፈጻጸም ያስመዘገቡ ሰልጣኞች እንዲሁም አሰልጣኞች የሜዳሊያና የሰርተፊኬት ሽልማትና ዕ...</code> |
|
| 364 |
-
| <code>በኢትዮጵያ ከባህር ጠለል 2500 ሜትር ከፍታ የምትገኝ እንዲሁም በሀገሪቱ ትልቋ ከተማ ማን ትባላለች?</code> | <code>አዲስ አበባ አዲስ አበባ ተብላ የተሠየመችው እቴጌ ጣይቱ ኅዳር ፲፬ ቀን ፲፰፻፸፱ (1879) ዓ.ም. ፍልውሃ ፊን-ፊን ወደሚልበት መስክ ወርደው ሳሉ ከዚህ በፊት አይተዋት የማያውቋት አንዲት ልዩ አበባ አይተ ስለማረከቻቸው ቦታውን ‹‹አዲስ አበባ!›› አሉ ይባላል። አዲስ አበባ (ኣዲስ ኣበባ) ኢትዮጵያ ዋና ከተማ ስትሆን በተጨማሪ የአፍሪካ ሕብረት መቀመጫ እንዲሁም የብዙ የተባበሩት መንግሥታት ድርጅት ቅርንጫፎችና ሌሎችም የዓለም የዲፕሎማቲክ (የሰላማዊ ግንኙነት) ልዑካን መሰብሰቢያ ከተማ ናት። ራስ-ገዝ አስተዳደር ስላላት የከተማና የክልል ማዕረግ ይዛ ትገኛለች። አብዛኞቹን የሀገሩ ቋንቋዎች የሚናገሩ ክርስቲያኖች እና ሙስሊሞች የሚኖሩባት ከተማ ናት። ከባሕር ጠለል በ2500 ሜትር ከፍታ ላይ የምትገኘው ከተማ በግምት 2,757,729 በላይ ሕዝብ የሚኖርባት በመሆኗ የሀገሪቱ አንደኛ ትልቅ ከተማ ናት። ከተማዋ እቴጌ ጣይቱ በመረጡት ቦታ ማለትም በፍል ውሐ አካባቢ ላይ በባላቸው በዳግማዊ ምኒልክ በ፲፰፻፸፰ (1878) ዓ.ም. ተቆረቆረች። የሕዝቧ ብዛት በያመቱ 8% (ስምንት በመቶ) እየጨመረ አሁን አምስት ሚሊዮን እንደሚደርስ ይገመታል። ከእንጦጦ ጋራ ግርጌ ያለችው መዲና የአዲስ አበባ ዩኒቨርሲቲ መገኛ ሆናለች። ይህም በመስራቹ የቀድሞው ንጉሠ-ነገሥት ስም ቀዳማዊ ኃይለ ሥላሴ ዩኒቨርሲቲ ይባል ነበር።</code> | <code>ታሕታይ ሎጎምቲ / አድዋ ወረዳ ከሚገኙ የገጠር ቀበሌዎች<br>አንዷ ስትሆን ትምህርት ቤት የተጀመረበት አመተምህረት በ 1984 ዓ/ም ነው። አሁን እስከ 8ኛ ክፍል እያስተማረ ይገኛል፡፡ በተጨማሪም ሌላ 1ኛ ደረጃ ት/ቤት ማይሰጋሉ አከባቢ ተገንብቶ ተማሪዎችእየተማሩበት ይገኛሉ፡፡የመኪና መንገድ ደግሞ በ1985/86 አከባቢ ተጀምረዋል። በአከባቢዋ የተለያዮ የተከለሉ ደንኞች ማለትም ሸተቶ ፣ ኩማጫሉቅ፣ ሸቃወለዳይት፣ ደብረሳህሊ፣አቡነእንድርያስ ፣ሰውሒ ፅየት እና ሌሎችም ያቀፈች ቀበሌ ነች፡፡እንስሳተ ዘገዳም ቀበሮ፣ ጅብ፣ በተመሳሳይ ቆቅ እና ጅግራም ይገኙበታል፡፡በተለይ በውስጧ የያዘቻቸው አዝርእትና የበጋ<br>አትክልቶችና ለአይን ከመማረክ አልፎ ለአከባቢው ህ/ሰብ<br>የገቢ ምንጭ ናቸው "ግድብ ሰይሳ" የ ሰይሳ ግድብም<br>እዛው ይገኛ���። በውስጧ 4 ቀጠናዎች(ቁሸት) ይገኛሉ፡፡<br>እነሱም ፅየት ፣ገብላ፣ አዲስአለም፣ ማይወይኒ የሚባሉ ናቸው። ራህያ ከተማም ከፊል ከተማው በዚህ ቀበሌ ይገኛል<br><br>አድዋ</code> |
|
| 365 |
* Loss: [<code>SpladeLoss</code>](https://sbert.net/docs/package_reference/sparse_encoder/losses.html#spladeloss) with these parameters:
|
| 366 |
```json
|
| 367 |
{
|
|
@@ -385,166 +274,13 @@ You can finetune this model on your own dataset.
|
|
| 385 |
- `optim`: adamw_torch_fused
|
| 386 |
- `batch_sampler`: no_duplicates
|
| 387 |
|
| 388 |
-
#### All Hyperparameters
|
| 389 |
-
<details><summary>Click to expand</summary>
|
| 390 |
-
|
| 391 |
-
- `overwrite_output_dir`: False
|
| 392 |
-
- `do_predict`: False
|
| 393 |
-
- `eval_strategy`: epoch
|
| 394 |
-
- `prediction_loss_only`: True
|
| 395 |
-
- `per_device_train_batch_size`: 48
|
| 396 |
-
- `per_device_eval_batch_size`: 48
|
| 397 |
-
- `per_gpu_train_batch_size`: None
|
| 398 |
-
- `per_gpu_eval_batch_size`: None
|
| 399 |
-
- `gradient_accumulation_steps`: 1
|
| 400 |
-
- `eval_accumulation_steps`: None
|
| 401 |
-
- `torch_empty_cache_steps`: None
|
| 402 |
-
- `learning_rate`: 6e-05
|
| 403 |
-
- `weight_decay`: 0.0
|
| 404 |
-
- `adam_beta1`: 0.9
|
| 405 |
-
- `adam_beta2`: 0.999
|
| 406 |
-
- `adam_epsilon`: 1e-08
|
| 407 |
-
- `max_grad_norm`: 1.0
|
| 408 |
-
- `num_train_epochs`: 4
|
| 409 |
-
- `max_steps`: -1
|
| 410 |
-
- `lr_scheduler_type`: cosine
|
| 411 |
-
- `lr_scheduler_kwargs`: {}
|
| 412 |
-
- `warmup_ratio`: 0.05
|
| 413 |
-
- `warmup_steps`: 0
|
| 414 |
-
- `log_level`: passive
|
| 415 |
-
- `log_level_replica`: warning
|
| 416 |
-
- `log_on_each_node`: True
|
| 417 |
-
- `logging_nan_inf_filter`: True
|
| 418 |
-
- `save_safetensors`: True
|
| 419 |
-
- `save_on_each_node`: False
|
| 420 |
-
- `save_only_model`: False
|
| 421 |
-
- `restore_callback_states_from_checkpoint`: False
|
| 422 |
-
- `no_cuda`: False
|
| 423 |
-
- `use_cpu`: False
|
| 424 |
-
- `use_mps_device`: False
|
| 425 |
-
- `seed`: 42
|
| 426 |
-
- `data_seed`: None
|
| 427 |
-
- `jit_mode_eval`: False
|
| 428 |
-
- `use_ipex`: False
|
| 429 |
-
- `bf16`: False
|
| 430 |
-
- `fp16`: True
|
| 431 |
-
- `fp16_opt_level`: O1
|
| 432 |
-
- `half_precision_backend`: auto
|
| 433 |
-
- `bf16_full_eval`: False
|
| 434 |
-
- `fp16_full_eval`: False
|
| 435 |
-
- `tf32`: None
|
| 436 |
-
- `local_rank`: 0
|
| 437 |
-
- `ddp_backend`: None
|
| 438 |
-
- `tpu_num_cores`: None
|
| 439 |
-
- `tpu_metrics_debug`: False
|
| 440 |
-
- `debug`: []
|
| 441 |
-
- `dataloader_drop_last`: False
|
| 442 |
-
- `dataloader_num_workers`: 0
|
| 443 |
-
- `dataloader_prefetch_factor`: None
|
| 444 |
-
- `past_index`: -1
|
| 445 |
-
- `disable_tqdm`: False
|
| 446 |
-
- `remove_unused_columns`: True
|
| 447 |
-
- `label_names`: None
|
| 448 |
-
- `load_best_model_at_end`: False
|
| 449 |
-
- `ignore_data_skip`: False
|
| 450 |
-
- `fsdp`: []
|
| 451 |
-
- `fsdp_min_num_params`: 0
|
| 452 |
-
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
| 453 |
-
- `fsdp_transformer_layer_cls_to_wrap`: None
|
| 454 |
-
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 455 |
-
- `deepspeed`: None
|
| 456 |
-
- `label_smoothing_factor`: 0.0
|
| 457 |
-
- `optim`: adamw_torch_fused
|
| 458 |
-
- `optim_args`: None
|
| 459 |
-
- `adafactor`: False
|
| 460 |
-
- `group_by_length`: False
|
| 461 |
-
- `length_column_name`: length
|
| 462 |
-
- `ddp_find_unused_parameters`: None
|
| 463 |
-
- `ddp_bucket_cap_mb`: None
|
| 464 |
-
- `ddp_broadcast_buffers`: False
|
| 465 |
-
- `dataloader_pin_memory`: True
|
| 466 |
-
- `dataloader_persistent_workers`: False
|
| 467 |
-
- `skip_memory_metrics`: True
|
| 468 |
-
- `use_legacy_prediction_loop`: False
|
| 469 |
-
- `push_to_hub`: False
|
| 470 |
-
- `resume_from_checkpoint`: None
|
| 471 |
-
- `hub_model_id`: None
|
| 472 |
-
- `hub_strategy`: every_save
|
| 473 |
-
- `hub_private_repo`: None
|
| 474 |
-
- `hub_always_push`: False
|
| 475 |
-
- `hub_revision`: None
|
| 476 |
-
- `gradient_checkpointing`: False
|
| 477 |
-
- `gradient_checkpointing_kwargs`: None
|
| 478 |
-
- `include_inputs_for_metrics`: False
|
| 479 |
-
- `include_for_metrics`: []
|
| 480 |
-
- `eval_do_concat_batches`: True
|
| 481 |
-
- `fp16_backend`: auto
|
| 482 |
-
- `push_to_hub_model_id`: None
|
| 483 |
-
- `push_to_hub_organization`: None
|
| 484 |
-
- `mp_parameters`:
|
| 485 |
-
- `auto_find_batch_size`: False
|
| 486 |
-
- `full_determinism`: False
|
| 487 |
-
- `torchdynamo`: None
|
| 488 |
-
- `ray_scope`: last
|
| 489 |
-
- `ddp_timeout`: 1800
|
| 490 |
-
- `torch_compile`: False
|
| 491 |
-
- `torch_compile_backend`: None
|
| 492 |
-
- `torch_compile_mode`: None
|
| 493 |
-
- `include_tokens_per_second`: False
|
| 494 |
-
- `include_num_input_tokens_seen`: False
|
| 495 |
-
- `neftune_noise_alpha`: None
|
| 496 |
-
- `optim_target_modules`: None
|
| 497 |
-
- `batch_eval_metrics`: False
|
| 498 |
-
- `eval_on_start`: False
|
| 499 |
-
- `use_liger_kernel`: False
|
| 500 |
-
- `liger_kernel_config`: None
|
| 501 |
-
- `eval_use_gather_object`: False
|
| 502 |
-
- `average_tokens_across_devices`: False
|
| 503 |
-
- `prompts`: None
|
| 504 |
-
- `batch_sampler`: no_duplicates
|
| 505 |
-
- `multi_dataset_batch_sampler`: proportional
|
| 506 |
-
- `router_mapping`: {}
|
| 507 |
-
- `learning_rate_mapping`: {}
|
| 508 |
-
|
| 509 |
-
</details>
|
| 510 |
-
|
| 511 |
-
### Training Logs
|
| 512 |
-
| Epoch | Step | Training Loss | dot_ndcg@10 |
|
| 513 |
-
|:-----:|:-----:|:-------------:|:-----------:|
|
| 514 |
-
| 1.0 | 5123 | 46.9605 | 0.7653 |
|
| 515 |
-
| 2.0 | 10246 | 0.074 | 0.7476 |
|
| 516 |
-
| 3.0 | 15369 | 0.0308 | 0.7659 |
|
| 517 |
-
| 4.0 | 20492 | 0.0179 | 0.7694 |
|
| 518 |
-
| -1 | -1 | - | 0.7694 |
|
| 519 |
-
|
| 520 |
-
|
| 521 |
-
### Framework Versions
|
| 522 |
-
- Python: 3.11.13
|
| 523 |
-
- Sentence Transformers: 5.0.0
|
| 524 |
-
- Transformers: 4.53.0
|
| 525 |
-
- PyTorch: 2.6.0+cu124
|
| 526 |
-
- Accelerate: 1.8.1
|
| 527 |
-
- Datasets: 3.6.0
|
| 528 |
-
- Tokenizers: 0.21.2
|
| 529 |
-
|
| 530 |
-
</details>
|
| 531 |
-
|
| 532 |
## Citation
|
| 533 |
|
| 534 |
-
|
| 535 |
-
|
| 536 |
-
|
| 537 |
-
|
| 538 |
-
|
| 539 |
-
|
| 540 |
-
|
| 541 |
-
|
| 542 |
-
|
| 543 |
-
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
| 544 |
-
-->
|
| 545 |
-
|
| 546 |
-
<!--
|
| 547 |
-
## Model Card Contact
|
| 548 |
-
|
| 549 |
-
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
| 550 |
-
-->
|
|
|
|
| 1 |
---
|
| 2 |
+
base_model: rasyosef/roberta-medium-amharic
|
| 3 |
+
datasets:
|
| 4 |
+
- rasyosef/Amharic-Passage-Retrieval-Dataset-V2
|
| 5 |
language:
|
| 6 |
- am
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 7 |
library_name: sentence-transformers
|
| 8 |
+
license: mit
|
| 9 |
metrics:
|
| 10 |
- dot_accuracy@1
|
| 11 |
- dot_accuracy@3
|
|
|
|
| 26 |
- query_sparsity_ratio
|
| 27 |
- corpus_active_dims
|
| 28 |
- corpus_sparsity_ratio
|
| 29 |
+
pipeline_tag: text-retrieval
|
| 30 |
+
tags:
|
| 31 |
+
- sentence-transformers
|
| 32 |
+
- sparse-encoder
|
| 33 |
+
- sparse
|
| 34 |
+
- splade
|
| 35 |
+
- generated_from_trainer
|
| 36 |
+
- dataset_size:245876
|
| 37 |
+
- loss:SpladeLoss
|
| 38 |
+
- loss:SparseMultipleNegativesRankingLoss
|
| 39 |
+
- loss:FlopsLoss
|
| 40 |
+
widget:
|
| 41 |
+
- text: የኢንዱስትሪ ፓርኮች ፈተና እና ተስፋ
|
| 42 |
+
- text: "ከሳምንት በፊት በመፈንቅለ መንግሥት ሥልጣናቸውን አጥተዋል፡፡ አሁን በቁም እስር ላይ ናቸው፡፡\n\nከስማቸው አወዛጋቢነት\
|
| 43 |
+
\ እስከ አገሪቱ ትክክለኛ የስም አጠራር ድረስ የቀድሞዋ በርማ የአሁኗ ሚየንማር፣ የቀድሞዋ የሰብአዊ መብት እመቤት፣ የአሁኗ\
|
| 44 |
+
\ እስረኛ የሰሞኑ የሚዲያ ዐቢይ ጉዳይ ሆነዋል፡፡ \n\nበእርግጥ የሴትዮዋ ‹ሌጋሲ› በትክክል ምንድነው? በሚለው ጉዳይ ሚዲያዎችና\
|
| 45 |
+
\ ተቋማት ተስማምተው አያውቁም፡፡\n\nለመሆኑ ኦን ሳን ሱ ቺ ማን ናቸው? \n\nአን ሳን ሱ ቺ አባታቸው የበርማ የነጻነት\
|
| 46 |
+
\ አባት የሚባሉት የጄኔራል ኦን ሳን ሴት ልጅ ናቸው፡፡\n\nታላቋ ብሪታኒያ በርማን (በአዲሱ ስሟ ሚየንማር) ለአንድ ክፍለ\
|
| 47 |
+
\ ዘመን ያህል ጊዜ በቅኝ ገዝታታለች፡፡ \n\nጄኔራል ኦን ሰን ለበርማ ነጻነት ተዋድቀዋል፡፡ የተገደሉትም በ1947 በተቀናቃኞቻቸው\
|
| 48 |
+
\ ነበር፡፡ ያን ጊዜ ሳን ሱ ቺ ገና 2 ዓመቷ ነበር፡፡ አን ሳን ሱ ቺ በሰኔ 19፣ 1945 ነበር የተወለዱት፡፡\n\nኦን\
|
| 49 |
+
\ ሳን ሱ ቺ በ1960ዎቹ መጀመርያ ከእናታቸው ዳው ኪን ኬዪ ጋር ወደ ሕንድ ሄዱ፡፡ እናታቸው በደልሂ የበርማ አምባሳደር ተደርገው\
|
| 50 |
+
\ በመሾማቸ�� ነበር ወደዚያ ያቀኑት፡፡\n\nሕንድ አራት ዓመት ከኖሩ በኋላ ወደ ታላቋ ብሪታኒያ በማቅናት በሥመጥሩ ኦክስፎርድ\
|
| 51 |
+
\ ዩኒቨርስቲ ፍልስፍናን፣ ፖለቲካንና ምጣኔ ሀብትን አጥንተዋል፡፡ \n\nአን ሳን ሱ ቺ በኦክስፎርድ ዩኒቨርስቲ ሳሉ የወደፊት\
|
| 52 |
+
\ ባለቤታቸው ጋር ተገናኙ፡፡ እንግሊዛዊው ባለቤታቸው ማይክል አሪስ የታሪክ ተመራማሪ ፕሮፌሰር ነበሩ፡፡ አሁን በሕይወት የሉም፡፡\n\
|
| 53 |
+
\nኦን ሳን ሱ ቺ ከትምህርት በኋላ በቡታን እና በጃፓን በተለያዩ ሥራዎች ላይ ተሳትፈዋል፡፡ ከዚያ በኋላ ወደ ታላቋ ብሪታኒያ\
|
| 54 |
+
\ በመሄድ ጎጆ መሥርተው አሌክሳንደርና ኪም የሚባሉ ልጆችን አፍርተዋል፡፡ \n\nበ1988 ከታላቋ ብሪታኒያ ወደ ሚየንማር ዋና\
|
| 55 |
+
\ ከተማ ያንጎን ሲመለሱ በጠና ታመው የነበሩትን እናታቸውን ለማስታመም ነበር፡፡\n\nየአጋጣሚ ነገር ሆኖ በበዚያ ወቅት በሚየንማር\
|
| 56 |
+
\ በርካታ የዲሞክራሲ ጥያቄዎችን ያነሱ ወጣቶች አደባባይ ወጥተው ተቃውሞ ያስነሱበት ጊዜ ነበር፡፡ \n\nተቃዋሚዎቹ ወጣቶች\
|
| 57 |
+
\ ብቻ ሳይሆኑ የቡድሀ መነኮሳት፣ የቢሮ ሰራተኞችና ተማሪዎችም ይገኙበት ነበር፡፡\n\nይህን ተቃውሞ ተከትሎ አን ሳን ሱ ቺ\
|
| 58 |
+
\ ጠቅልለው በሚየንማር መኖር ጀመሩ፡፡\n\nአን ሳን ሱቺ ከቀድሞ ባለቤታቸው ጋር በለንደን\n\nከ2 ዓመት በኋላ በ1990\
|
| 59 |
+
\ አዲስ በተመሠረተው የናሽናል ሊግ ፓርቲ ውስጥ ገብተው ተቃውሞ ውስጥ በቀጥታ መሳተፍ ጀመሩ፡፡ በአካባቢ ምርጫ ተወዳድረውም\
|
| 60 |
+
\ አሸነፉ፡፡\n\nበከፍተኛ ድምጽ የኦን ሳን ሱ ቺ በምርጫ ማሸነፍ ያስቆጣው ወታደራዊው መንግሥት ሴትዮዋን ለሚቀጥሉት 20\
|
| 61 |
+
\ ዓመታት በቁም እስር አስቀመጣቸው፡፡\n\nበ1991 ኦን ሳን ሱ ቺ በቁም እስር ላይ ሳሉ የኖቤል ሽልማትን አሸነፉ፡፡ ይህም\
|
| 62 |
+
\ ወታደራዊውን መንግሥት በይበልጥ አስቆጣ፡፡\n\nበ2010 ኦን ሳን ሱ ቺ ከቁም እስር ነጻ ተባሉ፡፡\n\nበ2012 አን ሳን\
|
| 63 |
+
\ ሱ ቺና ፓርቲያቸው በአካባቢ ምርጫ እንዲሳተፉ ወታደራዊው መንግሥት ፈቀደ፡፡\n\nበ2015 የብሔራዊ ሊግ ለዲሞክራሲ (NLD)\
|
| 64 |
+
\ ፓርቲያቸው ለመጀመርያ ጊዜ በተደረገ ከፍተኛ ፉክክር በታየበት ምርጫ አሸነፈ፡፡ \n\nአን ሳን ሱ ቺ በሚየንማር የሮሒንጋ\
|
| 65 |
+
\ ሙስሊሞች ላይ ወታደሩ ያደረሰውን ግፍና ጭፍጨፋ ለማውገዝ አለመፍቀዳቸው በዓለም አቀፍ የሰብአዊ መብት ተሟጋቾች ዘንድ ቁጣን\
|
| 66 |
+
\ ቀሰቀሰ፡፡ በመቶ ሺ የሚቆጠሩ የሮሒንጋ ሙስሊሞች ከሚየንማር ሞትን ሽሽት ወደ ባንግላዴሽ ተሰደዋል፡፡\n\nበዓለም አቀፉ\
|
| 67 |
+
\ ማኅበረሰብ ዘንድ ክብራቸው ዝቅ ይበል እንጂ አን ሳን ሱ ቺ በአገራቸው ቡድሀዎች ዘንድ እጅግ ተወዳጅ ናቸው፡፡\n\nአን\
|
| 68 |
+
\ ሳን ሱ ቺ በ2015 የተደረገውን ምርጫ አሸንፈው መንግሥት ቢመሠርቱም የአገሪቱ ፕሬዝዳንት መሆን... "
|
| 69 |
+
- text: አዲስ አበባ ፣ ነሃሴ 23 ፣ 2012 (ኤፍ ቢ ሲ) ኢትዮጵያ፣ ሱዳን እና ግብጽ በታላቁ የህዳሴ ግድብ አሞላል እና ውሃ
|
| 70 |
+
አለቃቀቅ ደንብ ላይ የሚያደርጉት የሶስትዮሽ ስብሰባ መስከረም ወር ላይ እንደሚቀጥል የውሃ መስኖና ኢነርጅ ሚኒስቴር አስታወቀ፡፡ሚኒስቴሩ
|
| 71 |
+
የሶስቱ ሃገራት የውሃ ጉዳይ ሚኒስትሮች በትናንትናው እለት ስብሰባ ማካሄዳቸውን አስታውቋል፡፡በስብሰባው ላይ የሂደቱ ታዛቢ የሆኑት
|
| 72 |
+
የደቡብ አፍሪካ፣ የአውሮፓ ህብረት እና የአሜሪካ ተወካዮች እንዲሁም ከአፍሪካ ህብረት የተወከሉ ባለሙያዎች መሳተፋቸውንም ገልጿል፡፡በወቅቱም
|
| 73 |
+
ላላፈው አንድ ሳምንት በሃገራቱ ባለሙያዎች በታላቁ የህዳሴ ግድብ አሞላልና የውሃ አለቃቀቅ ደንብ ላይ ሲከናወን የነበረው የባለሙያዎች
|
| 74 |
+
ድርድር ሪፖርት መቅረቡንም ጠቅሷል፡፡በቀጣይ የሚኖረውን ሂደት በሚመለከትም ሃገራቱ የድርድሩን ሂደት የሚገልጽ ደብዳቤ ለደቡብ
|
| 75 |
+
አፈሪካዋ ዓለም አ���ፍ ግንኙነት እና ትብብር ሚኒስትር እና የአፍሪካ ህብረት አስፈጻሚ ምክር ቤት የወቅቱ ሊቀ መንበር ዶክተር
|
| 76 |
+
ናዴሊ ፓንዶል ለመላክ መስማማታቸውንም ነው የገለጸው፡፡በዚህም ሱዳን የምትሰጠው ማረጋገጫ እንደሚጠበቅ የገለጸው ሚኒስቴሩ የሶስትዮሽ
|
| 77 |
+
ስብሰባው መስከረም 4 ቀን 2013 ዓ.ም እንደሚቀጥል አስታውቋል፡፡
|
| 78 |
+
- text: በፕሪሚየር ሊጉ ኢትዮጵያ ቡና እና ወልቂጤ ከተማ አቻ ተለያዩ
|
| 79 |
+
- text: ፕሪሚየር ሊግ ፡ ሲዳማ ከሜዳው ውጪ ጣፋጭ ድል ሲያስመዘግብ አርባምንጭ ከ ዳሽን ቢራ አቻ ተለያይተዋል
|
| 80 |
model-index:
|
| 81 |
- name: SPLADE-RoBERTa-Amharic-Medium
|
| 82 |
results:
|
|
|
|
| 84 |
type: sparse-information-retrieval
|
| 85 |
name: Sparse Information Retrieval
|
| 86 |
dataset:
|
| 87 |
+
name: Amharic Passage Retrieval Dataset V2
|
| 88 |
+
type: rasyosef/Amharic-Passage-Retrieval-Dataset-V2
|
| 89 |
metrics:
|
| 90 |
- type: dot_accuracy@1
|
| 91 |
value: 0.6285881663737551
|
|
|
|
| 144 |
- type: corpus_sparsity_ratio
|
| 145 |
value: 0.9963146789694772
|
| 146 |
name: Corpus Sparsity Ratio
|
|
|
|
|
|
|
| 147 |
---
|
| 148 |
|
| 149 |
# SPLADE-Amharic-Medium
|
| 150 |
|
| 151 |
+
This is a [SPLADE Sparse Encoder](https://www.sbert.net/docs/sparse_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It maps sentences & paragraphs to a 32000-dimensional sparse vector space and can be used for semantic search and sparse retrieval.
|
| 152 |
+
|
| 153 |
+
The model was presented in the paper [The Multilingual Curse at the Retrieval Layer: Evidence from Amharic](https://huggingface.co/papers/2605.24556).
|
| 154 |
+
|
| 155 |
## Model Details
|
| 156 |
|
| 157 |
### Model Description
|
| 158 |
- **Model Type:** SPLADE Sparse Encoder
|
| 159 |
+
- **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic)
|
| 160 |
- **Maximum Sequence Length:** 510 tokens
|
| 161 |
- **Output Dimensionality:** 32000 dimensions
|
| 162 |
- **Similarity Function:** Dot Product
|
|
|
|
| 163 |
- **Language:** am
|
| 164 |
- **License:** mit
|
| 165 |
|
| 166 |
### Model Sources
|
| 167 |
|
| 168 |
+
- **Repository:** [GitHub](https://github.com/rasyosef/amharic-neural-ir)
|
| 169 |
+
- **Paper:** [The Multilingual Curse at the Retrieval Layer: Evidence from Amharic](https://huggingface.co/papers/2605.24556)
|
| 170 |
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 171 |
- **Documentation:** [Sparse Encoder Documentation](https://www.sbert.net/docs/sparse_encoder/usage/usage.html)
|
|
|
|
|
|
|
| 172 |
|
| 173 |
### Full Model Architecture
|
| 174 |
|
|
|
|
| 198 |
# Run inference
|
| 199 |
sentences = [
|
| 200 |
'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
|
| 201 |
+
'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል።',
|
| 202 |
+
'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር።',
|
| 203 |
]
|
| 204 |
embeddings = model.encode(sentences)
|
| 205 |
print(embeddings.shape)
|
|
|
|
| 213 |
# [ 0.0000, 2.4125, 69.0888]])
|
| 214 |
```
|
| 215 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 216 |
## Evaluation
|
| 217 |
|
| 218 |
### Metrics
|
|
|
|
| 243 |
| corpus_active_dims | 117.9303 |
|
| 244 |
| corpus_sparsity_ratio | 0.9963 |
|
| 245 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 246 |
## Training Details
|
| 247 |
|
|
|
|
|
|
|
| 248 |
### Training Dataset
|
| 249 |
|
| 250 |
+
#### Amharic Passage Retrieval Dataset V2
|
| 251 |
|
| 252 |
* Size: 245,876 training samples
|
| 253 |
* Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 254 |
* Loss: [<code>SpladeLoss</code>](https://sbert.net/docs/package_reference/sparse_encoder/losses.html#spladeloss) with these parameters:
|
| 255 |
```json
|
| 256 |
{
|
|
|
|
| 274 |
- `optim`: adamw_torch_fused
|
| 275 |
- `batch_sampler`: no_duplicates
|
| 276 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 277 |
## Citation
|
| 278 |
|
| 279 |
+
```bibtex
|
| 280 |
+
@inproceedings{alemneh2026amharicir,
|
| 281 |
+
title = {The Multilingual Curse at the Retrieval Layer: Evidence from Amharic},
|
| 282 |
+
author = {Alemneh, Yosef Worku and Mekonnen, Kidist Amde and de Rijke, Maarten},
|
| 283 |
+
booktitle = {Proceedings of the 1st Workshop on Multilinguality in the Era of Large Language Models (MeLLM), ACL 2026},
|
| 284 |
+
year = {2026},
|
| 285 |
+
}
|
| 286 |
+
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|