rasyosef nielsr HF Staff commited on
Commit
f1c9ccd
·
1 Parent(s): e50cfde

Improve model card: update pipeline tag and add paper/code links (#1)

Browse files

- Improve model card: update pipeline tag and add paper/code links (2847d64ca6ab7aa8bbe451224cab041bfaf74a4f)


Co-authored-by: Niels Rogge <nielsr@users.noreply.huggingface.co>

Files changed (1) hide show
  1. README.md +75 -339
README.md CHANGED
@@ -1,124 +1,11 @@
1
  ---
 
 
 
2
  language:
3
  - am
4
- license: mit
5
- tags:
6
- - sentence-transformers
7
- - sparse-encoder
8
- - sparse
9
- - splade
10
- - generated_from_trainer
11
- - dataset_size:245876
12
- - loss:SpladeLoss
13
- - loss:SparseMultipleNegativesRankingLoss
14
- - loss:FlopsLoss
15
- base_model: rasyosef/roberta-medium-amharic
16
- widget:
17
- - text: የኢንዱስትሪ ፓርኮች ፈተና እና ተስፋ
18
- - text: >-
19
- ከሳምንት በፊት በመፈንቅለ መንግሥት ሥልጣናቸውን አጥተዋል፡፡ አሁን በቁም እስር ላይ ናቸው፡፡
20
-
21
-
22
- ከስማቸው አወዛጋቢነት እስከ አገሪቱ ትክክለኛ የስም አጠራር ድረስ የቀድሞዋ በርማ የአሁኗ ሚየንማር፣ የቀድሞዋ የሰብአዊ
23
- መብት እመቤት፣ የአሁኗ እስረኛ የሰሞኑ የሚዲያ ዐቢይ ጉዳይ ሆነዋል፡፡
24
-
25
-
26
- በእርግጥ የሴትዮዋ ‹ሌጋሲ› በትክክል ምንድነው? በሚለው ጉዳይ ሚዲያዎችና ተቋማት ተስማምተው አያውቁም፡፡
27
-
28
-
29
- ለመሆኑ ኦን ሳን ሱ ቺ ማን ናቸው?
30
-
31
-
32
- አን ሳን ሱ ቺ አባታቸው የበርማ የነጻነት አባት የሚባሉት የጄኔራል ኦን ሳን ሴት ልጅ ናቸው፡፡
33
-
34
-
35
- ታላቋ ብሪታኒያ በርማን (በአዲሱ ስሟ ሚየንማር) ለአንድ ክፍለ ዘመን ያህል ጊዜ በቅኝ ገዝታታለች፡፡
36
-
37
-
38
- ጄኔራል ኦን ሰን ለበርማ ነጻነት ተዋድቀዋል፡፡ የተገደሉትም በ1947 በተቀናቃኞቻቸው ነበር፡፡ ያን ጊዜ ሳን ሱ ቺ ገና
39
- 2 ዓመቷ ነበር፡፡ አን ሳን ሱ ቺ በሰኔ 19፣ 1945 ነበር የተወለዱት፡፡
40
-
41
-
42
- ኦን ሳን ሱ ቺ በ1960ዎቹ መጀመርያ ከእናታቸው ዳው ኪን ኬዪ ጋር ወደ ሕንድ ሄዱ፡፡ እናታቸው በደልሂ የበርማ
43
- አምባሳደር ተደርገው በመሾማቸው ነበር ወደዚያ ያቀኑት፡፡
44
-
45
-
46
- ሕንድ አራት ዓመት ከኖሩ በኋላ ወደ ታላቋ ብሪታኒያ በማቅናት በሥመጥሩ ኦክስፎርድ ዩኒቨርስቲ ፍልስፍናን፣ ፖለቲካንና
47
- ምጣኔ ሀብትን አጥንተዋል፡፡
48
-
49
-
50
- አን ሳን ሱ ቺ በኦክስፎርድ ዩኒቨርስቲ ሳሉ የወደፊት ባለቤታቸው ጋር ተገናኙ፡፡ እንግሊዛዊው ባለቤታቸው ማይክል አሪስ
51
- የታሪክ ተመራማሪ ፕሮፌሰር ነበሩ፡፡ አሁን በሕይወት የሉም፡፡
52
-
53
-
54
- ኦን ሳን ሱ ቺ ከትምህርት በኋላ በቡታን እና በጃፓን በተለያዩ ሥራዎች ላይ ተሳትፈዋል፡፡ ከዚያ በኋላ ወደ ታላቋ
55
- ብሪታኒያ በመሄድ ጎጆ መሥርተው አሌክሳንደርና ኪም የሚባሉ ልጆችን አፍርተዋል፡፡
56
-
57
-
58
- በ1988 ከታላቋ ብሪታኒያ ወደ ሚየንማር ዋና ከተማ ያንጎን ሲመለሱ በጠና ታመው የነበሩትን እናታቸውን ለማስታመም
59
- ነበር፡፡
60
-
61
-
62
- የአጋጣሚ ነገር ሆኖ በበዚያ ወቅት በሚየንማር በርካታ የዲሞክራሲ ጥያቄዎችን ያነሱ ወጣቶች አደባባይ ወጥተው ተቃውሞ
63
- ያስነሱበት ጊዜ ነበር፡፡
64
-
65
-
66
- ተቃዋሚዎቹ ወጣቶች ብቻ ሳይሆኑ የቡድሀ መነኮሳት፣ የቢሮ ሰራተኞችና ተማሪዎችም ይገኙበት ነበር፡፡
67
-
68
-
69
- ይህን ተቃውሞ ተከትሎ አን ሳን ሱ ቺ ጠቅልለው በሚየንማር መኖር ጀመሩ፡፡
70
-
71
-
72
- አን ሳን ሱቺ ከቀድሞ ባለቤታቸው ጋር በለንደን
73
-
74
-
75
- ከ2 ዓመት በኋላ በ1990 አዲስ በተመሠረተው የናሽናል ሊግ ፓርቲ ውስጥ ገብተው ተቃውሞ ውስጥ በቀጥታ መሳተፍ ጀመሩ፡፡
76
- በአካባቢ ምርጫ ተወዳድረውም አሸነፉ፡፡
77
-
78
-
79
- በከፍተኛ ድምጽ የኦን ሳን ሱ ቺ በምርጫ ማሸነፍ ያስቆጣው ወታደራዊው መንግሥት ሴትዮዋን ለሚቀጥሉት 20 ዓመታት በቁም
80
- እስር አስቀመጣቸው፡፡
81
-
82
-
83
- በ1991 ኦን ሳን ሱ ቺ በቁም እስር ላይ ሳሉ የኖቤል ሽልማትን አሸነፉ፡፡ ይህም ወታደራዊውን መንግሥት በይበልጥ
84
- አስቆጣ፡፡
85
-
86
-
87
- በ2010 ኦን ሳን ሱ ቺ ከቁም እስር ነጻ ተባሉ፡፡
88
-
89
-
90
- በ2012 አን ሳን ሱ ቺና ፓርቲያቸው በአካባቢ ምርጫ እንዲሳተፉ ወታደራዊው መንግሥት ፈቀደ፡፡
91
-
92
-
93
- በ2015 የብሔራዊ ሊግ ለዲሞክራሲ (NLD) ፓርቲያቸው ለመጀመርያ ጊዜ በተደረገ ከፍተኛ ፉክክር በታየበት ምርጫ
94
- አሸነፈ፡፡
95
-
96
-
97
- አን ሳን ሱ ቺ በሚየንማር ���ሮሒንጋ ሙስሊሞች ላይ ወታደሩ ያደረሰውን ግፍና ጭፍጨፋ ለማውገዝ አለመፍቀዳቸው በዓለም አቀፍ
98
- የሰብአዊ መብት ተሟጋቾች ዘንድ ቁጣን ቀሰቀሰ፡፡ በመቶ ሺ የሚቆጠሩ የሮሒንጋ ሙስሊሞች ከሚየንማር ሞትን ሽሽት ወደ
99
- ባንግላዴሽ ተሰደዋል፡፡
100
-
101
-
102
- በዓለም አቀፉ ማኅበረሰብ ዘንድ ክብራቸው ዝቅ ይበል እንጂ አን ሳን ሱ ቺ በአገራቸው ቡድሀዎች ዘንድ እጅግ ተወዳጅ
103
- ናቸው፡፡
104
-
105
-
106
- አን ሳን ሱ ቺ በ2015 የተደረገውን ምርጫ አሸንፈው መንግሥት ቢመሠርቱም የአገሪቱ ፕሬዝዳንት መሆን...
107
- - text: >-
108
- አዲስ አበባ ፣ ነሃሴ 23 ፣ 2012 (ኤፍ ቢ ሲ) ኢትዮጵያ፣ ሱዳን እና ግብጽ በታላቁ የህዳሴ ግድብ አሞላል እና ውሃ
109
- አለቃቀቅ ደንብ ላይ የሚያደርጉት የሶስትዮሽ ስብሰባ መስከረም ወር ላይ እንደሚቀጥል የውሃ መስኖና ኢነርጅ ሚኒስቴር
110
- አስታወቀ፡፡ሚኒስቴሩ የሶስቱ ሃገራት የውሃ ጉዳይ ሚኒስትሮች በትናንትናው እለት ስብሰባ ማካሄዳቸውን
111
- አስታውቋል፡፡በስብሰባው ላይ የሂደቱ ታዛቢ የሆኑት የደቡብ አፍሪካ፣ የአውሮፓ ህብረት እና የአሜሪካ ተወካዮች እንዲሁም
112
- ከአፍሪካ ህብረት የተወከሉ ባለሙያዎች መሳተፋቸውንም ገልጿል፡፡በወቅቱም ላላፈው አንድ ሳምንት በሃገራቱ ባለሙያዎች በታላቁ
113
- የህዳሴ ግድብ አሞላልና የውሃ አለቃቀቅ ደንብ ላይ ሲከናወን የነበረው የባለሙያዎች ድርድር ሪፖርት መቅረቡንም
114
- ጠቅሷል፡፡በቀጣይ የሚኖረውን ሂደት በሚመለከትም ሃገራቱ የድርድሩን ሂደት የሚገልጽ ደብዳቤ ለደቡብ አፈሪካዋ ዓለም አቀፍ
115
- ግንኙነት እና ትብብር ሚኒስትር እና የአፍሪካ ህብረት አስፈጻሚ ምክር ቤት የወቅቱ ሊቀ መንበር ዶክተር ናዴሊ ፓንዶል
116
- ለመላክ መስማማታቸውንም ነው የገለጸው፡፡በዚህም ሱዳን የምትሰጠው ማረጋገጫ እንደሚጠበቅ የገለጸው ሚኒስቴሩ የሶስትዮሽ
117
- ስብሰባው መስከረም 4 ቀን 2013 ዓ.ም እንደሚቀጥል አስታውቋል፡፡
118
- - text: "በፕሪሚየር ሊጉ ኢትዮጵያ ቡና እና ወልቂጤ ከተማ\_አቻ ተለያዩ \_"
119
- - text: ፕሪሚየር ሊግ ፡ ሲዳማ ከሜዳው ውጪ ጣፋጭ ድል ሲያስመዘግብ አርባምንጭ ከ ዳሽን ቢራ አቻ ተለያይተዋል
120
- pipeline_tag: feature-extraction
121
  library_name: sentence-transformers
 
122
  metrics:
123
  - dot_accuracy@1
124
  - dot_accuracy@3
@@ -139,6 +26,57 @@ metrics:
139
  - query_sparsity_ratio
140
  - corpus_active_dims
141
  - corpus_sparsity_ratio
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
142
  model-index:
143
  - name: SPLADE-RoBERTa-Amharic-Medium
144
  results:
@@ -146,8 +84,8 @@ model-index:
146
  type: sparse-information-retrieval
147
  name: Sparse Information Retrieval
148
  dataset:
149
- name: Unknown
150
- type: unknown
151
  metrics:
152
  - type: dot_accuracy@1
153
  value: 0.6285881663737551
@@ -206,31 +144,31 @@ model-index:
206
  - type: corpus_sparsity_ratio
207
  value: 0.9963146789694772
208
  name: Corpus Sparsity Ratio
209
- datasets:
210
- - rasyosef/Amharic-Passage-Retrieval-Dataset-V2
211
  ---
212
 
213
  # SPLADE-Amharic-Medium
214
 
215
- This is a [SPLADE Sparse Encoder](https://www.sbert.net/docs/sparse_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It maps sentences & paragraphs to a 32000-dimensional sparse vector space and can be used for semantic search and sparse retrieval.
 
 
 
216
  ## Model Details
217
 
218
  ### Model Description
219
  - **Model Type:** SPLADE Sparse Encoder
220
- - **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) <!-- at revision 9d02d0281e64d6ca31bd06d322e14b0b7e60375b -->
221
  - **Maximum Sequence Length:** 510 tokens
222
  - **Output Dimensionality:** 32000 dimensions
223
  - **Similarity Function:** Dot Product
224
- <!-- - **Training Dataset:** Unknown -->
225
  - **Language:** am
226
  - **License:** mit
227
 
228
  ### Model Sources
229
 
 
 
230
  - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
231
  - **Documentation:** [Sparse Encoder Documentation](https://www.sbert.net/docs/sparse_encoder/usage/usage.html)
232
- - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
233
- - **Hugging Face:** [Sparse Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=sparse-encoder)
234
 
235
  ### Full Model Architecture
236
 
@@ -260,8 +198,8 @@ model = SparseEncoder("rasyosef/splade-amharic-medium")
260
  # Run inference
261
  sentences = [
262
  'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
263
- 'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል። በዚህ የተነሳም የኢትዮጵያ ቡናና ሻይ ባለሥልጣንን ጨምሮ የሚመላካታቸው ሁሉ ቡና ላኪዎችና አምራቾች ያከማቹትን ቡና በፍጥነት ወደ ዓለም ገበያ እንዲያወጡ ጥሪ እያቀረቡ ነው ።',
264
- 'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር። ከፑቲን ጋር ደግሞ ዢ ለሁለቱ አገራት ስልታዊም ሆነ ኢኮኖሚያዊ ጠቀሜታ ረጅም ጊዜ የዘለቀውን አጋርነትን ይበልጥ ማጠናከር ላይ ነበር ትኩረታቸው።',
265
  ]
266
  embeddings = model.encode(sentences)
267
  print(embeddings.shape)
@@ -275,30 +213,6 @@ print(similarities)
275
  # [ 0.0000, 2.4125, 69.0888]])
276
  ```
277
 
278
- <!--
279
- ### Direct Usage (Transformers)
280
-
281
- <details><summary>Click to see the direct usage in Transformers</summary>
282
-
283
- </details>
284
- -->
285
-
286
- <!--
287
- ### Downstream Usage (Sentence Transformers)
288
-
289
- You can finetune this model on your own dataset.
290
-
291
- <details><summary>Click to expand</summary>
292
-
293
- </details>
294
- -->
295
-
296
- <!--
297
- ### Out-of-Scope Use
298
-
299
- *List how the model may foreseeably be misused and address what users ought not to do with the model.*
300
- -->
301
-
302
  ## Evaluation
303
 
304
  ### Metrics
@@ -329,39 +243,14 @@ You can finetune this model on your own dataset.
329
  | corpus_active_dims | 117.9303 |
330
  | corpus_sparsity_ratio | 0.9963 |
331
 
332
- <!--
333
- ## Bias, Risks and Limitations
334
-
335
- *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
336
- -->
337
-
338
- <!--
339
- ### Recommendations
340
-
341
- *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
342
- -->
343
-
344
  ## Training Details
345
 
346
- <details>
347
-
348
  ### Training Dataset
349
 
350
- #### Unnamed Dataset
351
 
352
  * Size: 245,876 training samples
353
  * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
354
- * Approximate statistics based on the first 1000 samples:
355
- | | anchor | positive | negative |
356
- |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
357
- | type | string | string | string |
358
- | details | <ul><li>min: 3 tokens</li><li>mean: 16.29 tokens</li><li>max: 101 tokens</li></ul> | <ul><li>min: 30 tokens</li><li>mean: 324.02 tokens</li><li>max: 510 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 330.65 tokens</li><li>max: 510 tokens</li></ul> |
359
- * Samples:
360
- | anchor | positive | negative |
361
- |:------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
362
- | <code>ክልሎች ለስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ሰነድ ለመስጠት ፈቃደኛ አለመሆናቸው ታወቀ</code> | <code>የክልሎቹ አቋም ስኳር ፋብሪካዎቹን ለመሸጥ የተያዘውን ዕቅድ እንዳይስተጓጎል ሥጋት ፈጥሯልጠቅላይ ሚኒስትሩ መፍትሔ እንዲያሰጡ ተጠይቋልበፌዴራል መንግሥት ለተቋቋሙ ነባርና በግንባታ ላይ ለሚገኙ አዳዲስ የስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ሰነድ እንዲሰጡ ተደጋጋሚ ጥያቄ ለሚመለከታቸው ክልሎች ቢቀርብም፣ ክልሎች ፈቃደኛ አለመሆናቸውን ሪፖርተር ያገኘው መረጃ አመለከተ፡፡የተገኘው የሰነድ መረጃ እንደሚያመለክተው የፌዴራል መንግሥት ከበርካታ ዓመታት በፊት ላቋቋማቸው ነባር የስኳር ፋብሪካዎችም ሆነ፣ በአሁኑ ወቅት በግንባታ ላይ ለሚገኙት የስኳር ፋብሪካዎች የይዞታ ማረጋገጫ ማግኘት ባለመቻሉ መንግሥት ፋብሪካዎቹን ወደ ግል ለማዘዋወር እያደረገ ያለውን ጥረት እንዳያስተጓጉል ሥጋት ፈጥሯል፡፡መንግሥት በያዘው ዕቅድ መሠረት ከዘንድሮ ጀምሮ ሁሉንም የስኳር ፋብሪካዎች ወደ ግል ለማዘዋወር፣ የፋብሪካዎቹን ሀብት በተናጠል እንዲገመት ከማድረግ አንስቶ በርካታ የቅድመ ፕራይቬታይዜሽን ተግባራትን እያከናወነ ቢሆንም፣ ፕራይቬታይዜሽኑን ዕውን ለማድረግ መሠረታዊ የሆነውን የይዞታ ማረጋገጫ ማሟላት እንዳልተቻለ ሰነዱ ያመለክታል፡፡በኢትዮጵያ ስኳር ኮርፖሬሽን ሥር የሚተዳደሩ ነባርና በግንባታ ሒደት ላይ የሚገኙ በጥቅሉ 13 ስኳር ፋብሪካዎች ቢኖሩም፣ ከእነዚህ መካከል የተሟላ የይዞታ ማረጋገጫ ሰነድ ያላቸው ሁለት ስኳር ፋብሪካዎች ብቻ እንደሆኑ ለማወቅ ተችሏል፡፡‹‹ነባርና አዳዲስ ፕሮጀክቶች ላይ የይዞታ ማረጋገጫ ሰነድ ለማግኘት ከጅምሩ አንስቶ በድርጅቶቹና በኮርፖሬሽን አማካይነት ያላሰለሰ ጥረት ቢደረግም፣ ከወንጂ ሸዋና ከፊንጫ ስኳር ፋብሪካዎች በስተቀር ነባሩን የመተሐራ ስኳር ፋብሪካ ጨምሮ ሌሎቹ ነባርና በግንባታ ላይ የሚገኙ የስኳር ልማት ፕሮጀክቶች የይዞታ ማረጋገጫ ሰነድ ማግኘት አልተቻለም፤...</code> | <code>  በባህል ቱሪዝምና ስፖርት ሚኒስቴር እና ስፖርት ኮሚሽን መካከል በተጠሪነት ላይ የግልጽነት መጓደል መኖሩ የባሀልና ስፖርት ሚኒስቴር የስፖርት ልማት ዘርፍ ዴኤታ አ�� ሃብታሙ ሲሳይ ገለጹ። አቶ ሃብታሙ ለአዲስ ዘመን ጋዜጣ እንደተናገሩት ፤የፌዴራል አስፈጻሚ አካላት ስልጣንና ተግባርን ለመወሰን የወጣ አዋጅ በአግባቡ አውቆ ከመጠቀም አኳያ ውስንነት አለ። ስፖርት ኮሚሽን ለበርካታ ዓመታት ሚኒስቴር ነበር። የአብዛኛው አመራርና ሰራተኛ እሳቤ የሚኒስቴር እሳቤን የያዘ እንደመሆኑ ‹ እኛ ኮሚሽን ነን›የሚለውን በፍጥነት ለመቀበል ግርታን መፈጠሩም የሚጠበቅ መሆኑን ገልጸው፤ እንዲህ አይነቱ ጉድለት ደግሞ ‹ስልጣናችን እየተጋፋን ነው ›የሚሉ አዋጁን ካለመገንዘብ የመነጩ ቅሬታዎች አሉ ብለዋል። የስፖርቱ አደረጃጀት አንድ ጊዜ ከአንዱ ፤ሌላ ጊዜ ደግሞ ከሌላው የመጣበቅ ዝንባሌዎች በተደጋጋሚ መኖሩን ጠቅሰው ፤አደረጃጀቱ ወጥ ሆኖ ያለመቆየትም ከዚሁ ጋር አብሮ የሚታይ እንደሆነ ተናግረዋል። በዚህም ጠንካራ የስፖርት ምክር ቤት አለመፈጠሩ ስፖርቱ ህዝባዊ መሰረት እንዳይኖረው ማድረጉንም አክለው ገልጸዋል። እንደ አቶ ሃብታሙ ማብራሪያ ፤ ስፖርቱን የሚመራው ህዝባዊ አደረጃጀቱ እንደሆነ በፖሊሲው ተቀምጧል። ህዝባዊ አደረጃጀት የሚባለው፤ ኦሎምፒክ ኮሚቴ፤ ፌዴሬሽኖቹ፤ ክለቦቹ፤ እንዲሁም የስፖርት ምክር ቤቶች ናቸው። በሀገራችን ወቅታዊ ሁኔታ የስፖርት ምክር ቤቶች የት ናቸው? ስፖርቱን በአግባቡ መምራት በሚችሉበት ቁመና አይገኙም። በፌዴራል ደረጃ የስፖርት ምክር ቤት ተቋቁሞ ወደ ስራ የገባው በ60ዎቹ አካባቢ ቢሆንም፤ በፌዴራል ደረጃ ከ2007 ዓ.ም ጀምሮ ጠፍተዋል። ብሄራዊ የስፖርት ምክር ቤት በ2011 ዓ.ም ነው ገና እንዳዲስ የተቋቋመው፤ በክልሎችም ተመሳሳይ ሁኔታ ይንጸባረቃል። «በዓመ...</code> |
363
- | <code>መዳ ወላቡ ዩኒቨርሲቲ ያሰለጠናቸው 19 ሐኪሞች አስመረቀ</code> | <code>አዲስ አበባ ፣ ህዳር 12 ፣ 2013 (ኤፍ ቢ ሲ) መዳ ወላቡ ዩኒቨርሲቲ በህክምና ዶክትሬት የትምህርት ዘርፍ ያሰለጠናቸው 19 ተማሪዎችን ዛሬ አስመረቀ፡፡ዩኒቨርሲቲው የዛሬ ተመራቂዎችን ጨምሮ 99 የህክምና ዶክተሮችን አሰልጥኖ አስመርቋል።በዩኒቨርሲቲው ምክትል ፕሬዝዳንት ማዕረግ የጎባ ሪፈራል ሆስፒታል ዋና ዳይሬክተር ዶክተር ጄይላን ቃሲም ሆስፒታሉ ለአካባቢው ማህበረሰብ ከሚሰጠው የህክምና አገልግሎት በተጓዳኝ በተለያዩ የህክምና ሙያዎች ስልጠና እየሰጠ እንዳለ መግለጻቸውን ኢዜአ ዘግቧል።በ1999 ዓ.ም 742 ተማሪዎች ተቀብሎ ስራ የጀመረው መዳ ወላቡ ዩኒቨርሲቲ አሁን ላይ ከ24 ሺህ የሚበልጡ ተማሪዎች አሉት።</code> | <code>የአዲስ አበባ ከተማ አስተዳደር የሙያ ትምህርትና ስልጠና ቢሮ በ2009 ዓም በተለያዩ ሙያ ዘርፎች ያሰለጠናቸውን ከ8ሺህ 800 በላይ ሰልጣኞች ዛሬ በሚሊንየም አዳራሽ አስመረቀ ፡፡በምረቃ ስነ ስርዓቱ ላይ የተገኙት የአዲስ አበባ ከተማ አስተዳደር አፈ ጉባኤ ዶክተር ታቦር ገብረመድህን እንደገለጹት ፤ተመራቂዎች በስልጠና ቆይታቸው ያገኙዋቸውን መሰረታዊ ዕውቀትና ክህሎት በየጊዜው በማዳበር ለአገራቸው የሚገባቸውን አስተዋጽኦ ማበርከት ይገባቸዋል ፡፡በስራው ዓለም የይቻላል መንፈስን በማጎልበትና የቴክኖሎጂ ፈጠራ ክህሎትን በማዳበር ቀጣይ ለአገሪቱ ኢኮኖሚ ዕድገት የድርሻቸውን ሊወጠ ይገባል ፡፡በከተማ የወጣቶች ተጠቃሚነትን ለማጎልበት መንገስት በፈቀደው የተንቀሳቃሽ ፈንድ ምቹ አጋጣሚ ሰልጣኞቹ እንዲጠቀሙበትም ጥሪ አቅርበዋል ፡፡የከተማው አስተዳደር የቴክኒክና ሙያ ስልጠና ኃላፊ አቶ ዘርኡ ስሙር በበኩላቸው እንደገለጹት ፤ከደረጃ አንድ እስከ ደረጃ አምስት ከሰለጠኑት 8ሺ 837 ተመራቂዎች ውስጥ 34 በመቶ ሴቶች መሆናቸውን ገልጸዋል ፡፡ቢሮው ባለፉት ሁለት ዓመታም 47 ሺህ የሚሆኑት አጫጭር ስልጠናዎች ማግኘታቸውን ጠቁመዋል ፡፡በአዲስ አበባ ከተማ የሚገኙ የቴክና ሙያ ማሰልጠኛ ተቋማትና ኮሌጆች ዜጎች በተለያዩ የሙያ ዘርፎች ተገቢ የሙያ ክህሎት እንዲያገኙ ተገቢውን አስተዋጽኦ እያበረከቱ መሆናቸውን አስረድተዋል፡፡የቴክኒክና ሙያ ተቋማትም የተሻለ የሙያ ክህሎት ያላቸው ሰልጣኞችን በማፍራት ረገድ ያደረጉት ርብርቦሽም አመስግነዋል ፡፡ሰልጣኞቹ በአነስተኛና ጥቃቅን በመደራጀትና በመስራት የተጣለባቸውን ሀገራዊ ሃላፊነት እንዲወጡ ጥሪ አቅርበዋል ፡፡በመጨረሻም በተለያዩ ዘርፎች የክህሎት ውድድርና የላቀ አፈጻጸም ያስመዘገቡ ሰልጣኞች እንዲሁም አሰልጣኞች የሜዳሊያና የሰርተፊኬት ሽልማትና ዕ...</code> |
364
- | <code>በኢትዮጵያ ከባህር ጠለል 2500 ሜትር ከፍታ የምትገኝ እንዲሁም በሀገሪቱ ትልቋ ከተማ ማን ትባላለች?</code> | <code>አዲስ አበባ አዲስ አበባ ተብላ የተሠየመችው እቴጌ ጣይቱ ኅዳር ፲፬ ቀን ፲፰፻፸፱ (1879) ዓ.ም. ፍልውሃ ፊን-ፊን ወደሚልበት መስክ ወርደው ሳሉ ከዚህ በፊት አይተዋት የማያውቋት አንዲት ልዩ አበባ አይተ ስለማረከቻቸው ቦታውን ‹‹አዲስ አበባ!›› አሉ ይባላል። አዲስ አበባ (ኣዲስ ኣበባ) ኢትዮጵያ ዋና ከተማ ስትሆን በተጨማሪ የአፍሪካ ሕብረት መቀመጫ እንዲሁም የብዙ የተባበሩት መንግሥታት ድርጅት ቅርንጫፎችና ሌሎችም የዓለም የዲፕሎማቲክ (የሰላማዊ ግንኙነት) ልዑካን መሰብሰቢያ ከተማ ናት። ራስ-ገዝ አስተዳደር ስላላት የከተማና የክልል ማዕረግ ይዛ ትገኛለች። አብዛኞቹን የሀገሩ ቋንቋዎች የሚናገሩ ክርስቲያኖች እና ሙስሊሞች የሚኖሩባት ከተማ ናት። ከባሕር ጠለል በ2500 ሜትር ከፍታ ላይ የምትገኘው ከተማ በግምት 2,757,729 በላይ ሕዝብ የሚኖርባት በመሆኗ የሀገሪቱ አንደኛ ትልቅ ከተማ ናት። ከተማዋ እቴጌ ጣይቱ በመረጡት ቦታ ማለትም በፍል ውሐ አካባቢ ላይ በባላቸው በዳግማዊ ምኒልክ በ፲፰፻፸፰ (1878) ዓ.ም. ተቆረቆረች። የሕዝቧ ብዛት በያመቱ 8% (ስምንት በመቶ) እየጨመረ አሁን አምስት ሚሊዮን እንደሚደርስ ይገመታል። ከእንጦጦ ጋራ ግርጌ ያለችው መዲና የአዲስ አበባ ዩኒቨርሲቲ መገኛ ሆናለች። ይህም በመስራቹ የቀድሞው ንጉሠ-ነገሥት ስም ቀዳማዊ ኃይለ ሥላሴ ዩኒቨርሲቲ ይባል ነበር።</code> | <code>ታሕታይ ሎጎምቲ / አድዋ ወረዳ ከሚገኙ የገጠር ቀበሌዎች<br>አንዷ ስትሆን ትምህርት ቤት የተጀመረበት አመተምህረት በ 1984 ዓ/ም ነው። አሁን እስከ 8ኛ ክፍል እያስተማረ ይገኛል፡፡ በተጨማሪም ሌላ 1ኛ ደረጃ ት/ቤት ማይሰጋሉ አከባቢ ተገንብቶ ተማሪዎችእየተማሩበት ይገኛሉ፡፡የመኪና መንገድ ደግሞ በ1985/86 አከባቢ ተጀምረዋል። በአከባቢዋ የተለያዮ የተከለሉ ደንኞች ማለትም ሸተቶ ፣ ኩማጫሉቅ፣ ሸቃወለዳይት፣ ደብረሳህሊ፣አቡነእንድርያስ ፣ሰውሒ ፅየት እና ሌሎችም ያቀፈች ቀበሌ ነች፡፡እንስሳተ ዘገዳም ቀበሮ፣ ጅብ፣ በተመሳሳይ ቆቅ እና ጅግራም ይገኙበታል፡፡በተለይ በውስጧ የያዘቻቸው አዝርእትና የበጋ<br>አትክልቶችና ለአይን ከመማረክ አልፎ ለአከባቢው ህ/ሰብ<br>የገቢ ምንጭ ናቸው "ግድብ ሰይሳ" የ ሰይሳ ግድብም<br>እዛው ይገኛ���። በውስጧ 4 ቀጠናዎች(ቁሸት) ይገኛሉ፡፡<br>እነሱም ፅየት ፣ገብላ፣ አዲስአለም፣ ማይወይኒ የሚባሉ ናቸው። ራህያ ከተማም ከፊል ከተማው በዚህ ቀበሌ ይገኛል<br><br>አድዋ</code> |
365
  * Loss: [<code>SpladeLoss</code>](https://sbert.net/docs/package_reference/sparse_encoder/losses.html#spladeloss) with these parameters:
366
  ```json
367
  {
@@ -385,166 +274,13 @@ You can finetune this model on your own dataset.
385
  - `optim`: adamw_torch_fused
386
  - `batch_sampler`: no_duplicates
387
 
388
- #### All Hyperparameters
389
- <details><summary>Click to expand</summary>
390
-
391
- - `overwrite_output_dir`: False
392
- - `do_predict`: False
393
- - `eval_strategy`: epoch
394
- - `prediction_loss_only`: True
395
- - `per_device_train_batch_size`: 48
396
- - `per_device_eval_batch_size`: 48
397
- - `per_gpu_train_batch_size`: None
398
- - `per_gpu_eval_batch_size`: None
399
- - `gradient_accumulation_steps`: 1
400
- - `eval_accumulation_steps`: None
401
- - `torch_empty_cache_steps`: None
402
- - `learning_rate`: 6e-05
403
- - `weight_decay`: 0.0
404
- - `adam_beta1`: 0.9
405
- - `adam_beta2`: 0.999
406
- - `adam_epsilon`: 1e-08
407
- - `max_grad_norm`: 1.0
408
- - `num_train_epochs`: 4
409
- - `max_steps`: -1
410
- - `lr_scheduler_type`: cosine
411
- - `lr_scheduler_kwargs`: {}
412
- - `warmup_ratio`: 0.05
413
- - `warmup_steps`: 0
414
- - `log_level`: passive
415
- - `log_level_replica`: warning
416
- - `log_on_each_node`: True
417
- - `logging_nan_inf_filter`: True
418
- - `save_safetensors`: True
419
- - `save_on_each_node`: False
420
- - `save_only_model`: False
421
- - `restore_callback_states_from_checkpoint`: False
422
- - `no_cuda`: False
423
- - `use_cpu`: False
424
- - `use_mps_device`: False
425
- - `seed`: 42
426
- - `data_seed`: None
427
- - `jit_mode_eval`: False
428
- - `use_ipex`: False
429
- - `bf16`: False
430
- - `fp16`: True
431
- - `fp16_opt_level`: O1
432
- - `half_precision_backend`: auto
433
- - `bf16_full_eval`: False
434
- - `fp16_full_eval`: False
435
- - `tf32`: None
436
- - `local_rank`: 0
437
- - `ddp_backend`: None
438
- - `tpu_num_cores`: None
439
- - `tpu_metrics_debug`: False
440
- - `debug`: []
441
- - `dataloader_drop_last`: False
442
- - `dataloader_num_workers`: 0
443
- - `dataloader_prefetch_factor`: None
444
- - `past_index`: -1
445
- - `disable_tqdm`: False
446
- - `remove_unused_columns`: True
447
- - `label_names`: None
448
- - `load_best_model_at_end`: False
449
- - `ignore_data_skip`: False
450
- - `fsdp`: []
451
- - `fsdp_min_num_params`: 0
452
- - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
453
- - `fsdp_transformer_layer_cls_to_wrap`: None
454
- - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
455
- - `deepspeed`: None
456
- - `label_smoothing_factor`: 0.0
457
- - `optim`: adamw_torch_fused
458
- - `optim_args`: None
459
- - `adafactor`: False
460
- - `group_by_length`: False
461
- - `length_column_name`: length
462
- - `ddp_find_unused_parameters`: None
463
- - `ddp_bucket_cap_mb`: None
464
- - `ddp_broadcast_buffers`: False
465
- - `dataloader_pin_memory`: True
466
- - `dataloader_persistent_workers`: False
467
- - `skip_memory_metrics`: True
468
- - `use_legacy_prediction_loop`: False
469
- - `push_to_hub`: False
470
- - `resume_from_checkpoint`: None
471
- - `hub_model_id`: None
472
- - `hub_strategy`: every_save
473
- - `hub_private_repo`: None
474
- - `hub_always_push`: False
475
- - `hub_revision`: None
476
- - `gradient_checkpointing`: False
477
- - `gradient_checkpointing_kwargs`: None
478
- - `include_inputs_for_metrics`: False
479
- - `include_for_metrics`: []
480
- - `eval_do_concat_batches`: True
481
- - `fp16_backend`: auto
482
- - `push_to_hub_model_id`: None
483
- - `push_to_hub_organization`: None
484
- - `mp_parameters`:
485
- - `auto_find_batch_size`: False
486
- - `full_determinism`: False
487
- - `torchdynamo`: None
488
- - `ray_scope`: last
489
- - `ddp_timeout`: 1800
490
- - `torch_compile`: False
491
- - `torch_compile_backend`: None
492
- - `torch_compile_mode`: None
493
- - `include_tokens_per_second`: False
494
- - `include_num_input_tokens_seen`: False
495
- - `neftune_noise_alpha`: None
496
- - `optim_target_modules`: None
497
- - `batch_eval_metrics`: False
498
- - `eval_on_start`: False
499
- - `use_liger_kernel`: False
500
- - `liger_kernel_config`: None
501
- - `eval_use_gather_object`: False
502
- - `average_tokens_across_devices`: False
503
- - `prompts`: None
504
- - `batch_sampler`: no_duplicates
505
- - `multi_dataset_batch_sampler`: proportional
506
- - `router_mapping`: {}
507
- - `learning_rate_mapping`: {}
508
-
509
- </details>
510
-
511
- ### Training Logs
512
- | Epoch | Step | Training Loss | dot_ndcg@10 |
513
- |:-----:|:-----:|:-------------:|:-----------:|
514
- | 1.0 | 5123 | 46.9605 | 0.7653 |
515
- | 2.0 | 10246 | 0.074 | 0.7476 |
516
- | 3.0 | 15369 | 0.0308 | 0.7659 |
517
- | 4.0 | 20492 | 0.0179 | 0.7694 |
518
- | -1 | -1 | - | 0.7694 |
519
-
520
-
521
- ### Framework Versions
522
- - Python: 3.11.13
523
- - Sentence Transformers: 5.0.0
524
- - Transformers: 4.53.0
525
- - PyTorch: 2.6.0+cu124
526
- - Accelerate: 1.8.1
527
- - Datasets: 3.6.0
528
- - Tokenizers: 0.21.2
529
-
530
- </details>
531
-
532
  ## Citation
533
 
534
- <!--
535
- ## Glossary
536
-
537
- *Clearly define terms in order to be accessible across audiences.*
538
- -->
539
-
540
- <!--
541
- ## Model Card Authors
542
-
543
- *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
544
- -->
545
-
546
- <!--
547
- ## Model Card Contact
548
-
549
- *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
550
- -->
 
1
  ---
2
+ base_model: rasyosef/roberta-medium-amharic
3
+ datasets:
4
+ - rasyosef/Amharic-Passage-Retrieval-Dataset-V2
5
  language:
6
  - am
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
  library_name: sentence-transformers
8
+ license: mit
9
  metrics:
10
  - dot_accuracy@1
11
  - dot_accuracy@3
 
26
  - query_sparsity_ratio
27
  - corpus_active_dims
28
  - corpus_sparsity_ratio
29
+ pipeline_tag: text-retrieval
30
+ tags:
31
+ - sentence-transformers
32
+ - sparse-encoder
33
+ - sparse
34
+ - splade
35
+ - generated_from_trainer
36
+ - dataset_size:245876
37
+ - loss:SpladeLoss
38
+ - loss:SparseMultipleNegativesRankingLoss
39
+ - loss:FlopsLoss
40
+ widget:
41
+ - text: የኢንዱስትሪ ፓርኮች ፈተና እና ተስፋ
42
+ - text: "ከሳምንት በፊት በመፈንቅለ መንግሥት ሥልጣናቸውን አጥተዋል፡፡ አሁን በቁም እስር ላይ ናቸው፡፡\n\nከስማቸው አወዛጋቢነት\
43
+ \ እስከ አገሪቱ ትክክለኛ የስም አጠራር ድረስ የቀድሞዋ በርማ የአሁኗ ሚየንማር፣ የቀድሞዋ የሰብአዊ መብት እመቤት፣ የአሁኗ\
44
+ \ እስረኛ የሰሞኑ የሚዲያ ዐቢይ ጉዳይ ሆነዋል፡፡ \n\nበእርግጥ የሴትዮዋ ‹ሌጋሲ› በትክክል ምንድነው? በሚለው ጉዳይ ሚዲያዎችና\
45
+ \ ተቋማት ተስማምተው አያውቁም፡፡\n\nለመሆኑ ኦን ሳን ሱ ቺ ማን ናቸው? \n\nአን ሳን ሱ ቺ አባታቸው የበርማ የነጻነት\
46
+ \ አባት የሚባሉት የጄኔራል ኦን ሳን ሴት ልጅ ናቸው፡፡\n\nታላቋ ብሪታኒያ በርማን (በአዲሱ ስሟ ሚየንማር) ለአንድ ክፍለ\
47
+ \ ዘመን ያህል ጊዜ በቅኝ ገዝታታለች፡፡ \n\nጄኔራል ኦን ሰን ለበርማ ነጻነት ተዋድቀዋል፡፡ የተገደሉትም በ1947 በተቀናቃኞቻቸው\
48
+ \ ነበር፡፡ ያን ጊዜ ሳን ሱ ቺ ገና 2 ዓመቷ ነበር፡፡ አን ሳን ሱ ቺ በሰኔ 19፣ 1945 ነበር የተወለዱት፡፡\n\nኦን\
49
+ \ ሳን ሱ ቺ በ1960ዎቹ መጀመርያ ከእናታቸው ዳው ኪን ኬዪ ጋር ወደ ሕንድ ሄዱ፡፡ እናታቸው በደልሂ የበርማ አምባሳደር ተደርገው\
50
+ \ በመሾማቸ�� ነበር ወደዚያ ያቀኑት፡፡\n\nሕንድ አራት ዓመት ከኖሩ በኋላ ወደ ታላቋ ብሪታኒያ በማቅናት በሥመጥሩ ኦክስፎርድ\
51
+ \ ዩኒቨርስቲ ፍልስፍናን፣ ፖለቲካንና ምጣኔ ሀብትን አጥንተዋል፡፡ \n\nአን ሳን ሱ ቺ በኦክስፎርድ ዩኒቨርስቲ ሳሉ የወደፊት\
52
+ \ ባለቤታቸው ጋር ተገናኙ፡፡ እንግሊዛዊው ባለቤታቸው ማይክል አሪስ የታሪክ ተመራማሪ ፕሮፌሰር ነበሩ፡፡ አሁን በሕይወት የሉም፡፡\n\
53
+ \nኦን ሳን ሱ ቺ ከትምህርት በኋላ በቡታን እና በጃፓን በተለያዩ ሥራዎች ላይ ተሳትፈዋል፡፡ ከዚያ በኋላ ወደ ታላቋ ብሪታኒያ\
54
+ \ በመሄድ ጎጆ መሥርተው አሌክሳንደርና ኪም የሚባሉ ልጆችን አፍርተዋል፡፡ \n\nበ1988 ከታላቋ ብሪታኒያ ወደ ሚየንማር ዋና\
55
+ \ ከተማ ያንጎን ሲመለሱ በጠና ታመው የነበሩትን እናታቸውን ለማስታመም ነበር፡፡\n\nየአጋጣሚ ነገር ሆኖ በበዚያ ወቅት በሚየንማር\
56
+ \ በርካታ የዲሞክራሲ ጥያቄዎችን ያነሱ ወጣቶች አደባባይ ወጥተው ተቃውሞ ያስነሱበት ጊዜ ነበር፡፡ \n\nተቃዋሚዎቹ ወጣቶች\
57
+ \ ብቻ ሳይሆኑ የቡድሀ መነኮሳት፣ የቢሮ ሰራተኞችና ተማሪዎችም ይገኙበት ነበር፡፡\n\nይህን ተቃውሞ ተከትሎ አን ሳን ሱ ቺ\
58
+ \ ጠቅልለው በሚየንማር መኖር ጀመሩ፡፡\n\nአን ሳን ሱቺ ከቀድሞ ባለቤታቸው ጋር በለንደን\n\nከ2 ዓመት በኋላ በ1990\
59
+ \ አዲስ በተመሠረተው የናሽናል ሊግ ፓርቲ ውስጥ ገብተው ተቃውሞ ውስጥ በቀጥታ መሳተፍ ጀመሩ፡፡ በአካባቢ ምርጫ ተወዳድረውም\
60
+ \ አሸነፉ፡፡\n\nበከፍተኛ ድምጽ የኦን ሳን ሱ ቺ በምርጫ ማሸነፍ ያስቆጣው ወታደራዊው መንግሥት ሴትዮዋን ለሚቀጥሉት 20\
61
+ \ ዓመታት በቁም እስር አስቀመጣቸው፡፡\n\nበ1991 ኦን ሳን ሱ ቺ በቁም እስር ላይ ሳሉ የኖቤል ሽልማትን አሸነፉ፡፡ ይህም\
62
+ \ ወታደራዊውን መንግሥት በይበልጥ አስቆጣ፡፡\n\nበ2010 ኦን ሳን ሱ ቺ ከቁም እስር ነጻ ተባሉ፡፡\n\nበ2012 አን ሳን\
63
+ \ ሱ ቺና ፓርቲያቸው በአካባቢ ምርጫ እንዲሳተፉ ወታደራዊው መንግሥት ፈቀደ፡፡\n\nበ2015 የብሔራዊ ሊግ ለዲሞክራሲ (NLD)\
64
+ \ ፓርቲያቸው ለመጀመርያ ጊዜ በተደረገ ከፍተኛ ፉክክር በታየበት ምርጫ አሸነፈ፡፡ \n\nአን ሳን ሱ ቺ በሚየንማር የሮሒንጋ\
65
+ \ ሙስሊሞች ላይ ወታደሩ ያደረሰውን ግፍና ጭፍጨፋ ለማውገዝ አለመፍቀዳቸው በዓለም አቀፍ የሰብአዊ መብት ተሟጋቾች ዘንድ ቁጣን\
66
+ \ ቀሰቀሰ፡፡ በመቶ ሺ የሚቆጠሩ የሮሒንጋ ሙስሊሞች ከሚየንማር ሞትን ሽሽት ወደ ባንግላዴሽ ተሰደዋል፡፡\n\nበዓለም አቀፉ\
67
+ \ ማኅበረሰብ ዘንድ ክብራቸው ዝቅ ይበል እንጂ አን ሳን ሱ ቺ በአገራቸው ቡድሀዎች ዘንድ እጅግ ተወዳጅ ናቸው፡፡\n\nአን\
68
+ \ ሳን ሱ ቺ በ2015 የተደረገውን ምርጫ አሸንፈው መንግሥት ቢመሠርቱም የአገሪቱ ፕሬዝዳንት መሆን... "
69
+ - text: አዲስ አበባ ፣ ነሃሴ 23 ፣ 2012 (ኤፍ ቢ ሲ) ኢትዮጵያ፣ ሱዳን እና ግብጽ በታላቁ የህዳሴ ግድብ አሞላል እና ውሃ
70
+ አለቃቀቅ ደንብ ላይ የሚያደርጉት የሶስትዮሽ ስብሰባ መስከረም ወር ላይ እንደሚቀጥል የውሃ መስኖና ኢነርጅ ሚኒስቴር አስታወቀ፡፡ሚኒስቴሩ
71
+ የሶስቱ ሃገራት የውሃ ጉዳይ ሚኒስትሮች በትናንትናው እለት ስብሰባ ማካሄዳቸውን አስታውቋል፡፡በስብሰባው ላይ የሂደቱ ታዛቢ የሆኑት
72
+ የደቡብ አፍሪካ፣ የአውሮፓ ህብረት እና የአሜሪካ ተወካዮች እንዲሁም ከአፍሪካ ህብረት የተወከሉ ባለሙያዎች መሳተፋቸውንም ገልጿል፡፡በወቅቱም
73
+ ላላፈው አንድ ሳምንት በሃገራቱ ባለሙያዎች በታላቁ የህዳሴ ግድብ አሞላልና የውሃ አለቃቀቅ ደንብ ላይ ሲከናወን የነበረው የባለሙያዎች
74
+ ድርድር ሪፖርት መቅረቡንም ጠቅሷል፡፡በቀጣይ የሚኖረውን ሂደት በሚመለከትም ሃገራቱ የድርድሩን ሂደት የሚገልጽ ደብዳቤ ለደቡብ
75
+ አፈሪካዋ ዓለም አ���ፍ ግንኙነት እና ትብብር ሚኒስትር እና የአፍሪካ ህብረት አስፈጻሚ ምክር ቤት የወቅቱ ሊቀ መንበር ዶክተር
76
+ ናዴሊ ፓንዶል ለመላክ መስማማታቸውንም ነው የገለጸው፡፡በዚህም ሱዳን የምትሰጠው ማረጋገጫ እንደሚጠበቅ የገለጸው ሚኒስቴሩ የሶስትዮሽ
77
+ ስብሰባው መስከረም 4 ቀን 2013 ዓ.ም እንደሚቀጥል አስታውቋል፡፡
78
+ - text: በፕሪሚየር ሊጉ ኢትዮጵያ ቡና እና ወልቂጤ ከተማ አቻ ተለያዩ  
79
+ - text: ፕሪሚየር ሊግ ፡ ሲዳማ ከሜዳው ውጪ ጣፋጭ ድል ሲያስመዘግብ አርባምንጭ ከ ዳሽን ቢራ አቻ ተለያይተዋል
80
  model-index:
81
  - name: SPLADE-RoBERTa-Amharic-Medium
82
  results:
 
84
  type: sparse-information-retrieval
85
  name: Sparse Information Retrieval
86
  dataset:
87
+ name: Amharic Passage Retrieval Dataset V2
88
+ type: rasyosef/Amharic-Passage-Retrieval-Dataset-V2
89
  metrics:
90
  - type: dot_accuracy@1
91
  value: 0.6285881663737551
 
144
  - type: corpus_sparsity_ratio
145
  value: 0.9963146789694772
146
  name: Corpus Sparsity Ratio
 
 
147
  ---
148
 
149
  # SPLADE-Amharic-Medium
150
 
151
+ This is a [SPLADE Sparse Encoder](https://www.sbert.net/docs/sparse_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It maps sentences & paragraphs to a 32000-dimensional sparse vector space and can be used for semantic search and sparse retrieval.
152
+
153
+ The model was presented in the paper [The Multilingual Curse at the Retrieval Layer: Evidence from Amharic](https://huggingface.co/papers/2605.24556).
154
+
155
  ## Model Details
156
 
157
  ### Model Description
158
  - **Model Type:** SPLADE Sparse Encoder
159
+ - **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic)
160
  - **Maximum Sequence Length:** 510 tokens
161
  - **Output Dimensionality:** 32000 dimensions
162
  - **Similarity Function:** Dot Product
 
163
  - **Language:** am
164
  - **License:** mit
165
 
166
  ### Model Sources
167
 
168
+ - **Repository:** [GitHub](https://github.com/rasyosef/amharic-neural-ir)
169
+ - **Paper:** [The Multilingual Curse at the Retrieval Layer: Evidence from Amharic](https://huggingface.co/papers/2605.24556)
170
  - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
171
  - **Documentation:** [Sparse Encoder Documentation](https://www.sbert.net/docs/sparse_encoder/usage/usage.html)
 
 
172
 
173
  ### Full Model Architecture
174
 
 
198
  # Run inference
199
  sentences = [
200
  'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
201
+ 'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል።',
202
+ 'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር።',
203
  ]
204
  embeddings = model.encode(sentences)
205
  print(embeddings.shape)
 
213
  # [ 0.0000, 2.4125, 69.0888]])
214
  ```
215
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
216
  ## Evaluation
217
 
218
  ### Metrics
 
243
  | corpus_active_dims | 117.9303 |
244
  | corpus_sparsity_ratio | 0.9963 |
245
 
 
 
 
 
 
 
 
 
 
 
 
 
246
  ## Training Details
247
 
 
 
248
  ### Training Dataset
249
 
250
+ #### Amharic Passage Retrieval Dataset V2
251
 
252
  * Size: 245,876 training samples
253
  * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
 
 
 
 
 
 
 
 
 
 
 
254
  * Loss: [<code>SpladeLoss</code>](https://sbert.net/docs/package_reference/sparse_encoder/losses.html#spladeloss) with these parameters:
255
  ```json
256
  {
 
274
  - `optim`: adamw_torch_fused
275
  - `batch_sampler`: no_duplicates
276
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
277
  ## Citation
278
 
279
+ ```bibtex
280
+ @inproceedings{alemneh2026amharicir,
281
+ title = {The Multilingual Curse at the Retrieval Layer: Evidence from Amharic},
282
+ author = {Alemneh, Yosef Worku and Mekonnen, Kidist Amde and de Rijke, Maarten},
283
+ booktitle = {Proceedings of the 1st Workshop on Multilinguality in the Era of Large Language Models (MeLLM), ACL 2026},
284
+ year = {2026},
285
+ }
286
+ ```