rasyosef commited on
Commit
d70de50
·
verified ·
1 Parent(s): cd4456c

Add new CrossEncoder model

Browse files
Files changed (4) hide show
  1. README.md +382 -27
  2. config.json +5 -2
  3. model.safetensors +1 -1
  4. tokenizer_config.json +1 -1
README.md CHANGED
@@ -1,44 +1,399 @@
1
  ---
2
- library_name: transformers
3
- tags:
4
- - cross-encoder
5
- - sentence-transformers
6
  language:
7
  - am
8
- base_model:
9
- - rasyosef/roberta-medium-amharic
 
 
 
 
 
 
10
  pipeline_tag: text-ranking
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
11
  ---
12
 
13
- # Cross-Encoder: roberta-amharic-reranker-medium
14
 
15
- The model can be used for Information Retrieval: Given a query, encode the query with all possible passages (e.g. retrieved with BM25 and/or an Embedding Model). Then sort the passages in a decreasing order of scores.
16
 
17
- # How to Use
18
- First, You need to have [sentence-transformers](https://www.sbert.net/) installed.
19
 
20
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
21
  pip install -U sentence-transformers
22
  ```
23
 
 
24
  ```python
25
- from sentence_transformers.cross_encoder import CrossEncoder
26
 
 
27
  model = CrossEncoder("rasyosef/roberta-amharic-reranker-medium")
28
- scores = model.predict([
29
- # [Query, Passage]
30
- ["ለንደንዩክሬደጋፊገራት መሪባኤ", "ጀን አገር ዮጵያዉያጥር ከአፍሪቃ አንደእነ ካሜሩን ከነኬንያን ሁሉ ይበል። በማኅበር የመደራጀታችን ዋናዉ ዓላማኢት-ጀርመንን ኙነ። ከ 10 ሺህ ዮጵያዉያተማዎችን አገ ምረ ተመሰዋል። አልያም አዉሮጳ ወደ አሜሪካም የተሻገሩ"],
31
- ["ን የዩክሬደጋፊ ት መሪዎ ጉባኤ", "ቤላ ካሁ23 ሰዎች በኮሌራሞታቸውን የተናገሩአንድ የጤና ባለሙያ በሽታውን መከላከ የግል ተ ማድረጉን እና በ ና ድርጅት የህክጋፍቱን ብራርዋል፡፡ ከደቡሱዳአጎራባች አኮቦ ወረዳ ለመጀመ ጊዜ መከሰቱ ነገረnሽታውዎች የተጠቁት ዋንዋ በተባለ ወረዳ መሆኑ ጠቁመዋል፡፡"],
32
- ["በለንደንዩክሬደጋፊ አገራት ዎች ጉባኤ", "በደም ንያትህሙማን አስፈላጊዉን ክምት ተቸረናል ሲ የተገሩት የቆቦ ሆስፒታራ አስኪያጅ ቢኖሩምደም ረቱ ሀኪሞች አገልግእንዲቻላቸዉም ይላሉ። የወልድ ደም ባን አገልግት ስራ አስኪን ለአስቸኳህክሚሆለ20ት ብቻ የሚቆ ደም ነ ለን ይላሉ"],
33
- ["በለንደን ክሬን ደጋፊገራት መሪዎች ጉባኤ", "አሜ ምትሰጠው እርዳታ ማቆሟ በተለይ በአፍሪቃ ሃራትፍተኛ ግርታድንጋፈጥሯ ለሁለ ጊዜ ወደ የሥልጣን መን የመጡት የአሜሪካው ፕሬዝደንናል ትራምፕ ለዘጠና ቀናት እንዲቆምስነዋል። ትራምፕ እርዳታ አፍሪቃውያ አሳፏቸዋል ነው የሚሉት።"],
34
- ["ንደዩክሬንጋፊ አገራት መሪዎ ጉባኤ", "በለንደንብሪታኒ ጠ/ሚኒ ኬይስታርመር ስተናጋጅነት የተካሄደው ዋናዎቹን ደጋፊ ሮችሪዎጉባኤ ዩክሬንን በወታደራዊና ናናስ የለጠ ለመርዳትስማ ማብቃቱ ገልል። ይሮፓ ህብረት ውካናዳንና የኖርዌይ መሪዎች ብሎም የክን የው ጉዳይ ሚስት ጉባኤ ተመንግት ክስተ"]
35
- ])
36
-
37
- scores
 
 
 
 
 
 
 
 
 
 
 
 
 
 
38
  ```
39
 
40
- Output:
41
- ```python
42
- array([2.3529647e-02, 6.6976779e-04, 6.5838397e-02, 1.0549011e-02,
43
- 9.9940288e-01], dtype=float32)
44
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
 
 
 
 
2
  language:
3
  - am
4
+ license: mit
5
+ tags:
6
+ - sentence-transformers
7
+ - cross-encoder
8
+ - generated_from_trainer
9
+ - dataset_size:491752
10
+ - loss:BinaryCrossEntropyLoss
11
+ base_model: rasyosef/roberta-medium-amharic
12
  pipeline_tag: text-ranking
13
+ library_name: sentence-transformers
14
+ metrics:
15
+ - map
16
+ - mrr@10
17
+ - ndcg@10
18
+ model-index:
19
+ - name: roberta-amharic-reranker-medium
20
+ results:
21
+ - task:
22
+ type: cross-encoder-reranking
23
+ name: Cross Encoder Reranking
24
+ dataset:
25
+ name: amh passage retrieval dev
26
+ type: amh-passage-retrieval-dev
27
+ metrics:
28
+ - type: map
29
+ value: 0.8229611784570143
30
+ name: Map
31
+ - type: mrr@10
32
+ value: 0.8212619047619047
33
+ name: Mrr@10
34
+ - type: ndcg@10
35
+ value: 0.8550901244478379
36
+ name: Ndcg@10
37
+ - type: map
38
+ value: 0.8267625270131399
39
+ name: Map
40
+ - type: mrr@10
41
+ value: 0.8246759530314858
42
+ name: Mrr@10
43
+ - type: ndcg@10
44
+ value: 0.8578685327553554
45
+ name: Ndcg@10
46
  ---
47
 
48
+ # roberta-amharic-reranker-medium
49
 
50
+ This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
51
 
52
+ ## Model Details
 
53
 
54
+ ### Model Description
55
+ - **Model Type:** Cross Encoder
56
+ - **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) <!-- at revision 9d02d0281e64d6ca31bd06d322e14b0b7e60375b -->
57
+ - **Maximum Sequence Length:** 510 tokens
58
+ - **Number of Output Labels:** 1 label
59
+ <!-- - **Training Dataset:** Unknown -->
60
+ - **Language:** am
61
+ - **License:** mit
62
+
63
+ ### Model Sources
64
+
65
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
66
+ - **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
67
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
68
+ - **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)
69
+
70
+ ## Usage
71
+
72
+ ### Direct Usage (Sentence Transformers)
73
+
74
+ First install the Sentence Transformers library:
75
+
76
+ ```bash
77
  pip install -U sentence-transformers
78
  ```
79
 
80
+ Then you can load this model and run inference.
81
  ```python
82
+ from sentence_transformers import CrossEncoder
83
 
84
+ # Download from the 🤗 Hub
85
  model = CrossEncoder("rasyosef/roberta-amharic-reranker-medium")
86
+ # Get scores for pairs of texts
87
+ pairs = [
88
+ ['ባሌ፣ ቦረና እና ጉጂ ዞኖች ተከሰተውየበርሃንበጣ ከላከል ተጨማ አውሮፕላኖወደ ስፍራው ይሰማራሉ', 'አዲስ አበ ፣ ታህሳስ 27 ፣ 2012 ( ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስት በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስሩ በአካባቢው የሚቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገ በስፍራው ሃይል የማስፈእቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካለኛው ምስራቅ የጦር መርከቦችን እና ውሮፕላኖች እንምትልክ ገልጻ በርየሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተዘው የፈረጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገል።የካቲት ላይ ደግሞ ጦር ርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።አሁኑ የቶኪ እቅድ በካከለኛው ምስራቅ የባህር ክልል የሚቀሳቀሱ የጃፓመርከቦች ከጥቃለመላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ው ተብሏልአቤ በንግግራቸው በመካለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አስፈላጊ ውጥረትን እንዲያስወግዱ ጥአቅርዋል።አሜሪካ ባለፈው ዓብ የኢራብሄራዊ ብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከደለች በኋላ በመካከለኛው ስራቅ ውጥ ነግሷል።ኢራን ሜሪካ እር ከባድ ፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራፕም አሜሪካ ከፋ እርምጃ እንደምትወስድ ስጠንቅቀዋልምንጭ፦ ሬውተርስ'],
89
+ ['ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የባብ ባህሉ መቀነሱን የጅባራ ከተማ ነዋሪዎቸ ተናሩ፡፡', 'ባሕር ዳር፡ ግንቦ21/2012 ዓ.ም (አብድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ ሚያወቁትን እያሳወቁ ነው፡፡ማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እ ሥነ ተግባቦትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልቀዬው ከተመለሰ ጊዜ ጀምሮ ተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለ��ብረተሰቡ እያስገነዘ፡፡ የግዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በገኘት ጓደኞቹ ጋር እንደሚሠሩም ተናግሯ፡፡ ከግዛቤ ፈጠራ ጎን ለጎን ደግሞ ዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአባባቡ እየተጠቀመ እንደሚገኝ ገጿል፡፡ሌላኛው ያነጋገርነው ማሪ አብርሃገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማያ (ሞታርቦ) ተጠቅመው ያስተላለፉ እንደሆነ ተግሯል፡፡ ተማሪዎቹ ሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥራ ወረዳ አስተዳደሩ፣ አማተር የኪነ ጥበብ ባሙያዎች በጎ አራጎማኅበራት እገዛ እንደሚያደርጉላቸውም ገልጿል፡፡በተለያዩ አካባቢዎች ሚኖሩ ሌሎች ተማሪዎችሚያ ራሳቸውን መጠበቅ ረተሰቡ ሱን እንዲጠብቅ አአያ በመሆን የግንዛቤ ፈጠራ ሥራ መሥራት እንዳለባቸውም አሳስበዋል፡፡ በተለይም ለሕዝደኅነት ል የሚተላለፉ የጥንቃቄ መልእክቶእንዲተገበሩ የዩነቨርሲቲ ተማሪዎች ያላቸው ሚና የጎላ በመሆኑ ይህንን ሚናቸውን እንዲጫወቱ ጥሪ ቅርበዋል፡፡የበረኸት ወረዳ ዋና አስተዳዳይደሰቱ ክፈተው የዩኒቨርሲቲ ተማሪዎቹ የ ፈቃድ አገልግሎት ለኅረተሰቡ ስለወረርሽኙ የሚጠው ግንዛቤ የተሻለ እንዲሆን እያገዘ እንደሆነ ተናግረዋል፡፡ ወረዳ አስተዳደሩም ለተማሪዎች ልፋመሳካት ጥረት እያደረገ መሆኑን ገልፀል፡፡ እ አስተዳዳሪው ከጎ ፈቃደኞቹ ር ባሻገር ወረርሽኙን መከላከል በአፋር እና በኦሮሚያ ክልሎች የሚገቡ ሰዎችን የሰውነት ሙቀት ልኬታ ምርመራ ይደረጋል፡፡ በተለይም በወረዳ የልማት ፕሮጀክቶች እየተሠሩ በመሆናቸው እና አካባቢው ለኮሮና ቫይረስ ወረርሽኝ ተጋላጭ በመሆቅድ መከላከሉ ሥራ ላይ እንደሚረባረቡ ና አስተዳዳሪው አስታውቀዋል፡፡'],
90
+ ['አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት', '\u200b79′ አዲስ ግደይተጠናቀቀ!ጨዋታው ሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያን የበላይነት ሲያከብር ዘድሮ በሜዳው ያለውን 100% ኮርድም አስጠብቋል፡፡ተጨማሪቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግበቀለ አዲስ ግደይ ላይ በሰራው \xa0ቢጫ ካርድ ተመልቷል፡፡ በሁኔታውም አለም ብርሃኑ ስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልቷል፡፡84′ ዳግበቀ ከማዕዘን የተሻማውን ኳ በግንባሩ ገጭቶ ለጥቂወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የጫዋ ለውጥ – ሲዳማ ቡና81′ በከት አዲሱ ወጥቶ ሙጃይድ \xa0መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ\xa0አጋው ባደግ ወጥቶ አብዱሰመድ አሊ ገብቷል፡፡ጎልልል!!! ዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተረለትን ኳስ በግንባ ገጭቶ ወደ ግብነበመቀ ሲዳማን መሪ አድርጓ፡፡77′ በዛብህ መለዮ ከርቀት በግእግሩ መሬት ለመሬት ክርሮ የመታው ኳለጥቂት ወጣ፡፡\nተጫዋች ለው– ወላይታ ድቻ\xa071′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡\nየተጫዋለውጥ – ሲዳማ ቡና71′ ንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ብቷ፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃላይ ይገኛል፡፡63′ ከግራ መስመር ወ ማዜ ያሻማውን ኳስ ግደ�� በግንባሩ ገጭቶ ግቡን አግዳሚ ታኮ ጥቷ፡፡የተጫዋች ለውጥ – ወላይታ \xa060′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ደግ ከግራ መስመር ያሻገረውኳስ በዛብህ መለዮ አገባው ሲባቡ አናሰደደው፡፡ የሚያቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ\n46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙንዳ ገብቷል፡፡\nተጀመረ!\nሁለተኛው ጋማሽ የጨዋታ ክፍለ ጊዜ ተጀምሯል፡፡\nእረፍት\nየጨዋታው የመጀመርያ አጋማሽ ያለ ግብ ተጠናቋል፡፡ተጨማሪ ደቂቃ – 1 ደቂቃ33′ ቴዎድሮስ መገሻ ከአላዛር ፋሲካ በግሩም ሁኔታ የተሻገረትን ግልፅ የጎል ጋጣሚ አመከነ፡፡ቢጫ ካርድ\n26′ አዲ ግደሆን ብሎ ፍፁቅጣት ምት ክልል ውስጥ ወድቋል ተ ቢጫ ካርድ ተመልክቷል:: አበበ ጥላሁንም ዳኛውሳኔ በመቃወም ቢጫ ካርድተመልክቷል፡፡19′ ጨዋታው የመጀመሪያ አምስት ደቂቃ ከነበረው ፍጥነት ዝቀዝ ያለ ተመጣጣኝ የታከለበእንቅስቃሴ \xa0እየተመለከትን ነው፡፡\n5′ በፈጣን እንቅስቃሴ ሲዳማ ቡና በተደጋጋሚ ወደ ጎል በመቅረ ተጭኖ ለመጫወት ጥረት እያደረገ ነው፡፡ተጀመረ!\nጨዋታው በወላይታ ድአማካኝነት ተጀመረ09:55 ታላቁን ደቡብ ደርቢ እንደ ወትሮ ሁሉ ለመከታተል በሺህ የሚቆጠር የስፖርት ቤተሰብ በስታድየሙ ታድሟል፡፡09:50 ሁለቱም ቡድኖች ልምምዳቸውን አጠናቀው ወ መልበሻ ክፍል አርተዋልየሲዳማ ቡና አሰላለፍ24 ለአለም ብርሃኑ12 ግሩም አሰፋ – 4 አንተ ተስፋዬ – 21 አበበ ጥላሁን – 22 ወሰኑ ማዜ8 ትርታዬ ደመቀ – 20 ሙሉአም መስፍ– 5 ፍፁም ተፈሪ – 32 ሰንደ ሙቱኩ – 14 አዲስ ግደይ9 በረከት አዲሱ\xa0ተጠባባቂዎች1 ፍቅሩ ወዴሳ25 ክፍሌ ኪአ23 ሙጃኢድ መሀመድ19 አዲስ አለም ደበበ11 ጸጋዬ ባልቻ27 ኪ ሰኒ13 ኤሪክ ሙራንዳወላይታ ድቻ1 ወንድወሰን ገረመው6 ተክ ታፈሰ – 27 ሙባረክ ሽኩር – 3 ፈቱዲን ጀማል9 ያሬድ ዳዊት – 8 አማኑኤል ተሾመ – 17 በዛብህ መለዮ – 29 ወንድማገኝ በለጠ – 7 አናጋው ባደግ19 አላዘር ፋሲካ – 16 ቴዎድሮስ መንገሻተጠባባቂዎች12 ወንድወሰን አሸናፊ\xa03 ቶማስ ስምረቱ\xa05 ዳግም ንጉሴ\xa020 አብዱልሰመድ አሊ21 መሳይ አጪሶ23 ጸጋዬ በርሃኑ\xa013 ዳግም በቀለ'],
91
+ ['አስዩት', 'አስ (የግብጽረብኛ፦ أسيوط /ኣስዩጥ/፤ ጥንታዊ ግብጽኛ፦ /ዛውቲ/፤ ጥንታዊ ግክኛ፦ Λυκόπολις /ሊኮፖሊስ/)ንታ ግብጽ ከተር። ዘመናዊው ከ በአ ሲሆን 6 ሚሊዮን በላይ ነዋሪዎች አሉት። \n\nበሄራክሌውፖሊስቤስ መካከደረገው ብሔራዊ ጦርነት (2107-2081 ዓክል. ግድም) የአሥዩገዦች ተፊቢ እ ቀቲ ለሄራክሌፖሊስ ዖን መሪካሬ ማኝ ሆነው በጤቤስ ግዛላይ እን ዘመቱ ይታል። በመጨረሻ ግን የጠቤስ ፈርዖ2 መቱሆተፕ አሸ \n\nግብፅ ከተሞች\nየቀድሞ ከተሞች'],
92
+ ['ባርክሌስ ባንክ ሠራተኞቹ ምን ያህል ሰዓት ወንራቸው ላይ እንደተቀመጡሚያሰላ የስለላ መረብ ዘርግቶ ነበር። ይህ መረጃ ይፋ ሲረግ ወቀሳ የበዛበባርክሌስ ሠራተኞቹን ሰለል ቢያቆምም፤ ድርጊቱ አለቆች ተቀጣሪዎቻቸው ላይ መሰል አለባቸው?ሚል ጥ አጭሯል።', 'ሜጀከዚህ ወ ቀደም ብሎ በዋይት ሐውስ ሰው በንከሱ የተነሳ ለስልጠና ወደ ዴልዌተልኮ የነበረ ቢሆንም በተመለሰ ማግት ሌላ ሠራኛ መንከሱ ተግሯል።\n\nየቀዳማይእምቤት ጂል ባየደን ቃል አቀባይ "ተገቢ ጥንቃቄ ለማድረግ ሲባል" የተነከሰው ግለሰብ ወደ ሥራ ከመመለሱ በፊት በይት ሐውስ ምና ቡደክትትል እየተረገለት እንደሆነ ልጸዋል።\n\nሜጀር ጆ ባይደን ካሏቸው ሁለት የጀርን ዝርያ ካላቸው ውሾመካከል በእድሜ ትሹ ሲሆወደ ዋይት ሐውስ የገባ የመጀ��ሪያው ማደጎ የተሰደ ውሻ ነው ተብሏል።\n\nባይደን "በጣም ተወዳጅ ውሻ ነው" ሲሉ ያንቆለጳጵሱል።\n\nየጂል ባይ ቃል አቀባ ሚሼል ላሮሳ ሰኞ እለት ክተቱተፈጠረው ሜጀር ከአዲሱ አካባቢ ጋር ራሱን ማላመድ እየጣረ ባለበት ወቅት በአገቡ የሚያልፍን ግሰብ በንከሱ ነው ብላለች።\n\nሲኤንኤን ውሻው የብሔራዊ ፓ ሠራኛ የሆነ ግለሰብ መንከሱንና በዚህየተነሳ ግለሰቡ ሕክምና ለመከታተል ሥራ ቆሙን ዘግቧል።\n\nየሔራዊ ፓርክ አገልግሎት መስሪያ ቤቱ ለሲኤን ኤን ጥያቄ ምላሽ አሰጠም\n\nበመጋቢት ወር የጆ ባደን ሁለቱ ውሾች ሜጀርና ቻምፕ ሠራተኞችን መንሳቸ ተከ ዊልሚንግተን ዴልዌር ወደሚገኘው የባይደን ቤተሰቦች ቤት ተወስደው ነበር።\n\nስሙ እንይጠቀስ የጠየቀ ግለሰብ ለሲኤኤን እንደገለፀው ሜጀር የዋይት ሐውስ ሠራተኞችንና የደኅንነት ሰዎችን በሚያይበት ወቅት ይጮሃል ይዘላል።\n\nፕሬዝዳንት ባይደን ሜጀር በርካታ ሰው በዙሪያው ከመሩ ጋየተፈጠረበትን ስሜት እየተላደ ነው ሲሉ ተናግረዋል።\n\nለኤቢሲ ጉድ ሞርኒንግ አሜ ፕሮግራላይ በአቅጣጫው በዞረ ቁጥር የማያቃቸው ሰዎች ሲንቀሳቀሱ ሲያለመከላከል ሲል እንደጮህ አረድተዋል።\n\n"በዋይሐውስ ያሉ 85 በመቶ ሠራኞች ይወዱታል። እርሱም ጭውን እያወዛወዘ ይልሳቸዋል። ገር ግን እንደረዳሁት አንዳንድ ሰዎች በተፈጥሯቸው ውሾች ይፈራሉ" ብለዋል።\n\nባይደን የሚያሳድጉት ሜጀር ሦስት ዓቱ ሲሆ ቻምፕ ን ፕሬዝዳንባይደን የኦባማ ምክት ሳሉ አብሯቸው በቤመመንግሥውስጥ በር ተብሏል\n\n '],
93
+ ]
94
+ scores = model.predict(pairs)
95
+ print(scores.shape)
96
+ # (5,)
97
+
98
+ # Or rank different texts based on similarity to a single text
99
+ ranks = model.rank(
100
+ 'በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ',
101
+ [
102
+ 'አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ',
103
+ 'ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡��ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥራ ወረዳ አስተዳደሩ፣ አማተር የኪነ ጥበብ ባለሙያዎች እና በጎ አድራጎት ማኅበራት እገዛ እንደሚያደርጉላቸውም ገልጿል፡፡በተለያዩ አካባቢዎች የሚኖሩ ሌሎች ተማሪዎችም ቅድሚያ ራሳቸውን መጠበቅ ኅብረተሰቡ ራሱን እንዲጠብቅ አርአያ በመሆን የግንዛቤ ፈጠራ ሥራ መሥራት እንዳለባቸውም አሳስበዋል፡፡ በተለይም ለሕዝብ ደኅንነት ሲባል የሚተላለፉ የጥንቃቄ መልእክቶች እንዲተገበሩ የዩነቨርሲቲ ተማሪዎች ያላቸው ሚና የጎላ በመሆኑ ይህንን ሚናቸውን እንዲጫወቱ ጥሪ አቅርበዋል፡፡የበረኸት ወረዳ ዋና አስተዳዳሪ ይደሰቱ ክፈተው የዩኒቨርሲቲ ተማሪዎቹ የበጎ ፈቃድ አገልግሎት ለኅብረተሰቡ ስለወረርሽኙ የሚሰጠው ግንዛቤ የተሻለ እንዲሆን እያገዘ እንደሆነ ተናግረዋል፡፡ ወረዳ አስተዳደሩም ለተማሪዎች ልፋት መሳካት ጥረት እያደረገ መሆኑን ገልፀዋል፡፡ እንደ ዋና አስተዳዳሪው ከበጎ ፈቃደኞቹ ተግባር ባሻገር ወረርሽኙን ለመከላከል በአፋር እና በኦሮሚያ ክልሎች የሚገቡ ሰዎችን የሰውነት ሙቀት ልኬታ ምርመራ ይደረጋል፡፡ በተለይም በወረዳው የልማት ፕሮጀክቶች እየተሠሩ በመሆናቸው እና አካባቢው ለኮሮና ቫይረስ ወረርሽኝ ተጋላጭ በመሆኑ ቅድመ መከላከሉ ሥራ ላይ እንደሚረባረቡ ዋና አስተዳዳሪው አስታውቀዋል፡፡',
104
+ '\u200b79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው \xa0ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ \xa0መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ\xa0አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭ��� ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡\nየተጫዋች ለውጥ – ወላይታ ድቻ\xa071′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡\nየተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ \xa060′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ\n46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡\nተጀመረ!\nሁለተኛው አጋማሽ የጨዋታ ክፍለ ጊዜ ተጀምሯል፡፡\nእረፍት\nየጨዋታው የመጀመርያ አጋማሽ ያለ ግብ ተጠናቋል፡፡ተጨማሪ ደቂቃ – 1 ደቂቃ33′ ቴዎድሮስ መንገሻ ከአላዛር ፋሲካ በግሩም ሁኔታ የተሻገረለትን ግልፅ የጎል አጋጣሚ አመከነ፡፡ቢጫ ካርድ\n26′ አዲስ ግደይ ሆን ብሎ ፍፁም ቅጣት ምት ክልል ውስጥ ወድቋል ተብሎ ቢጫ ካርድ ተመልክቷል:: አበበ ጥላሁንም የዳኛን ውሳኔ በመቃወም ቢጫ ካርድተመልክቷል፡፡19′ ጨዋታው የመጀመሪያ አምስት ደቂቃ ከነበረው ፍጥነት ቀዝቀዝ ያለ ተመጣጣኝ የታከለበት እንቅስቃሴ \xa0እየተመለከትን ነው፡፡\n5′ በፈጣን እንቅስቃሴ ሲዳማ ቡና በተደጋጋሚ ወደ ጎል በመቅረብ ተጭኖ ለመጫወት ጥረት እያደረገ ነው፡፡ተጀመረ!\nጨዋታው በወላይታ ድቻ አማካኝነት ተጀመረ09:55 ታላቁን የደቡብ ደርቢ እንደ ወትሮ ሁሉ ለመከታተል በሺህ የሚቆጠር የስፖርት ቤተሰብ በስታድየሙ ታድሟል፡፡09:50 ሁለቱም ቡድኖች ልምምዳቸውን አጠናቀው ወደ መልበሻ ክፍል አምርተዋልየሲዳማ ቡና አሰላለፍ24 ለአለም ብርሃኑ12 ግሩም አሰፋ – 4 አንተነህ ተስፋዬ – 21 አበበ ጥላሁን – 22 ወሰኑ ማዜ8 ትርታዬ ደመቀ – 20 ሙሉአለም መስፍን – 5 ፍፁም ተፈሪ – 32 ሰንደይ ሙቱኩ – 14 አዲስ ግደይ9 በረከት አዲሱ\xa0ተጠባባቂዎች1 ፍቅሩ ወዴሳ25 ክፍሌ ኪአ23 ሙጃኢድ መሀመድ19 አዲስ አለም ደበበ11 ጸጋዬ ባልቻ27 ላኪ ሰኒ13 ኤሪክ ሙራንዳወላይታ ድቻ1 ወንድወሰን ገረመው6 ተክሉ ታፈሰ – 27 ሙባረክ ሽኩር – 3 ፈቱዲን ጀማል9 ያሬድ ዳዊት – 8 አማኑኤል ተሾመ – 17 በዛብህ መለዮ – 29 ወንድማገኝ በለጠ – 7 አናጋው ባደግ19 አላዘር ፋሲካ – 16 ቴዎድሮስ መንገሻተጠባባቂዎች12 ወንድወሰን አሸናፊ\xa03 ቶማስ ስምረቱ\xa05 ዳግም ንጉሴ\xa020 አብዱልሰመድ አሊ21 መሳይ አጪሶ23 ጸጋዬ በርሃኑ\xa013 ዳግም በቀለ',
105
+ 'አስዩት (የግብጽ አረብኛ፦ أسيوط /ኣስዩጥ/፤ ጥንታዊ ግብጽኛ፦ /ዛውቲ/፤ ጥንታዊ ግሪክኛ፦ Λυκόπολις /ሊውኮፖሊስ/) የጥንታዊ ግብጽ ከተማ ነበር። ዘመናዊው ከተማ በአጠገቡ ሲሆን ከ6 ሚሊዮን በላይ ነዋሪዎች አሉት። \n\nበሄራክሌውፖሊስና በጤቤስ መካከል በተደረገው ብሔራዊ ጦርነት (2107-2081 ዓክልበ. ግድም) የአሥዩት ገዦች ተፊቢ እና ልጁ ቀቲ ለሄራክሌውፖሊስ ፈርዖን መሪካሬ ታማኝ ሆነው በጤቤስ ግዛት ላይ እንደ ዘመቱ ይታወቃል። በመጨረሻ ግን የጠቤስ ፈርዖን 2 መንቱሆተፕ አሸነፈው። \n\nየግብፅ ከተሞች\nየቀድሞ ከተሞች',
106
+ 'ሜጀር ከዚህ ወር ቀደም ብሎ በዋይት ሐውስ ሰው በመንከሱ የተነሳ ለስልጠና ወደ ዴልዌር ተልኮ የነበረ ቢሆንም በተመለሰ ማግስት ሌላ ሠራተኛ መንከሱ ተነግሯል።\n\nየቀዳማይት እምቤት ጂል ባየደን ቃል አቀባይ "ተገቢውን ጥንቃቄ ለማድረግ ሲባል" የተነከሰው ግለሰብ ወደ ሥራ ከመመለሱ በፊት በዋይት ሐውስ የሕክምና ቡደን ክትትል እየተደረገለት እንደሆነ ገልጸዋል።\n\nሜጀር ጆ ባይደን ካሏቸው ሁለት የጀርመን ዝርያ ካላቸው ውሾች መካከል በእድሜ ትንሹ ሲሆን ወደ ዋይት ሐውስ የገባ የመጀመሪያው በማደጎ የተወሰደ ውሻ ነው ተብሏል።\n\nባይደን "በጣም ተወዳጅ ውሻ ነው" ሲሉ ያንቆለጳጵሱታል።\n\nየጂል ባይደን ቃል አቀባይ ሚሼል ላሮሳ ሰኞ እለት ክስተቱ የተፈጠረው ሜጀር ከአዲሱ አካባቢ ጋር ራሱን ለማላመድ እየጣረ ባለበት ወቅት በአጠገቡ የሚያልፍን ግለሰብ በመንከሱ ነው ብላለች።\n\nሲኤንኤን ውሻው የብሔራዊ ፓርክ ሠራተኛ የሆነ ግለሰብ መንከሱንና በዚህም የተነሳ ግለሰቡ ሕክምና ለመከታተል ሥራ ማቆሙን ዘግቧል።\n\nየብሔራዊ ፓርክ አገልግሎት መስሪያ ቤቱ ለሲኤን ኤን ጥያቄ ምላሽ አልሰጠም።\n\nበመጋቢት ወር የጆ ባይደን ሁለቱ ውሾች ሜጀርና ቻምፕ ሠራተኞችን መንከሳቸውን ተከትሎ ዊልሚንግተን ዴልዌር ወደሚገኘው የባይደን ቤተሰቦች ቤት ተወስደው ነበር።\n\nስሙ እንዳይጠቀስ የጠየቀ ግለሰብ ለሲኤንኤን እንደገለፀው ሜጀር የዋይት ሐውስ ሠራተኞችንና የደኅንነት ሰዎችን በሚያይበት ወቅት ይጮሃል ይዘላል።\n\nፕሬዝዳንት ባይደን ሜጀር በርካታ ሰው በዙሪያው ከመኖሩ ጋር የተፈጠረበትን ስሜት እየተላመደ ነው ሲሉ ተናግረዋል።\n\nለኤቢሲ ጉድ ሞርኒንግ አሜሪካ ፕሮግራም ላይ በየአቅጣጫው በዞረ ቁጥር የማያውቃቸው ሰዎች ሲንቀሳቀሱ ሲያይ ለመከላከል ሲል እንደሚጮህ አስረድተዋል።\n\n"በዋይት ሐውስ ያሉ 85 በመቶ ሠራተኞች ይወዱታል። እርሱም ጭራውን እያወዛወዘ ይልሳቸዋል። ነገር ግን እንደተረዳሁት አንዳንድ ሰዎች በተፈጥሯቸው ውሾች ይፈራሉ" ብለዋል።\n\nባይደን የሚያሳድጉት ሜጀር ሦስት ዓመቱ ሲሆን ቻምፕ ግን ፕሬዝዳንት ባይደን የኦባማ ምክትል ሳሉ አብሯቸው በቤተመመንግሥት ውስጥ ነበር ተብሏል።\n\n ',
107
+ ]
108
+ )
109
+ # [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
110
  ```
111
 
112
+ <!--
113
+ ### Direct Usage (Transformers)
114
+
115
+ <details><summary>Click to see the direct usage in Transformers</summary>
116
+
117
+ </details>
118
+ -->
119
+
120
+ <!--
121
+ ### Downstream Usage (Sentence Transformers)
122
+
123
+ You can finetune this model on your own dataset.
124
+
125
+ <details><summary>Click to expand</summary>
126
+
127
+ </details>
128
+ -->
129
+
130
+ <!--
131
+ ### Out-of-Scope Use
132
+
133
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
134
+ -->
135
+
136
+ ## Evaluation
137
+
138
+ ### Metrics
139
+
140
+ #### Cross Encoder Reranking
141
+
142
+ * Dataset: `amh-passage-retrieval-dev`
143
+ * Evaluated with [<code>CrossEncoderRerankingEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderRerankingEvaluator) with these parameters:
144
+ ```json
145
+ {
146
+ "at_k": 10
147
+ }
148
+ ```
149
+
150
+ | Metric | Value |
151
+ |:------------|:-----------|
152
+ | map | 0.823 |
153
+ | mrr@10 | 0.8213 |
154
+ | **ndcg@10** | **0.8551** |
155
+
156
+ #### Cross Encoder Reranking
157
+
158
+ * Dataset: `amh-passage-retrieval-dev`
159
+ * Evaluated with [<code>CrossEncoderRerankingEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderRerankingEvaluator) with these parameters:
160
+ ```json
161
+ {
162
+ "at_k": 10
163
+ }
164
+ ```
165
+
166
+ | Metric | Value |
167
+ |:------------|:-----------|
168
+ | map | 0.8268 |
169
+ | mrr@10 | 0.8247 |
170
+ | **ndcg@10** | **0.8579** |
171
+
172
+ <!--
173
+ ## Bias, Risks and Limitations
174
+
175
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
176
+ -->
177
+
178
+ <!--
179
+ ### Recommendations
180
+
181
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
182
+ -->
183
+
184
+ ## Training Details
185
+
186
+ ### Training Dataset
187
+
188
+ #### Unnamed Dataset
189
+
190
+ * Size: 491,752 training samples
191
+ * Columns: <code>query</code>, <code>passage</code>, and <code>label</code>
192
+ * Approximate statistics based on the first 1000 samples:
193
+ | | query | passage | label |
194
+ |:--------|:-----------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:------------------------------------------------|
195
+ | type | string | string | int |
196
+ | details | <ul><li>min: 2 characters</li><li>mean: 49.94 characters</li><li>max: 283 characters</li></ul> | <ul><li>min: 126 characters</li><li>mean: 1418.88 characters</li><li>max: 8678 characters</li></ul> | <ul><li>0: ~87.40%</li><li>1: ~12.60%</li></ul> |
197
+ * Samples:
198
+ | query | passage | label |
199
+ |:------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
200
+ | <code>በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ</code> | <code>አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ</code> | <code>0</code> |
201
+ | <code>ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅበራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የንባብ ባህሉ መቀነሱን የእንጅባራ ከተማ ነዋሪዎቸ ተናገሩ፡፡</code> | <code>ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥ...</code> | <code>0</code> |
202
+ | <code>አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት</code> | <code>​79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው  ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ  መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭቶ ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡<br>የተጫዋች ለውጥ – ወላይታ ድቻ 71′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡<br>የተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ  60′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ<br>46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡<br>ተጀመረ!<br>ሁለተኛው አጋማሽ የጨዋታ...</code> | <code>0</code> |
203
+ * Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
204
+ ```json
205
+ {
206
+ "activation_fn": "torch.nn.modules.linear.Identity",
207
+ "pos_weight": 7
208
+ }
209
+ ```
210
+
211
+ ### Training Hyperparameters
212
+ #### Non-Default Hyperparameters
213
+
214
+ - `eval_strategy`: epoch
215
+ - `per_device_train_batch_size`: 64
216
+ - `per_device_eval_batch_size`: 64
217
+ - `learning_rate`: 4e-05
218
+ - `num_train_epochs`: 4
219
+ - `lr_scheduler_type`: cosine
220
+ - `warmup_ratio`: 0.05
221
+ - `fp16`: True
222
+ - `dataloader_num_workers`: 2
223
+ - `load_best_model_at_end`: True
224
+ - `batch_sampler`: no_duplicates
225
+
226
+ #### All Hyperparameters
227
+ <details><summary>Click to expand</summary>
228
+
229
+ - `overwrite_output_dir`: False
230
+ - `do_predict`: False
231
+ - `eval_strategy`: epoch
232
+ - `prediction_loss_only`: True
233
+ - `per_device_train_batch_size`: 64
234
+ - `per_device_eval_batch_size`: 64
235
+ - `per_gpu_train_batch_size`: None
236
+ - `per_gpu_eval_batch_size`: None
237
+ - `gradient_accumulation_steps`: 1
238
+ - `eval_accumulation_steps`: None
239
+ - `torch_empty_cache_steps`: None
240
+ - `learning_rate`: 4e-05
241
+ - `weight_decay`: 0.0
242
+ - `adam_beta1`: 0.9
243
+ - `adam_beta2`: 0.999
244
+ - `adam_epsilon`: 1e-08
245
+ - `max_grad_norm`: 1.0
246
+ - `num_train_epochs`: 4
247
+ - `max_steps`: -1
248
+ - `lr_scheduler_type`: cosine
249
+ - `lr_scheduler_kwargs`: {}
250
+ - `warmup_ratio`: 0.05
251
+ - `warmup_steps`: 0
252
+ - `log_level`: passive
253
+ - `log_level_replica`: warning
254
+ - `log_on_each_node`: True
255
+ - `logging_nan_inf_filter`: True
256
+ - `save_safetensors`: True
257
+ - `save_on_each_node`: False
258
+ - `save_only_model`: False
259
+ - `restore_callback_states_from_checkpoint`: False
260
+ - `no_cuda`: False
261
+ - `use_cpu`: False
262
+ - `use_mps_device`: False
263
+ - `seed`: 42
264
+ - `data_seed`: None
265
+ - `jit_mode_eval`: False
266
+ - `use_ipex`: False
267
+ - `bf16`: False
268
+ - `fp16`: True
269
+ - `fp16_opt_level`: O1
270
+ - `half_precision_backend`: auto
271
+ - `bf16_full_eval`: False
272
+ - `fp16_full_eval`: False
273
+ - `tf32`: None
274
+ - `local_rank`: 0
275
+ - `ddp_backend`: None
276
+ - `tpu_num_cores`: None
277
+ - `tpu_metrics_debug`: False
278
+ - `debug`: []
279
+ - `dataloader_drop_last`: False
280
+ - `dataloader_num_workers`: 2
281
+ - `dataloader_prefetch_factor`: None
282
+ - `past_index`: -1
283
+ - `disable_tqdm`: False
284
+ - `remove_unused_columns`: True
285
+ - `label_names`: None
286
+ - `load_best_model_at_end`: True
287
+ - `ignore_data_skip`: False
288
+ - `fsdp`: []
289
+ - `fsdp_min_num_params`: 0
290
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
291
+ - `fsdp_transformer_layer_cls_to_wrap`: None
292
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
293
+ - `deepspeed`: None
294
+ - `label_smoothing_factor`: 0.0
295
+ - `optim`: adamw_torch
296
+ - `optim_args`: None
297
+ - `adafactor`: False
298
+ - `group_by_length`: False
299
+ - `length_column_name`: length
300
+ - `ddp_find_unused_parameters`: None
301
+ - `ddp_bucket_cap_mb`: None
302
+ - `ddp_broadcast_buffers`: False
303
+ - `dataloader_pin_memory`: True
304
+ - `dataloader_persistent_workers`: False
305
+ - `skip_memory_metrics`: True
306
+ - `use_legacy_prediction_loop`: False
307
+ - `push_to_hub`: False
308
+ - `resume_from_checkpoint`: None
309
+ - `hub_model_id`: None
310
+ - `hub_strategy`: every_save
311
+ - `hub_private_repo`: None
312
+ - `hub_always_push`: False
313
+ - `gradient_checkpointing`: False
314
+ - `gradient_checkpointing_kwargs`: None
315
+ - `include_inputs_for_metrics`: False
316
+ - `include_for_metrics`: []
317
+ - `eval_do_concat_batches`: True
318
+ - `fp16_backend`: auto
319
+ - `push_to_hub_model_id`: None
320
+ - `push_to_hub_organization`: None
321
+ - `mp_parameters`:
322
+ - `auto_find_batch_size`: False
323
+ - `full_determinism`: False
324
+ - `torchdynamo`: None
325
+ - `ray_scope`: last
326
+ - `ddp_timeout`: 1800
327
+ - `torch_compile`: False
328
+ - `torch_compile_backend`: None
329
+ - `torch_compile_mode`: None
330
+ - `include_tokens_per_second`: False
331
+ - `include_num_input_tokens_seen`: False
332
+ - `neftune_noise_alpha`: None
333
+ - `optim_target_modules`: None
334
+ - `batch_eval_metrics`: False
335
+ - `eval_on_start`: False
336
+ - `use_liger_kernel`: False
337
+ - `eval_use_gather_object`: False
338
+ - `average_tokens_across_devices`: False
339
+ - `prompts`: None
340
+ - `batch_sampler`: no_duplicates
341
+ - `multi_dataset_batch_sampler`: proportional
342
+
343
+ </details>
344
+
345
+ ### Training Logs
346
+ | Epoch | Step | Training Loss | amh-passage-retrieval-dev_ndcg@10 |
347
+ |:-------:|:---------:|:-------------:|:---------------------------------:|
348
+ | -1 | -1 | - | 0.0898 |
349
+ | 1.0 | 7684 | 0.4048 | 0.8289 |
350
+ | 2.0 | 15368 | 0.2366 | 0.8546 |
351
+ | 3.0 | 23052 | 0.1588 | 0.8353 |
352
+ | **4.0** | **30736** | **0.1024** | **0.8551** |
353
+ | -1 | -1 | - | 0.8579 |
354
+
355
+ * The bold row denotes the saved checkpoint.
356
+
357
+ ### Framework Versions
358
+ - Python: 3.11.13
359
+ - Sentence Transformers: 4.1.0
360
+ - Transformers: 4.52.4
361
+ - PyTorch: 2.6.0+cu124
362
+ - Accelerate: 1.7.0
363
+ - Datasets: 3.6.0
364
+ - Tokenizers: 0.21.1
365
+
366
+ ## Citation
367
+
368
+ ### BibTeX
369
+
370
+ #### Sentence Transformers
371
+ ```bibtex
372
+ @inproceedings{reimers-2019-sentence-bert,
373
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
374
+ author = "Reimers, Nils and Gurevych, Iryna",
375
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
376
+ month = "11",
377
+ year = "2019",
378
+ publisher = "Association for Computational Linguistics",
379
+ url = "https://arxiv.org/abs/1908.10084",
380
+ }
381
+ ```
382
+
383
+ <!--
384
+ ## Glossary
385
+
386
+ *Clearly define terms in order to be accessible across audiences.*
387
+ -->
388
+
389
+ <!--
390
+ ## Model Card Authors
391
+
392
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
393
+ -->
394
+
395
+ <!--
396
+ ## Model Card Contact
397
+
398
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
399
+ -->
config.json CHANGED
@@ -1,5 +1,4 @@
1
  {
2
- "_name_or_path": "rasyosef/roberta-medium-amharic",
3
  "architectures": [
4
  "XLMRobertaForSequenceClassification"
5
  ],
@@ -26,8 +25,12 @@
26
  "output_past": true,
27
  "pad_token_id": 1,
28
  "position_embedding_type": "absolute",
 
 
 
 
29
  "torch_dtype": "float32",
30
- "transformers_version": "4.48.3",
31
  "type_vocab_size": 1,
32
  "use_cache": true,
33
  "vocab_size": 32000
 
1
  {
 
2
  "architectures": [
3
  "XLMRobertaForSequenceClassification"
4
  ],
 
25
  "output_past": true,
26
  "pad_token_id": 1,
27
  "position_embedding_type": "absolute",
28
+ "sentence_transformers": {
29
+ "activation_fn": "torch.nn.modules.activation.Sigmoid",
30
+ "version": "4.1.0"
31
+ },
32
  "torch_dtype": "float32",
33
+ "transformers_version": "4.52.4",
34
  "type_vocab_size": 1,
35
  "use_cache": true,
36
  "vocab_size": 32000
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:aa1dc4642e6b3258e5c49d8c5a175373dfffe0a8848e04b78ec53eb5b23342c5
3
  size 168535980
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b8b1294b5f9536b3b79df9e0150d59f1087dbbd285ce1e12f5c5c31999492800
3
  size 168535980
tokenizer_config.json CHANGED
@@ -52,7 +52,7 @@
52
  "pad_token": "<pad>",
53
  "sep_token": "</s>",
54
  "stride": 0,
55
- "tokenizer_class": "XLMRobertaTokenizer",
56
  "truncation_side": "right",
57
  "truncation_strategy": "longest_first",
58
  "unk_token": "<unk>"
 
52
  "pad_token": "<pad>",
53
  "sep_token": "</s>",
54
  "stride": 0,
55
+ "tokenizer_class": "XLMRobertaTokenizerFast",
56
  "truncation_side": "right",
57
  "truncation_strategy": "longest_first",
58
  "unk_token": "<unk>"