Text Ranking
sentence-transformers
Safetensors
Amharic
xlm-roberta
cross-encoder
Generated from Trainer
dataset_size:491752
loss:BinaryCrossEntropyLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use rasyosef/reranker-amharic-medium with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use rasyosef/reranker-amharic-medium with sentence-transformers:
from sentence_transformers import CrossEncoder model = CrossEncoder("rasyosef/reranker-amharic-medium") query = "Which planet is known as the Red Planet?" passages = [ "Venus is often called Earth's twin because of its similar size and proximity.", "Mars, known for its reddish appearance, is often referred to as the Red Planet.", "Jupiter, the largest planet in our solar system, has a prominent red spot.", "Saturn, famous for its rings, is sometimes mistaken for the Red Planet." ] scores = model.predict([(query, passage) for passage in passages]) print(scores) - Notebooks
- Google Colab
- Kaggle
Add new CrossEncoder model
Browse files- README.md +382 -27
- config.json +5 -2
- model.safetensors +1 -1
- tokenizer_config.json +1 -1
README.md
CHANGED
|
@@ -1,44 +1,399 @@
|
|
| 1 |
---
|
| 2 |
-
library_name: transformers
|
| 3 |
-
tags:
|
| 4 |
-
- cross-encoder
|
| 5 |
-
- sentence-transformers
|
| 6 |
language:
|
| 7 |
- am
|
| 8 |
-
|
| 9 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 10 |
pipeline_tag: text-ranking
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 11 |
---
|
| 12 |
|
| 13 |
-
#
|
| 14 |
|
| 15 |
-
|
| 16 |
|
| 17 |
-
#
|
| 18 |
-
First, You need to have [sentence-transformers](https://www.sbert.net/) installed.
|
| 19 |
|
| 20 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 21 |
pip install -U sentence-transformers
|
| 22 |
```
|
| 23 |
|
|
|
|
| 24 |
```python
|
| 25 |
-
from sentence_transformers
|
| 26 |
|
|
|
|
| 27 |
model = CrossEncoder("rasyosef/roberta-amharic-reranker-medium")
|
| 28 |
-
scores
|
| 29 |
-
|
| 30 |
-
[
|
| 31 |
-
[
|
| 32 |
-
[
|
| 33 |
-
[
|
| 34 |
-
[
|
| 35 |
-
|
| 36 |
-
|
| 37 |
-
scores
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 38 |
```
|
| 39 |
|
| 40 |
-
|
| 41 |
-
|
| 42 |
-
|
| 43 |
-
|
| 44 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
|
|
|
|
|
|
|
|
|
|
|
|
| 2 |
language:
|
| 3 |
- am
|
| 4 |
+
license: mit
|
| 5 |
+
tags:
|
| 6 |
+
- sentence-transformers
|
| 7 |
+
- cross-encoder
|
| 8 |
+
- generated_from_trainer
|
| 9 |
+
- dataset_size:491752
|
| 10 |
+
- loss:BinaryCrossEntropyLoss
|
| 11 |
+
base_model: rasyosef/roberta-medium-amharic
|
| 12 |
pipeline_tag: text-ranking
|
| 13 |
+
library_name: sentence-transformers
|
| 14 |
+
metrics:
|
| 15 |
+
- map
|
| 16 |
+
- mrr@10
|
| 17 |
+
- ndcg@10
|
| 18 |
+
model-index:
|
| 19 |
+
- name: roberta-amharic-reranker-medium
|
| 20 |
+
results:
|
| 21 |
+
- task:
|
| 22 |
+
type: cross-encoder-reranking
|
| 23 |
+
name: Cross Encoder Reranking
|
| 24 |
+
dataset:
|
| 25 |
+
name: amh passage retrieval dev
|
| 26 |
+
type: amh-passage-retrieval-dev
|
| 27 |
+
metrics:
|
| 28 |
+
- type: map
|
| 29 |
+
value: 0.8229611784570143
|
| 30 |
+
name: Map
|
| 31 |
+
- type: mrr@10
|
| 32 |
+
value: 0.8212619047619047
|
| 33 |
+
name: Mrr@10
|
| 34 |
+
- type: ndcg@10
|
| 35 |
+
value: 0.8550901244478379
|
| 36 |
+
name: Ndcg@10
|
| 37 |
+
- type: map
|
| 38 |
+
value: 0.8267625270131399
|
| 39 |
+
name: Map
|
| 40 |
+
- type: mrr@10
|
| 41 |
+
value: 0.8246759530314858
|
| 42 |
+
name: Mrr@10
|
| 43 |
+
- type: ndcg@10
|
| 44 |
+
value: 0.8578685327553554
|
| 45 |
+
name: Ndcg@10
|
| 46 |
---
|
| 47 |
|
| 48 |
+
# roberta-amharic-reranker-medium
|
| 49 |
|
| 50 |
+
This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
|
| 51 |
|
| 52 |
+
## Model Details
|
|
|
|
| 53 |
|
| 54 |
+
### Model Description
|
| 55 |
+
- **Model Type:** Cross Encoder
|
| 56 |
+
- **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) <!-- at revision 9d02d0281e64d6ca31bd06d322e14b0b7e60375b -->
|
| 57 |
+
- **Maximum Sequence Length:** 510 tokens
|
| 58 |
+
- **Number of Output Labels:** 1 label
|
| 59 |
+
<!-- - **Training Dataset:** Unknown -->
|
| 60 |
+
- **Language:** am
|
| 61 |
+
- **License:** mit
|
| 62 |
+
|
| 63 |
+
### Model Sources
|
| 64 |
+
|
| 65 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 66 |
+
- **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
|
| 67 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
| 68 |
+
- **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)
|
| 69 |
+
|
| 70 |
+
## Usage
|
| 71 |
+
|
| 72 |
+
### Direct Usage (Sentence Transformers)
|
| 73 |
+
|
| 74 |
+
First install the Sentence Transformers library:
|
| 75 |
+
|
| 76 |
+
```bash
|
| 77 |
pip install -U sentence-transformers
|
| 78 |
```
|
| 79 |
|
| 80 |
+
Then you can load this model and run inference.
|
| 81 |
```python
|
| 82 |
+
from sentence_transformers import CrossEncoder
|
| 83 |
|
| 84 |
+
# Download from the 🤗 Hub
|
| 85 |
model = CrossEncoder("rasyosef/roberta-amharic-reranker-medium")
|
| 86 |
+
# Get scores for pairs of texts
|
| 87 |
+
pairs = [
|
| 88 |
+
['በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ', 'አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ'],
|
| 89 |
+
['ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅበራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የንባብ ባህሉ መቀነሱን የእንጅባራ ከተማ ነዋሪዎቸ ተናገሩ፡፡', 'ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለ��ብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥራ ወረዳ አስተዳደሩ፣ አማተር የኪነ ጥበብ ባለሙያዎች እና በጎ አድራጎት ማኅበራት እገዛ እንደሚያደርጉላቸውም ገልጿል፡፡በተለያዩ አካባቢዎች የሚኖሩ ሌሎች ተማሪዎችም ቅድሚያ ራሳቸውን መጠበቅ ኅብረተሰቡ ራሱን እንዲጠብቅ አርአያ በመሆን የግንዛቤ ፈጠራ ሥራ መሥራት እንዳለባቸውም አሳስበዋል፡፡ በተለይም ለሕዝብ ደኅንነት ሲባል የሚተላለፉ የጥንቃቄ መልእክቶች እንዲተገበሩ የዩነቨርሲቲ ተማሪዎች ያላቸው ሚና የጎላ በመሆኑ ይህንን ሚናቸውን እንዲጫወቱ ጥሪ አቅርበዋል፡፡የበረኸት ወረዳ ዋና አስተዳዳሪ ይደሰቱ ክፈተው የዩኒቨርሲቲ ተማሪዎቹ የበጎ ፈቃድ አገልግሎት ለኅብረተሰቡ ስለወረርሽኙ የሚሰጠው ግንዛቤ የተሻለ እንዲሆን እያገዘ እንደሆነ ተናግረዋል፡፡ ወረዳ አስተዳደሩም ለተማሪዎች ልፋት መሳካት ጥረት እያደረገ መሆኑን ገልፀዋል፡፡ እንደ ዋና አስተዳዳሪው ከበጎ ፈቃደኞቹ ተግባር ባሻገር ወረርሽኙን ለመከላከል በአፋር እና በኦሮሚያ ክልሎች የሚገቡ ሰዎችን የሰውነት ሙቀት ልኬታ ምርመራ ይደረጋል፡፡ በተለይም በወረዳው የልማት ፕሮጀክቶች እየተሠሩ በመሆናቸው እና አካባቢው ለኮሮና ቫይረስ ወረርሽኝ ተጋላጭ በመሆኑ ቅድመ መከላከሉ ሥራ ላይ እንደሚረባረቡ ዋና አስተዳዳሪው አስታውቀዋል፡፡'],
|
| 90 |
+
['አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት', '\u200b79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው \xa0ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ \xa0መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ\xa0አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭቶ ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡\nየተጫዋች ለውጥ – ወላይታ ድቻ\xa071′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡\nየተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደ�� በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ \xa060′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ\n46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡\nተጀመረ!\nሁለተኛው አጋማሽ የጨዋታ ክፍለ ጊዜ ተጀምሯል፡፡\nእረፍት\nየጨዋታው የመጀመርያ አጋማሽ ያለ ግብ ተጠናቋል፡፡ተጨማሪ ደቂቃ – 1 ደቂቃ33′ ቴዎድሮስ መንገሻ ከአላዛር ፋሲካ በግሩም ሁኔታ የተሻገረለትን ግልፅ የጎል አጋጣሚ አመከነ፡፡ቢጫ ካርድ\n26′ አዲስ ግደይ ሆን ብሎ ፍፁም ቅጣት ምት ክልል ውስጥ ወድቋል ተብሎ ቢጫ ካርድ ተመልክቷል:: አበበ ጥላሁንም የዳኛን ውሳኔ በመቃወም ቢጫ ካርድተመልክቷል፡፡19′ ጨዋታው የመጀመሪያ አምስት ደቂቃ ከነበረው ፍጥነት ቀዝቀዝ ያለ ተመጣጣኝ የታከለበት እንቅስቃሴ \xa0እየተመለከትን ነው፡፡\n5′ በፈጣን እንቅስቃሴ ሲዳማ ቡና በተደጋጋሚ ወደ ጎል በመቅረብ ተጭኖ ለመጫወት ጥረት እያደረገ ነው፡፡ተጀመረ!\nጨዋታው በወላይታ ድቻ አማካኝነት ተጀመረ09:55 ታላቁን የደቡብ ደርቢ እንደ ወትሮ ሁሉ ለመከታተል በሺህ የሚቆጠር የስፖርት ቤተሰብ በስታድየሙ ታድሟል፡፡09:50 ሁለቱም ቡድኖች ልምምዳቸውን አጠናቀው ወደ መልበሻ ክፍል አምርተዋልየሲዳማ ቡና አሰላለፍ24 ለአለም ብርሃኑ12 ግሩም አሰፋ – 4 አንተነህ ተስፋዬ – 21 አበበ ጥላሁን – 22 ወሰኑ ማዜ8 ትርታዬ ደመቀ – 20 ሙሉአለም መስፍን – 5 ፍፁም ተፈሪ – 32 ሰንደይ ሙቱኩ – 14 አዲስ ግደይ9 በረከት አዲሱ\xa0ተጠባባቂዎች1 ፍቅሩ ወዴሳ25 ክፍሌ ኪአ23 ሙጃኢድ መሀመድ19 አዲስ አለም ደበበ11 ጸጋዬ ባልቻ27 ላኪ ሰኒ13 ኤሪክ ሙራንዳወላይታ ድቻ1 ወንድወሰን ገረመው6 ተክሉ ታፈሰ – 27 ሙባረክ ሽኩር – 3 ፈቱዲን ጀማል9 ያሬድ ዳዊት – 8 አማኑኤል ተሾመ – 17 በዛብህ መለዮ – 29 ወንድማገኝ በለጠ – 7 አናጋው ባደግ19 አላዘር ፋሲካ – 16 ቴዎድሮስ መንገሻተጠባባቂዎች12 ወንድወሰን አሸናፊ\xa03 ቶማስ ስምረቱ\xa05 ዳግም ንጉሴ\xa020 አብዱልሰመድ አሊ21 መሳይ አጪሶ23 ጸጋዬ በርሃኑ\xa013 ዳግም በቀለ'],
|
| 91 |
+
['አስዩት', 'አስዩት (የግብጽ አረብኛ፦ أسيوط /ኣስዩጥ/፤ ጥንታዊ ግብጽኛ፦ /ዛውቲ/፤ ጥንታዊ ግሪክኛ፦ Λυκόπολις /ሊውኮፖሊስ/) የጥንታዊ ግብጽ ከተማ ነበር። ዘመናዊው ከተማ በአጠገቡ ሲሆን ከ6 ሚሊዮን በላይ ነዋሪዎች አሉት። \n\nበሄራክሌውፖሊስና በጤቤስ መካከል በተደረገው ብሔራዊ ጦርነት (2107-2081 ዓክልበ. ግድም) የአሥዩት ገዦች ተፊቢ እና ልጁ ቀቲ ለሄራክሌውፖሊስ ፈርዖን መሪካሬ ታማኝ ሆነው በጤቤስ ግዛት ላይ እንደ ዘመቱ ይታወቃል። በመጨረሻ ግን የጠቤስ ፈርዖን 2 መንቱሆተፕ አሸነፈው። \n\nየግብፅ ከተሞች\nየቀድሞ ከተሞች'],
|
| 92 |
+
['ባርክሌስ ባንክ ሠራተኞቹ ምን ያህል ሰዓት ወንበራቸው ላይ እንደተቀመጡ የሚያሰላ የስለላ መረብ ዘርግቶ ነበር። ይህ መረጃ ይፋ ሲደረግ ወቀሳ የበዛበት ባርክሌስ ሠራተኞቹን መሰለል ቢያቆምም፤ ድርጊቱ አለቆች ተቀጣሪዎቻቸው ላይ መሰለል አለባቸውን? የሚል ጥያቄ አጭሯል።', 'ሜጀር ከዚህ ወር ቀደም ብሎ በዋይት ሐውስ ሰው በመንከሱ የተነሳ ለስልጠና ወደ ዴልዌር ተልኮ የነበረ ቢሆንም በተመለሰ ማግስት ሌላ ሠራተኛ መንከሱ ተነግሯል።\n\nየቀዳማይት እምቤት ጂል ባየደን ቃል አቀባይ "ተገቢውን ጥንቃቄ ለማድረግ ሲባል" የተነከሰው ግለሰብ ወደ ሥራ ከመመለሱ በፊት በዋይት ሐውስ የሕክምና ቡደን ክትትል እየተደረገለት እንደሆነ ገልጸዋል።\n\nሜጀር ጆ ባይደን ካሏቸው ሁለት የጀርመን ዝርያ ካላቸው ውሾች መካከል በእድሜ ትንሹ ሲሆን ወደ ዋይት ሐውስ የገባ የመጀ��ሪያው በማደጎ የተወሰደ ውሻ ነው ተብሏል።\n\nባይደን "በጣም ተወዳጅ ውሻ ነው" ሲሉ ያንቆለጳጵሱታል።\n\nየጂል ባይደን ቃል አቀባይ ሚሼል ላሮሳ ሰኞ እለት ክስተቱ የተፈጠረው ሜጀር ከአዲሱ አካባቢ ጋር ራሱን ለማላመድ እየጣረ ባለበት ወቅት በአጠገቡ የሚያልፍን ግለሰብ በመንከሱ ነው ብላለች።\n\nሲኤንኤን ውሻው የብሔራዊ ፓርክ ሠራተኛ የሆነ ግለሰብ መንከሱንና በዚህም የተነሳ ግለሰቡ ሕክምና ለመከታተል ሥራ ማቆሙን ዘግቧል።\n\nየብሔራዊ ፓርክ አገልግሎት መስሪያ ቤቱ ለሲኤን ኤን ጥያቄ ምላሽ አልሰጠም።\n\nበመጋቢት ወር የጆ ባይደን ሁለቱ ውሾች ሜጀርና ቻምፕ ሠራተኞችን መንከሳቸውን ተከትሎ ዊልሚንግተን ዴልዌር ወደሚገኘው የባይደን ቤተሰቦች ቤት ተወስደው ነበር።\n\nስሙ እንዳይጠቀስ የጠየቀ ግለሰብ ለሲኤንኤን እንደገለፀው ሜጀር የዋይት ሐውስ ሠራተኞችንና የደኅንነት ሰዎችን በሚያይበት ወቅት ይጮሃል ይዘላል።\n\nፕሬዝዳንት ባይደን ሜጀር በርካታ ሰው በዙሪያው ከመኖሩ ጋር የተፈጠረበትን ስሜት እየተላመደ ነው ሲሉ ተናግረዋል።\n\nለኤቢሲ ጉድ ሞርኒንግ አሜሪካ ፕሮግራም ላይ በየአቅጣጫው በዞረ ቁጥር የማያውቃቸው ሰዎች ሲንቀሳቀሱ ሲያይ ለመከላከል ሲል እንደሚጮህ አስረድተዋል።\n\n"በዋይት ሐውስ ያሉ 85 በመቶ ሠራተኞች ይወዱታል። እርሱም ጭራውን እያወዛወዘ ይልሳቸዋል። ነገር ግን እንደተረዳሁት አንዳንድ ሰዎች በተፈጥሯቸው ውሾች ይፈራሉ" ብለዋል።\n\nባይደን የሚያሳድጉት ሜጀር ሦስት ዓመቱ ሲሆን ቻምፕ ግን ፕሬዝዳንት ባይደን የኦባማ ምክትል ሳሉ አብሯቸው በቤተመመንግሥት ውስጥ ነበር ተብሏል።\n\n '],
|
| 93 |
+
]
|
| 94 |
+
scores = model.predict(pairs)
|
| 95 |
+
print(scores.shape)
|
| 96 |
+
# (5,)
|
| 97 |
+
|
| 98 |
+
# Or rank different texts based on similarity to a single text
|
| 99 |
+
ranks = model.rank(
|
| 100 |
+
'በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ',
|
| 101 |
+
[
|
| 102 |
+
'አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ',
|
| 103 |
+
'ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡��ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥራ ወረዳ አስተዳደሩ፣ አማተር የኪነ ጥበብ ባለሙያዎች እና በጎ አድራጎት ማኅበራት እገዛ እንደሚያደርጉላቸውም ገልጿል፡፡በተለያዩ አካባቢዎች የሚኖሩ ሌሎች ተማሪዎችም ቅድሚያ ራሳቸውን መጠበቅ ኅብረተሰቡ ራሱን እንዲጠብቅ አርአያ በመሆን የግንዛቤ ፈጠራ ሥራ መሥራት እንዳለባቸውም አሳስበዋል፡፡ በተለይም ለሕዝብ ደኅንነት ሲባል የሚተላለፉ የጥንቃቄ መልእክቶች እንዲተገበሩ የዩነቨርሲቲ ተማሪዎች ያላቸው ሚና የጎላ በመሆኑ ይህንን ሚናቸውን እንዲጫወቱ ጥሪ አቅርበዋል፡፡የበረኸት ወረዳ ዋና አስተዳዳሪ ይደሰቱ ክፈተው የዩኒቨርሲቲ ተማሪዎቹ የበጎ ፈቃድ አገልግሎት ለኅብረተሰቡ ስለወረርሽኙ የሚሰጠው ግንዛቤ የተሻለ እንዲሆን እያገዘ እንደሆነ ተናግረዋል፡፡ ወረዳ አስተዳደሩም ለተማሪዎች ልፋት መሳካት ጥረት እያደረገ መሆኑን ገልፀዋል፡፡ እንደ ዋና አስተዳዳሪው ከበጎ ፈቃደኞቹ ተግባር ባሻገር ወረርሽኙን ለመከላከል በአፋር እና በኦሮሚያ ክልሎች የሚገቡ ሰዎችን የሰውነት ሙቀት ልኬታ ምርመራ ይደረጋል፡፡ በተለይም በወረዳው የልማት ፕሮጀክቶች እየተሠሩ በመሆናቸው እና አካባቢው ለኮሮና ቫይረስ ወረርሽኝ ተጋላጭ በመሆኑ ቅድመ መከላከሉ ሥራ ላይ እንደሚረባረቡ ዋና አስተዳዳሪው አስታውቀዋል፡፡',
|
| 104 |
+
'\u200b79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው \xa0ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ \xa0መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ\xa0አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭ��� ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡\nየተጫዋች ለውጥ – ወላይታ ድቻ\xa071′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡\nየተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ \xa060′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ\n46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡\nተጀመረ!\nሁለተኛው አጋማሽ የጨዋታ ክፍለ ጊዜ ተጀምሯል፡፡\nእረፍት\nየጨዋታው የመጀመርያ አጋማሽ ያለ ግብ ተጠናቋል፡፡ተጨማሪ ደቂቃ – 1 ደቂቃ33′ ቴዎድሮስ መንገሻ ከአላዛር ፋሲካ በግሩም ሁኔታ የተሻገረለትን ግልፅ የጎል አጋጣሚ አመከነ፡፡ቢጫ ካርድ\n26′ አዲስ ግደይ ሆን ብሎ ፍፁም ቅጣት ምት ክልል ውስጥ ወድቋል ተብሎ ቢጫ ካርድ ተመልክቷል:: አበበ ጥላሁንም የዳኛን ውሳኔ በመቃወም ቢጫ ካርድተመልክቷል፡፡19′ ጨዋታው የመጀመሪያ አምስት ደቂቃ ከነበረው ፍጥነት ቀዝቀዝ ያለ ተመጣጣኝ የታከለበት እንቅስቃሴ \xa0እየተመለከትን ነው፡፡\n5′ በፈጣን እንቅስቃሴ ሲዳማ ቡና በተደጋጋሚ ወደ ጎል በመቅረብ ተጭኖ ለመጫወት ጥረት እያደረገ ነው፡፡ተጀመረ!\nጨዋታው በወላይታ ድቻ አማካኝነት ተጀመረ09:55 ታላቁን የደቡብ ደርቢ እንደ ወትሮ ሁሉ ለመከታተል በሺህ የሚቆጠር የስፖርት ቤተሰብ በስታድየሙ ታድሟል፡፡09:50 ሁለቱም ቡድኖች ልምምዳቸውን አጠናቀው ወደ መልበሻ ክፍል አምርተዋልየሲዳማ ቡና አሰላለፍ24 ለአለም ብርሃኑ12 ግሩም አሰፋ – 4 አንተነህ ተስፋዬ – 21 አበበ ጥላሁን – 22 ወሰኑ ማዜ8 ትርታዬ ደመቀ – 20 ሙሉአለም መስፍን – 5 ፍፁም ተፈሪ – 32 ሰንደይ ሙቱኩ – 14 አዲስ ግደይ9 በረከት አዲሱ\xa0ተጠባባቂዎች1 ፍቅሩ ወዴሳ25 ክፍሌ ኪአ23 ሙጃኢድ መሀመድ19 አዲስ አለም ደበበ11 ጸጋዬ ባልቻ27 ላኪ ሰኒ13 ኤሪክ ሙራንዳወላይታ ድቻ1 ወንድወሰን ገረመው6 ተክሉ ታፈሰ – 27 ሙባረክ ሽኩር – 3 ፈቱዲን ጀማል9 ያሬድ ዳዊት – 8 አማኑኤል ተሾመ – 17 በዛብህ መለዮ – 29 ወንድማገኝ በለጠ – 7 አናጋው ባደግ19 አላዘር ፋሲካ – 16 ቴዎድሮስ መንገሻተጠባባቂዎች12 ወንድወሰን አሸናፊ\xa03 ቶማስ ስምረቱ\xa05 ዳግም ንጉሴ\xa020 አብዱልሰመድ አሊ21 መሳይ አጪሶ23 ጸጋዬ በርሃኑ\xa013 ዳግም በቀለ',
|
| 105 |
+
'አስዩት (የግብጽ አረብኛ፦ أسيوط /ኣስዩጥ/፤ ጥንታዊ ግብጽኛ፦ /ዛውቲ/፤ ጥንታዊ ግሪክኛ፦ Λυκόπολις /ሊውኮፖሊስ/) የጥንታዊ ግብጽ ከተማ ነበር። ዘመናዊው ከተማ በአጠገቡ ሲሆን ከ6 ሚሊዮን በላይ ነዋሪዎች አሉት። \n\nበሄራክሌውፖሊስና በጤቤስ መካከል በተደረገው ብሔራዊ ጦርነት (2107-2081 ዓክልበ. ግድም) የአሥዩት ገዦች ተፊቢ እና ልጁ ቀቲ ለሄራክሌውፖሊስ ፈርዖን መሪካሬ ታማኝ ሆነው በጤቤስ ግዛት ላይ እንደ ዘመቱ ይታወቃል። በመጨረሻ ግን የጠቤስ ፈርዖን 2 መንቱሆተፕ አሸነፈው። \n\nየግብፅ ከተሞች\nየቀድሞ ከተሞች',
|
| 106 |
+
'ሜጀር ከዚህ ወር ቀደም ብሎ በዋይት ሐውስ ሰው በመንከሱ የተነሳ ለስልጠና ወደ ዴልዌር ተልኮ የነበረ ቢሆንም በተመለሰ ማግስት ሌላ ሠራተኛ መንከሱ ተነግሯል።\n\nየቀዳማይት እምቤት ጂል ባየደን ቃል አቀባይ "ተገቢውን ጥንቃቄ ለማድረግ ሲባል" የተነከሰው ግለሰብ ወደ ሥራ ከመመለሱ በፊት በዋይት ሐውስ የሕክምና ቡደን ክትትል እየተደረገለት እንደሆነ ገልጸዋል።\n\nሜጀር ጆ ባይደን ካሏቸው ሁለት የጀርመን ዝርያ ካላቸው ውሾች መካከል በእድሜ ትንሹ ሲሆን ወደ ዋይት ሐውስ የገባ የመጀመሪያው በማደጎ የተወሰደ ውሻ ነው ተብሏል።\n\nባይደን "በጣም ተወዳጅ ውሻ ነው" ሲሉ ያንቆለጳጵሱታል።\n\nየጂል ባይደን ቃል አቀባይ ሚሼል ላሮሳ ሰኞ እለት ክስተቱ የተፈጠረው ሜጀር ከአዲሱ አካባቢ ጋር ራሱን ለማላመድ እየጣረ ባለበት ወቅት በአጠገቡ የሚያልፍን ግለሰብ በመንከሱ ነው ብላለች።\n\nሲኤንኤን ውሻው የብሔራዊ ፓርክ ሠራተኛ የሆነ ግለሰብ መንከሱንና በዚህም የተነሳ ግለሰቡ ሕክምና ለመከታተል ሥራ ማቆሙን ዘግቧል።\n\nየብሔራዊ ፓርክ አገልግሎት መስሪያ ቤቱ ለሲኤን ኤን ጥያቄ ምላሽ አልሰጠም።\n\nበመጋቢት ወር የጆ ባይደን ሁለቱ ውሾች ሜጀርና ቻምፕ ሠራተኞችን መንከሳቸውን ተከትሎ ዊልሚንግተን ዴልዌር ወደሚገኘው የባይደን ቤተሰቦች ቤት ተወስደው ነበር።\n\nስሙ እንዳይጠቀስ የጠየቀ ግለሰብ ለሲኤንኤን እንደገለፀው ሜጀር የዋይት ሐውስ ሠራተኞችንና የደኅንነት ሰዎችን በሚያይበት ወቅት ይጮሃል ይዘላል።\n\nፕሬዝዳንት ባይደን ሜጀር በርካታ ሰው በዙሪያው ከመኖሩ ጋር የተፈጠረበትን ስሜት እየተላመደ ነው ሲሉ ተናግረዋል።\n\nለኤቢሲ ጉድ ሞርኒንግ አሜሪካ ፕሮግራም ላይ በየአቅጣጫው በዞረ ቁጥር የማያውቃቸው ሰዎች ሲንቀሳቀሱ ሲያይ ለመከላከል ሲል እንደሚጮህ አስረድተዋል።\n\n"በዋይት ሐውስ ያሉ 85 በመቶ ሠራተኞች ይወዱታል። እርሱም ጭራውን እያወዛወዘ ይልሳቸዋል። ነገር ግን እንደተረዳሁት አንዳንድ ሰዎች በተፈጥሯቸው ውሾች ይፈራሉ" ብለዋል።\n\nባይደን የሚያሳድጉት ሜጀር ሦስት ዓመቱ ሲሆን ቻምፕ ግን ፕሬዝዳንት ባይደን የኦባማ ምክትል ሳሉ አብሯቸው በቤተመመንግሥት ውስጥ ነበር ተብሏል።\n\n ',
|
| 107 |
+
]
|
| 108 |
+
)
|
| 109 |
+
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
|
| 110 |
```
|
| 111 |
|
| 112 |
+
<!--
|
| 113 |
+
### Direct Usage (Transformers)
|
| 114 |
+
|
| 115 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
| 116 |
+
|
| 117 |
+
</details>
|
| 118 |
+
-->
|
| 119 |
+
|
| 120 |
+
<!--
|
| 121 |
+
### Downstream Usage (Sentence Transformers)
|
| 122 |
+
|
| 123 |
+
You can finetune this model on your own dataset.
|
| 124 |
+
|
| 125 |
+
<details><summary>Click to expand</summary>
|
| 126 |
+
|
| 127 |
+
</details>
|
| 128 |
+
-->
|
| 129 |
+
|
| 130 |
+
<!--
|
| 131 |
+
### Out-of-Scope Use
|
| 132 |
+
|
| 133 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
| 134 |
+
-->
|
| 135 |
+
|
| 136 |
+
## Evaluation
|
| 137 |
+
|
| 138 |
+
### Metrics
|
| 139 |
+
|
| 140 |
+
#### Cross Encoder Reranking
|
| 141 |
+
|
| 142 |
+
* Dataset: `amh-passage-retrieval-dev`
|
| 143 |
+
* Evaluated with [<code>CrossEncoderRerankingEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderRerankingEvaluator) with these parameters:
|
| 144 |
+
```json
|
| 145 |
+
{
|
| 146 |
+
"at_k": 10
|
| 147 |
+
}
|
| 148 |
+
```
|
| 149 |
+
|
| 150 |
+
| Metric | Value |
|
| 151 |
+
|:------------|:-----------|
|
| 152 |
+
| map | 0.823 |
|
| 153 |
+
| mrr@10 | 0.8213 |
|
| 154 |
+
| **ndcg@10** | **0.8551** |
|
| 155 |
+
|
| 156 |
+
#### Cross Encoder Reranking
|
| 157 |
+
|
| 158 |
+
* Dataset: `amh-passage-retrieval-dev`
|
| 159 |
+
* Evaluated with [<code>CrossEncoderRerankingEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderRerankingEvaluator) with these parameters:
|
| 160 |
+
```json
|
| 161 |
+
{
|
| 162 |
+
"at_k": 10
|
| 163 |
+
}
|
| 164 |
+
```
|
| 165 |
+
|
| 166 |
+
| Metric | Value |
|
| 167 |
+
|:------------|:-----------|
|
| 168 |
+
| map | 0.8268 |
|
| 169 |
+
| mrr@10 | 0.8247 |
|
| 170 |
+
| **ndcg@10** | **0.8579** |
|
| 171 |
+
|
| 172 |
+
<!--
|
| 173 |
+
## Bias, Risks and Limitations
|
| 174 |
+
|
| 175 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
| 176 |
+
-->
|
| 177 |
+
|
| 178 |
+
<!--
|
| 179 |
+
### Recommendations
|
| 180 |
+
|
| 181 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
| 182 |
+
-->
|
| 183 |
+
|
| 184 |
+
## Training Details
|
| 185 |
+
|
| 186 |
+
### Training Dataset
|
| 187 |
+
|
| 188 |
+
#### Unnamed Dataset
|
| 189 |
+
|
| 190 |
+
* Size: 491,752 training samples
|
| 191 |
+
* Columns: <code>query</code>, <code>passage</code>, and <code>label</code>
|
| 192 |
+
* Approximate statistics based on the first 1000 samples:
|
| 193 |
+
| | query | passage | label |
|
| 194 |
+
|:--------|:-----------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:------------------------------------------------|
|
| 195 |
+
| type | string | string | int |
|
| 196 |
+
| details | <ul><li>min: 2 characters</li><li>mean: 49.94 characters</li><li>max: 283 characters</li></ul> | <ul><li>min: 126 characters</li><li>mean: 1418.88 characters</li><li>max: 8678 characters</li></ul> | <ul><li>0: ~87.40%</li><li>1: ~12.60%</li></ul> |
|
| 197 |
+
* Samples:
|
| 198 |
+
| query | passage | label |
|
| 199 |
+
|:------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
|
| 200 |
+
| <code>በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ</code> | <code>አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ</code> | <code>0</code> |
|
| 201 |
+
| <code>ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅበራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የንባብ ባህሉ መቀነሱን የእንጅባራ ከተማ ነዋሪዎቸ ተናገሩ፡፡</code> | <code>ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥ...</code> | <code>0</code> |
|
| 202 |
+
| <code>አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት</code> | <code>79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭቶ ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡<br>የተጫዋች ለውጥ – ወላይታ ድቻ 71′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡<br>የተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ 60′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ<br>46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡<br>ተጀመረ!<br>ሁለተኛው አጋማሽ የጨዋታ...</code> | <code>0</code> |
|
| 203 |
+
* Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
|
| 204 |
+
```json
|
| 205 |
+
{
|
| 206 |
+
"activation_fn": "torch.nn.modules.linear.Identity",
|
| 207 |
+
"pos_weight": 7
|
| 208 |
+
}
|
| 209 |
+
```
|
| 210 |
+
|
| 211 |
+
### Training Hyperparameters
|
| 212 |
+
#### Non-Default Hyperparameters
|
| 213 |
+
|
| 214 |
+
- `eval_strategy`: epoch
|
| 215 |
+
- `per_device_train_batch_size`: 64
|
| 216 |
+
- `per_device_eval_batch_size`: 64
|
| 217 |
+
- `learning_rate`: 4e-05
|
| 218 |
+
- `num_train_epochs`: 4
|
| 219 |
+
- `lr_scheduler_type`: cosine
|
| 220 |
+
- `warmup_ratio`: 0.05
|
| 221 |
+
- `fp16`: True
|
| 222 |
+
- `dataloader_num_workers`: 2
|
| 223 |
+
- `load_best_model_at_end`: True
|
| 224 |
+
- `batch_sampler`: no_duplicates
|
| 225 |
+
|
| 226 |
+
#### All Hyperparameters
|
| 227 |
+
<details><summary>Click to expand</summary>
|
| 228 |
+
|
| 229 |
+
- `overwrite_output_dir`: False
|
| 230 |
+
- `do_predict`: False
|
| 231 |
+
- `eval_strategy`: epoch
|
| 232 |
+
- `prediction_loss_only`: True
|
| 233 |
+
- `per_device_train_batch_size`: 64
|
| 234 |
+
- `per_device_eval_batch_size`: 64
|
| 235 |
+
- `per_gpu_train_batch_size`: None
|
| 236 |
+
- `per_gpu_eval_batch_size`: None
|
| 237 |
+
- `gradient_accumulation_steps`: 1
|
| 238 |
+
- `eval_accumulation_steps`: None
|
| 239 |
+
- `torch_empty_cache_steps`: None
|
| 240 |
+
- `learning_rate`: 4e-05
|
| 241 |
+
- `weight_decay`: 0.0
|
| 242 |
+
- `adam_beta1`: 0.9
|
| 243 |
+
- `adam_beta2`: 0.999
|
| 244 |
+
- `adam_epsilon`: 1e-08
|
| 245 |
+
- `max_grad_norm`: 1.0
|
| 246 |
+
- `num_train_epochs`: 4
|
| 247 |
+
- `max_steps`: -1
|
| 248 |
+
- `lr_scheduler_type`: cosine
|
| 249 |
+
- `lr_scheduler_kwargs`: {}
|
| 250 |
+
- `warmup_ratio`: 0.05
|
| 251 |
+
- `warmup_steps`: 0
|
| 252 |
+
- `log_level`: passive
|
| 253 |
+
- `log_level_replica`: warning
|
| 254 |
+
- `log_on_each_node`: True
|
| 255 |
+
- `logging_nan_inf_filter`: True
|
| 256 |
+
- `save_safetensors`: True
|
| 257 |
+
- `save_on_each_node`: False
|
| 258 |
+
- `save_only_model`: False
|
| 259 |
+
- `restore_callback_states_from_checkpoint`: False
|
| 260 |
+
- `no_cuda`: False
|
| 261 |
+
- `use_cpu`: False
|
| 262 |
+
- `use_mps_device`: False
|
| 263 |
+
- `seed`: 42
|
| 264 |
+
- `data_seed`: None
|
| 265 |
+
- `jit_mode_eval`: False
|
| 266 |
+
- `use_ipex`: False
|
| 267 |
+
- `bf16`: False
|
| 268 |
+
- `fp16`: True
|
| 269 |
+
- `fp16_opt_level`: O1
|
| 270 |
+
- `half_precision_backend`: auto
|
| 271 |
+
- `bf16_full_eval`: False
|
| 272 |
+
- `fp16_full_eval`: False
|
| 273 |
+
- `tf32`: None
|
| 274 |
+
- `local_rank`: 0
|
| 275 |
+
- `ddp_backend`: None
|
| 276 |
+
- `tpu_num_cores`: None
|
| 277 |
+
- `tpu_metrics_debug`: False
|
| 278 |
+
- `debug`: []
|
| 279 |
+
- `dataloader_drop_last`: False
|
| 280 |
+
- `dataloader_num_workers`: 2
|
| 281 |
+
- `dataloader_prefetch_factor`: None
|
| 282 |
+
- `past_index`: -1
|
| 283 |
+
- `disable_tqdm`: False
|
| 284 |
+
- `remove_unused_columns`: True
|
| 285 |
+
- `label_names`: None
|
| 286 |
+
- `load_best_model_at_end`: True
|
| 287 |
+
- `ignore_data_skip`: False
|
| 288 |
+
- `fsdp`: []
|
| 289 |
+
- `fsdp_min_num_params`: 0
|
| 290 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
| 291 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
| 292 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 293 |
+
- `deepspeed`: None
|
| 294 |
+
- `label_smoothing_factor`: 0.0
|
| 295 |
+
- `optim`: adamw_torch
|
| 296 |
+
- `optim_args`: None
|
| 297 |
+
- `adafactor`: False
|
| 298 |
+
- `group_by_length`: False
|
| 299 |
+
- `length_column_name`: length
|
| 300 |
+
- `ddp_find_unused_parameters`: None
|
| 301 |
+
- `ddp_bucket_cap_mb`: None
|
| 302 |
+
- `ddp_broadcast_buffers`: False
|
| 303 |
+
- `dataloader_pin_memory`: True
|
| 304 |
+
- `dataloader_persistent_workers`: False
|
| 305 |
+
- `skip_memory_metrics`: True
|
| 306 |
+
- `use_legacy_prediction_loop`: False
|
| 307 |
+
- `push_to_hub`: False
|
| 308 |
+
- `resume_from_checkpoint`: None
|
| 309 |
+
- `hub_model_id`: None
|
| 310 |
+
- `hub_strategy`: every_save
|
| 311 |
+
- `hub_private_repo`: None
|
| 312 |
+
- `hub_always_push`: False
|
| 313 |
+
- `gradient_checkpointing`: False
|
| 314 |
+
- `gradient_checkpointing_kwargs`: None
|
| 315 |
+
- `include_inputs_for_metrics`: False
|
| 316 |
+
- `include_for_metrics`: []
|
| 317 |
+
- `eval_do_concat_batches`: True
|
| 318 |
+
- `fp16_backend`: auto
|
| 319 |
+
- `push_to_hub_model_id`: None
|
| 320 |
+
- `push_to_hub_organization`: None
|
| 321 |
+
- `mp_parameters`:
|
| 322 |
+
- `auto_find_batch_size`: False
|
| 323 |
+
- `full_determinism`: False
|
| 324 |
+
- `torchdynamo`: None
|
| 325 |
+
- `ray_scope`: last
|
| 326 |
+
- `ddp_timeout`: 1800
|
| 327 |
+
- `torch_compile`: False
|
| 328 |
+
- `torch_compile_backend`: None
|
| 329 |
+
- `torch_compile_mode`: None
|
| 330 |
+
- `include_tokens_per_second`: False
|
| 331 |
+
- `include_num_input_tokens_seen`: False
|
| 332 |
+
- `neftune_noise_alpha`: None
|
| 333 |
+
- `optim_target_modules`: None
|
| 334 |
+
- `batch_eval_metrics`: False
|
| 335 |
+
- `eval_on_start`: False
|
| 336 |
+
- `use_liger_kernel`: False
|
| 337 |
+
- `eval_use_gather_object`: False
|
| 338 |
+
- `average_tokens_across_devices`: False
|
| 339 |
+
- `prompts`: None
|
| 340 |
+
- `batch_sampler`: no_duplicates
|
| 341 |
+
- `multi_dataset_batch_sampler`: proportional
|
| 342 |
+
|
| 343 |
+
</details>
|
| 344 |
+
|
| 345 |
+
### Training Logs
|
| 346 |
+
| Epoch | Step | Training Loss | amh-passage-retrieval-dev_ndcg@10 |
|
| 347 |
+
|:-------:|:---------:|:-------------:|:---------------------------------:|
|
| 348 |
+
| -1 | -1 | - | 0.0898 |
|
| 349 |
+
| 1.0 | 7684 | 0.4048 | 0.8289 |
|
| 350 |
+
| 2.0 | 15368 | 0.2366 | 0.8546 |
|
| 351 |
+
| 3.0 | 23052 | 0.1588 | 0.8353 |
|
| 352 |
+
| **4.0** | **30736** | **0.1024** | **0.8551** |
|
| 353 |
+
| -1 | -1 | - | 0.8579 |
|
| 354 |
+
|
| 355 |
+
* The bold row denotes the saved checkpoint.
|
| 356 |
+
|
| 357 |
+
### Framework Versions
|
| 358 |
+
- Python: 3.11.13
|
| 359 |
+
- Sentence Transformers: 4.1.0
|
| 360 |
+
- Transformers: 4.52.4
|
| 361 |
+
- PyTorch: 2.6.0+cu124
|
| 362 |
+
- Accelerate: 1.7.0
|
| 363 |
+
- Datasets: 3.6.0
|
| 364 |
+
- Tokenizers: 0.21.1
|
| 365 |
+
|
| 366 |
+
## Citation
|
| 367 |
+
|
| 368 |
+
### BibTeX
|
| 369 |
+
|
| 370 |
+
#### Sentence Transformers
|
| 371 |
+
```bibtex
|
| 372 |
+
@inproceedings{reimers-2019-sentence-bert,
|
| 373 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
| 374 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
| 375 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
| 376 |
+
month = "11",
|
| 377 |
+
year = "2019",
|
| 378 |
+
publisher = "Association for Computational Linguistics",
|
| 379 |
+
url = "https://arxiv.org/abs/1908.10084",
|
| 380 |
+
}
|
| 381 |
+
```
|
| 382 |
+
|
| 383 |
+
<!--
|
| 384 |
+
## Glossary
|
| 385 |
+
|
| 386 |
+
*Clearly define terms in order to be accessible across audiences.*
|
| 387 |
+
-->
|
| 388 |
+
|
| 389 |
+
<!--
|
| 390 |
+
## Model Card Authors
|
| 391 |
+
|
| 392 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
| 393 |
+
-->
|
| 394 |
+
|
| 395 |
+
<!--
|
| 396 |
+
## Model Card Contact
|
| 397 |
+
|
| 398 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
| 399 |
+
-->
|
config.json
CHANGED
|
@@ -1,5 +1,4 @@
|
|
| 1 |
{
|
| 2 |
-
"_name_or_path": "rasyosef/roberta-medium-amharic",
|
| 3 |
"architectures": [
|
| 4 |
"XLMRobertaForSequenceClassification"
|
| 5 |
],
|
|
@@ -26,8 +25,12 @@
|
|
| 26 |
"output_past": true,
|
| 27 |
"pad_token_id": 1,
|
| 28 |
"position_embedding_type": "absolute",
|
|
|
|
|
|
|
|
|
|
|
|
|
| 29 |
"torch_dtype": "float32",
|
| 30 |
-
"transformers_version": "4.
|
| 31 |
"type_vocab_size": 1,
|
| 32 |
"use_cache": true,
|
| 33 |
"vocab_size": 32000
|
|
|
|
| 1 |
{
|
|
|
|
| 2 |
"architectures": [
|
| 3 |
"XLMRobertaForSequenceClassification"
|
| 4 |
],
|
|
|
|
| 25 |
"output_past": true,
|
| 26 |
"pad_token_id": 1,
|
| 27 |
"position_embedding_type": "absolute",
|
| 28 |
+
"sentence_transformers": {
|
| 29 |
+
"activation_fn": "torch.nn.modules.activation.Sigmoid",
|
| 30 |
+
"version": "4.1.0"
|
| 31 |
+
},
|
| 32 |
"torch_dtype": "float32",
|
| 33 |
+
"transformers_version": "4.52.4",
|
| 34 |
"type_vocab_size": 1,
|
| 35 |
"use_cache": true,
|
| 36 |
"vocab_size": 32000
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 168535980
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:b8b1294b5f9536b3b79df9e0150d59f1087dbbd285ce1e12f5c5c31999492800
|
| 3 |
size 168535980
|
tokenizer_config.json
CHANGED
|
@@ -52,7 +52,7 @@
|
|
| 52 |
"pad_token": "<pad>",
|
| 53 |
"sep_token": "</s>",
|
| 54 |
"stride": 0,
|
| 55 |
-
"tokenizer_class": "
|
| 56 |
"truncation_side": "right",
|
| 57 |
"truncation_strategy": "longest_first",
|
| 58 |
"unk_token": "<unk>"
|
|
|
|
| 52 |
"pad_token": "<pad>",
|
| 53 |
"sep_token": "</s>",
|
| 54 |
"stride": 0,
|
| 55 |
+
"tokenizer_class": "XLMRobertaTokenizerFast",
|
| 56 |
"truncation_side": "right",
|
| 57 |
"truncation_strategy": "longest_first",
|
| 58 |
"unk_token": "<unk>"
|