File size: 23,397 Bytes
be2403f
7bdb570
 
d70de50
 
 
 
 
 
 
 
cd4456c
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9bb16e3
d70de50
 
9bb16e3
d70de50
9bb16e3
 
 
be2403f
 
a022750
be2403f
d70de50
be2403f
d70de50
be2403f
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7bdb570
 
be2403f
d70de50
7bdb570
d70de50
be2403f
d70de50
9bb16e3
d70de50
 
9bb16e3
 
d70de50
 
 
9bb16e3
d70de50
 
 
9bb16e3
d70de50
9bb16e3
 
d70de50
 
 
7bdb570
be2403f
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9bb16e3
 
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9bb16e3
 
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9bb16e3
 
d70de50
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
---
language:
- am
license: mit
tags:
- sentence-transformers
- cross-encoder
- generated_from_trainer
- dataset_size:491752
- loss:BinaryCrossEntropyLoss
base_model: rasyosef/roberta-medium-amharic
pipeline_tag: text-ranking
library_name: sentence-transformers
metrics:
- map
- mrr@10
- ndcg@10
model-index:
- name: roberta-amharic-reranker-medium
  results:
  - task:
      type: cross-encoder-reranking
      name: Cross Encoder Reranking
    dataset:
      name: amh passage retrieval dev
      type: amh-passage-retrieval-dev
    metrics:
    - type: mrr@10
      value: 0.805
      name: Mrr@10
    - type: ndcg@10
      value: 0.835
      name: Ndcg@10
    
datasets:
- rasyosef/Amharic-Passage-Retrieval-Dataset-V2
---

# reranker-amharic-medium

This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.

## Model Details

### Model Description
- **Model Type:** Cross Encoder
- **Base model:** [rasyosef/roberta-medium-amharic](https://huggingface.co/rasyosef/roberta-medium-amharic) <!-- at revision 9d02d0281e64d6ca31bd06d322e14b0b7e60375b -->
- **Maximum Sequence Length:** 510 tokens
- **Number of Output Labels:** 1 label
<!-- - **Training Dataset:** Unknown -->
- **Language:** am
- **License:** mit

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("rasyosef/reranker-amharic-medium")
# Get scores for pairs of texts
pairs = [
    ['ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና', 'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል። በዚህ የተነሳም የኢትዮጵያ ቡናና ሻይ ባለሥልጣንን ጨምሮ የሚመላካታቸው ሁሉ ቡና ላኪዎችና አምራቾች ያከማቹትን ቡና በፍጥነት ወደ ዓለም ገበያ እንዲያወጡ ጥሪ እያቀረቡ ነው ።'],
    ['ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና', 'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር። ከፑቲን ጋር ደግሞ ዢ ለሁለቱ አገራት ስልታዊም ሆነ ኢኮኖሚያዊ ጠቀሜታ ረጅም ጊዜ የዘለቀውን አጋርነትን ይበልጥ ማጠናከር ላይ ነበር ትኩረታቸው።']
]
scores = model.predict(pairs)
print(scores.shape)
# (2,)

# Or rank different texts based on similarity to a single text
ranks = model.rank(
    'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
    [
        'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል። በዚህ የተነሳም የኢትዮጵያ ቡናና ሻይ ባለሥልጣንን ጨምሮ የሚመላካታቸው ሁሉ ቡና ላኪዎችና አምራቾች ያከማቹትን ቡና በፍጥነት ወደ ዓለም ገበያ እንዲያወጡ ጥሪ እያቀረቡ ነው ።',
        'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር። ከፑቲን ጋር ደግሞ ዢ ለሁለቱ አገራት ስልታዊም ሆነ ኢኮኖሚያዊ ጠቀሜታ ረጅም ጊዜ የዘለቀውን አጋርነትን ይበልጥ ማጠናከር ላይ ነበር ትኩረታቸው።',
    ]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

## Evaluation

### Metrics

#### Cross Encoder Reranking

* Dataset: `amh-passage-retrieval-dev`
* Evaluated with [<code>CrossEncoderRerankingEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderRerankingEvaluator) with these parameters:
  ```json
  {
      "at_k": 10
  }
  ```

| Metric      | Value      |
|:------------|:-----------|
| mrr@10      | 0.805     |
| **ndcg@10** | **0.835** |

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

<details>
  
### Training Dataset

#### Unnamed Dataset

* Size: 491,752 training samples
* Columns: <code>query</code>, <code>passage</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
  |         | query                                                                                          | passage                                                                                             | label                                           |
  |:--------|:-----------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:------------------------------------------------|
  | type    | string                                                                                         | string                                                                                              | int                                             |
  | details | <ul><li>min: 2 characters</li><li>mean: 49.94 characters</li><li>max: 283 characters</li></ul> | <ul><li>min: 126 characters</li><li>mean: 1418.88 characters</li><li>max: 8678 characters</li></ul> | <ul><li>0: ~87.40%</li><li>1: ~12.60%</li></ul> |
* Samples:
  | query                                                                                           | passage                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | label          |
  |:------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
  | <code>በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ</code>             | <code>አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ</code>                                                                                                                                                                                                                                                                    | <code>0</code> |
  | <code>ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅበራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የንባብ ባህሉ መቀነሱን የእንጅባራ ከተማ ነዋሪዎቸ ተናገሩ፡፡</code> | <code>ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥ...</code>                | <code>0</code> |
  | <code>አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት</code>                                                 | <code>​79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው  ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ  መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭቶ ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡<br>የተጫዋች ለውጥ – ወላይታ ድቻ 71′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡<br>የተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ  60′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ<br>46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡<br>ተጀመረ!<br>ሁለተኛው አጋማሽ የጨዋታ...</code> | <code>0</code> |
* Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
  ```json
  {
      "activation_fn": "torch.nn.modules.linear.Identity",
      "pos_weight": 7
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `eval_strategy`: epoch
- `per_device_train_batch_size`: 64
- `per_device_eval_batch_size`: 64
- `learning_rate`: 4e-05
- `num_train_epochs`: 4
- `lr_scheduler_type`: cosine
- `warmup_ratio`: 0.05
- `fp16`: True
- `dataloader_num_workers`: 2
- `load_best_model_at_end`: True
- `batch_sampler`: no_duplicates

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: epoch
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 64
- `per_device_eval_batch_size`: 64
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 4e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 4
- `max_steps`: -1
- `lr_scheduler_type`: cosine
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.05
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 2
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: True
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional

</details>

### Training Logs
| Epoch   | Step      | Training Loss | amh-passage-retrieval-dev_ndcg@10 |
|:-------:|:---------:|:-------------:|:---------------------------------:|
| -1      | -1        | -             | 0.0898                            |
| 1.0     | 7684      | 0.4048        | 0.8289                            |
| 2.0     | 15368     | 0.2366        | 0.8546                            |
| 3.0     | 23052     | 0.1588        | 0.8353                            |
| **4.0** | **30736** | **0.1024**    | **0.8551**                        |
| -1      | -1        | -             | 0.8579                            |

* The bold row denotes the saved checkpoint.

### Framework Versions
- Python: 3.11.13
- Sentence Transformers: 4.1.0
- Transformers: 4.52.4
- PyTorch: 2.6.0+cu124
- Accelerate: 1.7.0
- Datasets: 3.6.0
- Tokenizers: 0.21.1

</details>

## Citation


<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->