File size: 89,493 Bytes
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
ed4137e
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ed4137e
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c779909
 
ed4137e
 
 
 
 
 
 
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ed4137e
 
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
0fa9434
 
 
 
 
 
 
 
 
 
 
3840896
 
 
 
 
 
 
 
 
 
7481b80
 
 
 
 
 
 
 
 
 
881d610
 
 
 
 
 
 
 
 
 
 
c779909
 
 
 
 
 
 
 
 
 
d003833
 
 
 
 
 
 
 
 
 
73a665e
 
 
 
 
 
 
 
 
 
 
6c2f21e
 
 
 
 
 
 
 
 
 
ed4137e
 
 
 
 
 
 
 
 
 
18fb71e
ed4137e
18fb71e
 
ed4137e
 
 
18fb71e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
---
language:
- multilingual
license: apache-2.0
tags:
- sentence-transformers
- cross-encoder
- reranker
- generated_from_trainer
- dataset_size:9220
- loss:BinaryCrossEntropyLoss
base_model: jhu-clsp/mmBERT-base
pipeline_tag: text-ranking
library_name: sentence-transformers
metrics:
- accuracy
- accuracy_threshold
- f1
- f1_threshold
- precision
- recall
- average_precision
model-index:
- name: mmBERT-base multilingual educational-quality reranker (FineWeb-C)
  results:
  - task:
      type: cross-encoder-classification
      name: Cross Encoder Classification
    dataset:
      name: fineweb c eval
      type: fineweb_c_eval
    metrics:
    - type: accuracy
      value: 0.9228515625
      name: Accuracy
    - type: accuracy_threshold
      value: 0.8104526996612549
      name: Accuracy Threshold
    - type: f1
      value: 0.7368421052631579
      name: F1
    - type: f1_threshold
      value: 0.6460131406784058
      name: F1 Threshold
    - type: precision
      value: 0.72
      name: Precision
    - type: recall
      value: 0.7544910179640718
      name: Recall
    - type: average_precision
      value: 0.7713544030397519
      name: Average Precision
---

# mmBERT-base multilingual educational-quality reranker (FineWeb-C)

This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [jhu-clsp/mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.

## Model Details

### Model Description
- **Model Type:** Cross Encoder
- **Base model:** [jhu-clsp/mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base) <!-- at revision c5955035435e2bf121cde7f3c8863ef52ff35d82 -->
- **Maximum Sequence Length:** 512 tokens
- **Number of Output Labels:** 1 label
- **Supported Modality:** Text
<!-- - **Training Dataset:** Unknown -->
- **Language:** multilingual
- **License:** apache-2.0

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
- **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)

### Full Model Architecture

```
CrossEncoder(
  (0): Transformer({'transformer_task': 'sequence-classification', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'logits'}}, 'module_output_name': 'scores', 'architecture': 'ModernBertForSequenceClassification'})
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("davanstrien/fineweb-c-quality-reranker-v2")
# Get scores for pairs of inputs
pairs = [
    ["Dadka reer Ukrain ayaa maanta codadkooda ka dhiibtay doorashada madaxtinimada, taasoo uu ku guuleystay nin majaajiliista ah oo aanan laheyn khibrad siyaasadeed.\nNatiijooyinka hordhaca ah ayaa muujineya in Volodymyr Zelenskiy oo horay u jilay musalsal TV-ga laga daawaday oo uu ku matalay madaxweyne mala'awaal ah uu ka guuleysanayo madaxweynaha talada haya Petro Poroshenko.\nCodadka doorashada wareegga labaad ee la tiriyey dadka codkooda dhiibtay 75% waxay codkooda siiyeen Mr Volodymyr Zelensky.", 'Pekka Toveri: Tilanne Ukrainassa on muuttunut\nPresidentti Volodymyr Zelenskyi on komentanut armeijansa valtaamaan Venäjän miehittämät alueet takaisin. Jos operaatio käynnistyy, sota saavuttaa uuden virstanpylvään: Ukraina muokkaa sen kulkua.\nUkrainan armeija on saanut merkittävän määrän HIMARS-ohjusjärjestelmiä lännen aseapuna. Eilen Yhdysvallat ilmoitti toimittavansa niitä lisää.\nStudiossa selvitettiin pitkän kantaman rakettien roolia Venäjän hyökkäyksen hyytymisessä.\nISTV:n Ukraina-studion asiantuntijavieras oli pääesikunnan ex-tiedustelupäällikkö Pekka Toveri. Toimittaja oli ISTV:n Antti Virolainen.\nTallenteen kenraalimajuri evp. Pekka Toverin studiohaastattelusta voi katsoa artikkelin yläosasta löytyvältä videolta.'],
    ["कर तिर्नेको लहर\nबागलुङ — पोखरा पुगेर मात्र तिर्नुपर्ने बाध्यता हटेपछि कहरले कर तिर्नेहरू रहरले तिर्न थालेका छन् । जिल्लामा गत भदौदेखि आन्तरिक राजश्व कार्यालय खुलेपछि कर तिर्नेको लहर चलेको हो ।\nएकै वर्षमा करदाताको संख्या दोब्बर बढ्नुको साथै लक्ष्यको ४२ प्रतिशत बढी कर संकलन भएको छ । कार्यालय प्रमुख हेमराज सुवेदीका अनुसार बागलुङमा चालु वर्षको पहिलो चार महिनामा मात्र १२ हजार करदाता सूचिकृत भएका छन् । गत बर्षको भदौमा करदाता सेवा कार्यालयबाट बढुवा भएर आन्तरिक राजश्व कार्यालय बनेकोमा १८ हजार ३ सय संस्थागत करदाता छन् । त्यस्तै १९ हजार १ सय जना व्यक्तिगत प्यान नम्बर लिएर कर तिर्न लागेको उनले बताए ।\nकर तिर्नेले पनि नजिकमा सेवा पाएको बताए । 'प्यान नम्बर लिन र कर तिर्न पोखरा जानु पर्थ्यो, अहिले यहीं सेवा पाईयो,' जैमिनी नगरपालिका–१ की पुष्पा आचार्यले भनिन्, 'गाउँका साना करदाता समूह मिलाएर सदरमुकाम आउने गरेको छन् ।' सेवाग्राहीमै जागरण आएपछि गत बर्ष ५१ करोड २४ लाख रुपैयाँ कर संकलन गर्ने लक्ष्य राखेको कार्यालयले ४२ प्रतिशत बढी संकलन गरेको थियो ।\nगत वर्ष ६८ करोड १८ लाख कर संकलन भएको थियो । चालु बर्ष उक्त करमा ४१ प्रतिशत वृद्धि गरेर ९६ करोड ५४ लाख संकलन गर्ने लक्ष्य राखिएको छ । 'कर तिर्नुपर्छ भन्ने बुझाउन सकियो भने करदाता र करको दायरा आँफै बढ्ने रहेछ' सुवेदीले भने, 'चालु बर्षको पहिलो चार महिनामा पनि हामीले लक्ष्यको ५० प्रतिशत बढी कर संकलन गरिसकेका छौं ।' चार महिनाका लागि राखिएको २४ करोड ५८ लाख करको लक्ष्यमा ३५ करोड ५ लाख संकलन भइसकेको उनले बताए ।\nउत्कृष्ठ करदातालाई पुरस्कृत गर्ने, सबै स्थानीय तहमा उद्योग बाणिज्य संघको सहकार्यमा कर शिक्षा संचालन गर्ने र साझेदारीमा काम गर्ने अभियान चलाएपछि कर तिर्नेको लर्को लागेको कर अधिकृत सुन्दर श्रेष्ठले बताए । बागलुङ उद्योग बाणिज्य संघले कर्मचारी खटाएर करदातालाई फारम भर्न लगाउने र प्रक्रियाबारे बुझाउन थालेको छ । 'कार्यालयबाट आग्रह भएपछि हेल्पडेक्स राखेर काम थालेका छौं,' संघका अध्यक्ष युवराज राजभण्डारीले भने, 'करदाता र व्यवसायीलाई यसले थप सहयोग मिलेको छ ।'प्रकाशित : मंसिर २, २०७६ १०:५४", "काठमाडौं, माघ १५ ।प्रत्येक वर्ष पौषशुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना विधिपूर्वक गरिने श्री स्वस्थानी व्रत एवं माघस्नान आजदेखि सुरु भएको छ।\nपौष शुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना स्वस्थानी व्रत र माघ स्नान गरिन्छ। पौषशुक्ल चतुर्दशीको दिन हात गोडाका नङ काटी स्नान गरी शुद्ध वस्त्र पहिरिएर यसको सुरुवात हुन्छ।\nबिहान माघ स्नान गरी नित्य मध्याह्नकालमा महादेवको पूजा गरिन्छ । बेलुकी स्कन्द पुराणको केदार खण्डअन्तर्गत माघ माहात्म्यको कुमार अगस्त्यबीच संवाद भएको स्वस्थानी व्रत कथा सुन्ने सुनाउने परम्परा छ।\nस्वस्थानी देवीको विधिपूर्वक व्रत गरेमा बिछोड भएका जोडीको पुनर्मिलन हुन्छ भन्ने धार्मिक विश्वास छ । रोग ब्याध लागेको भए ठीक हुने र पति वा पत्नीका रुपमा कसैलाई इच्छाएको भए प्राप्त हुने कथासमेत नेपाली समुदायमा प्रचलित छ।\nसत्य युगमा हिमालय पर्वतकी पुत्री पार्वतीले महादेवलाई पति पाऊँ भनी विष्णुको निर्देशानुसार स्वस्थानीको व्रत गरेको कथा स्वस्थानीमा वर्णन गरिएको छ । व्रतपछि बिछोडमा परेका नाग नागिनीको समेत पुनर्मिलन भएको कथामा उल्लेख छ।\nगोमा ब्राह्मणीले सप्तऋषिले सिकाएको व्रतविधिअनुसार व्रत गर्दा पुत्र वियोगबाट मुक्ति मिलेको र व्रतकै प्रभावले छोरा नवराज लावण्य देश अहिलेको साँखु क्षेत्रको राजा भएको कथासमेत स्वस्थानीमा वर्णन गरिएको साँखुको ऐतिहासिक, धार्मिक, पुरातात्विक, सांस्कृतिक र पर्यटकीय विषयमा अनुसन्धानरत इतिहासकार प्रकाश श्रेष्ठ 'सक्व' ले जानकारी दिए।\nयसैबीच आजदेखि काठमाडौंको साँखुमा रहेको शालिनदीमा माघस्नानसहित माधवनारायणको मेला सुरु भएको छ। प्राचीनकालदेखि लाग्दै आएको मेलामा यस वर्ष भने कोरोनाका कारण धेरै चहलपहल नहुने श्रेष्ठले बताए।\nव्रतालुका लागि साँखुमा रहेको शालिनदीमा सम्पूर्ण तयारी पूरा गरिएको श्री माधवनारायण स्वस्थानी व्रत तथा शालीनदी सुधार समितिका अध्यक्ष मीजेन्दकाजी श्रेष्ठले जानकारी दिए। यस वर्ष माघ १५ गतेदेखि फागुन १५ गतेसम्म शालीनदीमा मेला लाग्दै छ।\nविगत वर्षमा करिब ४०० ले माधवनारायण व्रत गर्ने गरेका थिए। यस वर्ष भने ४९ लाई मात्र स्वास्थ्य सुरक्षाका विधि अपनाएर सुरक्षितार्थ राख्ने समितिले जनाएको छ। महिला ३५ र पुरुष १४ गरी ४९ जना यसपटक व्रतमा सहभागी भएका छन्। विगत वर्षमा जस्तो मेला भने यसपटक नलाग्ने समितिले जनाएको छ।"],
    ['Antoine Henri Becquerel\nAntoine Henri Becquerel (* 15. Dezember 1852 in Paris; † 25. August 1908 in Le Croisic, Département Loire-Atlantique) weer en franzöösch Physiker. He kreeg 1903 gemeensam mit Marie un Pierre Curie den Nobelpries för Physik för dat Opdecken van de Radioaktivität. Sien Vader weer Alexandre Edmond Becquerel, de Opdecker van den photoelektrischen Effekt.\nInholtsverteken\nLeven un Wark[ännern | Bornkood ännern]\nHenri Becquerel hett 1872 bit 1874 an de École Polytechnique studeert. 1874 hett he Lucie Jamin heiraadt. Ut disse Verbinnen stammt as Söhn de Physiker Jean Becquerel. Van 1874 bit 1877 hett Becquerel sien Studium an de École des Ponts et Chaussées fortsett. Dornah fung sien akademische Karriere as Assistent an de École polytechnique an, van de he 1895 deren Lehrstohl för Physik kreeg. Nahdem sien Ehefru storven weer, hett he 1890 Louise Lorieux heiraadt. 1896 hett Becquerel mit de Phosphoreszenz van Uransolten experimenteert. Nahdem he up eenige in en dunkeln Ruum ünnerbrocht Präparate en Fotoplaat leggt harr, hett he an\'n 1. März 1896 faststellt, dat de Plaat swaart wurrn weer, ofschons tovör kien Lucht infallen kunn, dat de Uransolten to Phosphoreszenz harrn anregen kunn. Dat weer en Henwies dorup, dat dat en Strahlung gifft, de nich to dat Spektrum van dat sichtbar Lucht hörrt – disse Strahlung hett Becquerel as Uranstrahlen betekent. Ähnliche Eegenschapen wiesen ok de kört vörher opdeckt Röntgenstrahlen un de Kathodenstrahlen up. Becquerel harr mit dissen Versöök de Radioaktivität opdeckt. 1900 hett he bi wiederen Forschungen nahwiest, dat de ut den Atomkarn rutwieken flinken Elektronen (β-Strahlung) magnetisch aflenkbar sünd.\nEhrungen[ännern | Bornkood ännern]\n- 1900 wurr hüm de Rumford-Medaille van de Royal Society verleeht, in de he an\'n 4. Juni 1908 upnommen wurr.\n- 1903 deel sück Becquerel den Nobelpries för Physik mit de franzöösch Physikern Pierre Curie un Marie Curie för hör Arbeit to de Radioaktivität. He kreeg den Pries "als Anerkennung des außerordentlichen Verdienstes, das er durch die Entdeckung der spontanen Radioaktivität erworben hat."\n- 1905 kreeg he de Barnard-Medaille.\n- Nah hüm wurr de Maateenheit Becquerel för de Radioaktivität nömmt.\n- 1970 wurr de Maandkrater Becquerel nah hüm nömmt.\n- 1973 wurr de Marskrater Becquerel nah hüm nömmt.\n- 1996 wurr de Asteroid (6914) Becquerel nah hüm nömmt.[2]\nBecquerel weer Liddmaat van mehreren wetenschaplichen Akademien. Siet 1904 hörr he de Preußische Akademie van de Wetenschapen as korrespondeeren Liddmaat an,[3] siet 1905 de National Academy of Sciences as utwärtig Liddmaat (Foreign Associate). 1902 wurr he wählt Liddmaat van de American Philosophical Society.\nSchriften (Utwahll)[ännern | Bornkood ännern]\n- Sur les radiations émises par phosphorescence. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 420–421 (online).\n- Sur les radiations invisibles émises par les corp s phosphorescents. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 501–503 (online).\n- Sur quelquer propriétés nouvelles des radiations invisibles émises par divers corps phosphorescents. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 559–564 (online).\n- Sur les radiations invisibles émises par les sels d\'uranium. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 689–694 (online).\n- Sur les propriétés différentes des radiations invisibles émises par les sels d\'uranium, et du rayonnement de la paroi anticathodique d\'un tube de Crookes. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 762–767 (online).\n- Émission de radiation nouvelles par l\'uranium métallique. In: Comptes Rendus de l\'Académie des sciences. Band 122, 1896, S. 1086–1088 (online).\n- Sur diverses propriétés des rayons uraniques. In: Comptes Rendus de l\'Académie des sciences. Band 123, 1896, S. 1086–1088 (online).\n- Recherches sur les rayons uraniques. In: Comptes Rendus de l\'Académie des sciences. Band 124, 1897, S. 438–444 (online).\n- Sur la loi de la décharge dans l\'air de l\'uranium électrisé. In: Comptes Rendus de l\'Académie des sciences. Band 124, 1897, S. 800–803 (online).\n- Influence d\'un champ magnétique sur le rayonnement des corps radio-actifs. In: Comptes Rendus de l\'Académie des sciences. Band 129, 1899, S. 996–1001 (online).\n- Sur le rayonnement de l\'uranium et sur diverses proprietes physiques du rayonnement des corps radio-actifs. In: Rapports présentés au Congrès international de physique réuni à Paris en 1900 sous les auspices de la Société française de physique. Band 3, Gauthier-Villars, Paris 1900, S. 47–78.\n- Recherches sur une Propriete Nouvelle de la Matiere. = Memoires de l\'Academie des Sciences. Band 46, Fermin-Didot, Paris 1903 (online).\nLiteratur[ännern | Bornkood ännern]\n- André Allisy: Henri Becquerel: The Discovery of Radioactivity. In: Radiation Protection Dosimetry. Band 68, Nummer 1–2, 1996, S. 3–10 (online).\n- Lawrence Badash: Becquerel\'s Blunder. In: Social Research. Band 72, Nummer 1, 2005, S. 31–62 (Vörlaag:JSTOR).\n- Klaus Hentschel: Becquerel, Antoine Henri. In: Werner E. Gerabek, Bernhard D. Haage, Gundolf Keil, Wolfgang Wegner (Hrsg.): Enzyklopädie Medizingeschichte. De Gruyter, Berlin/ New York 2005, ISBN 3-11-015714-4, S. 158 f.\n- Alfred Romer: Becquerel, [Antoine-] Henri. In: Complete Dictionary of Scientific Biography. Band 1, Charles Scribner\'s Sons, Detroit 2008, S. 558–561 (online).\n- Susanne Eckelmann: [2] Antoine Henri Becquerel in dat LEMO\n- Becquerel up de Sieden van den Nobelpries (engelsch)\n- Indrag to Becquerel up de Sieden van de Royal Society (engelsch)\nEnkeld Nahwiesen[ännern | Bornkood ännern]\n- knerger.de: Das Grab von Henri Becquerel\n- Minor Planet Circ. 27332\n- Berlin-Brandenburgische Akademie der Wissenschaften: [1] Mitglieder der Vorgängerakademien, Antoine-Henri Becquerel, afropen an\'n 19. Februar 2015', 'Kaum ääner von us glääwt haut noch an dat Märchen vonnem Herrgott, wo sein äänzijen Sunn óff de bockelisch Welt schéckt, fer de greilich Minschen von ihre "Schandtaten" zu erleesen, éndäm der sich an\'t Kreiz schlääen lisst. Dò hätt et fer e Gott doch anner Meechlichkääten génn. De anneren Religionen schiddeln iwwer so en Onverstand nur de Kopp…\nAwwer der Gedanken, et Bild vo Weihnachten éss trotzdem scheen. Mir, héij én Europa, wo mer (noch) Joareszeiten hann, hann de Herrgottsgeburt én de kalte Wénter verlaat, én e Schopp, én Stroh, bei\'t Véih – damét ma alles herrichten kónnten, die Hämlichkäät, wo ma fer so e Feschd brauch, fer all die dausend Krippcher, wo ma basteln ónn bewónnern móss. Heimat móss sénn, aach wenn se honnertmò nét stémmt. Kréschdbäämcher? Schnee? Rendiere mét rode Naasen? Iwwerall barmherzisch Minschen? Iwwerall Keeniche mét Geschenkern fer arm Eltern mét hongrisch Kénnern?\nRobert Antelme, e franseesicher Resistance-Kämpfer ónn KZ-Häftling én Buchenwald ónn Dachau, hat in seinem Buch "L\'espèce humaine" (Das Menschengeschlecht, 1947) iwwer Weihnachten 1944 in Gandersheim nur verzehlen kénnen, et hätt als "Sonderration" e béssjen Nachschlach an Hackflääsch génn, awwer nét dän Appel, wo innen versproch génn woar. Awwer an däm Daach brauchten se wenichdens nét schaffen ze gehn. An däm Owend hann se all óm de Bollerówen rom gesääß ónn von ihrem Hemm, von der Fraa, von de Kennern gedräämt. Von ihren Häälisch Famillen.\nGérard Carau lebt im moselfränkischen Beckingen.'],
    ['Nummer\nA nummer is a mathematical object uised tae coont, label, an measur. In mathematics, the defineetion o nummer haes been extendit ower the years tae include such nummers as 0, negative nummers, rational nummers, irrational nummers, an complex nummers.\nMathematical operations are certain procedurs that tak ane or mair nummers as input an produce a nummer as ootput. Unary operations tak a single input nummer an produce a single ootput nummer. For example, the successor operation adds 1 tae an integer, thus the successor o 4 is 5. Binary operations tak twa input nummers an produce a single ootput nummer. Examples o binary operations include addeetion, subtraction, multiplication, diveesion, an exponentiation. The study o numerical operations is cried arithmetic.\nA notational seembol that represents a nummer is cried a numeral. In addeetion tae thair uise in coontin an measurin, numerals are eften uised for labels (telephone nummers), for orderin (serial nummers), an for codes (e.g., ISBNs).\nIn common uisage, the wird nummer can mean the abstract object, the seembol, or the wird for the nummer.', 'Quick Search\nCategories\nInformation\nThis is help page you can edit this in your admin area below is some example text Lorem ipsum dolor sit amet, consectetur adipiscing elit. Fusce mattis magna eu risus dapibus vitae porta magna vulputate. Nullam facilisis, ligula eget vulputate molestie, purus nibh tincidunt dolor, eget convallis massa nibh a velit. Curabitur at urna a eros convallis venenatis. Donec erat arcu, consectetur quis tristique sed, rhoncus sit amet est. Nam semper pellentesque metus, ut pretium mi varius eu. Sed feugiat rutrum velit et sagittis. Donec nisl leo, vestibulum ut eleifend id, consequat at dolor. Nullam rhoncus luctus neque, nec eleifend ipsum suscipit at. Donec in lectus dignissim dui dignissim imperdiet quis non diam. Praesent lectus lorem, auctor sit amet adipiscing tempor, consequat non libero. Vestibulum vel rhoncus odio. Cras consequat dui sit amet lorem laoreet volutpat. Curabitur luctus fringilla egestas. Fusce lobortis purus id lacus viverra quis tincidunt leo sagittis. Nulla cursus laoreet libero ut malesuada. Integer faucibus ligula in nisl ultrices nec vulputate quam vestibulum. Suspendisse tortor nisl, convallis non condimentum sit amet, feugiat in velit. Aliquam erat volutpat.\nUt sed erat quis turpis vulputate placerat et et nibh. Aenean consequat diam libero, a adipiscing eros. Praesent congue urna blandit purus tristique a tincidunt leo malesuada. Vestibulum et justo urna. Donec luctus purus venenatis urna laoreet varius. Etiam sit amet urna molestie turpis imperdiet fringilla quis at tortor. Fusce nec mauris sapien. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed ac tincidunt lorem. Vestibulum vel orci et dolor laoreet laoreet. Vivamus ut nunc nunc, vel hendrerit velit. Nunc a libero at dui posuere molestie. Cras ullamcorper, ante vel dapibus commodo, magna nulla interdum mi, ac pellentesque lectus quam ac felis. Vestibulum lacus velit, bibendum eget tristique eu, venenatis in risus. Vestibulum sodales urna nec mauris consectetur pretium. Suspendisse sed justo non turpis suscipit ornare. Nulla in odio nunc, eget porttitor velit.'],
    ['Tervetuloa rakennerahastot.fi-sivuston Länsi-Suomen osioon. Täältä löydät tietoa EU:n alue- ja rakennepolitiikan ohjelmakauden 2021–2027 ajankohtaisista asioista, rahoitettavien kehittämistoimien maakunnallisista painopisteistä sekä rahoituksen hakemisesta Länsi-Suomessa.\nSeAMK kestävää kasvua tukemassa: case Nordic Digital Creations Oy\nYrittäjähenkisyys on vahvasti läsnä kaikessa Seinäjoen ammattikorkeakoulun toiminnassa. Yrittäjyyteen liittyviä hankkeita on jatkuvasti käynnissä useita, mutta vihreän siirtymän ajankohtaisuus ja kriittisyys loivat tarpeen suunnitella hanke, jossa keskitytään yritysten kestävän kasvun edistämiseen.\nämän vuoksi toteutettiin EAKR-rahoitteinen GreenGrow – pk-yritysten vihreän ja inklusiivisen kasvun tukeminen Etelä-Pohjanmaalla -hanke, jonka tavoitteena on ollut vauhdittaa eteläpohjalaisten pk-yritysten vihreää ja inklusiivista kasvua tukemalla yritysten TKI-toimintaa ja yhteistyöverkostoja. Tätä tavoitetta varten kehitettiin toimintamalli, jota testattiin kuuden kestävästä kehityksestä kiinnostuneen yrityksen kanssa.\nYhdeksi pilottiyritykseksi lähti mukaan Nordic Digital Creations Oy, digitaalisia palveluita tarjoava tuore yritys. Digisihteerit-nimellä toimiva yritys on erikoistunut pienyrityksille tarjottaviin sihteeri- ja assistenttipalveluihin. Yrityksen tavoitteena on helpottaa pienyrittäjien arkea ja mahdollistaa yrittäjän tehokas ja tuottava ajankäyttö. Tällä hetkellä yritys suunnittelee kokonaisvaltaista sosiaalisen median hallinnointipalvelua, jota käyttämällä asiakasyritys voi ulkoistaa sosiaalisen median kautta tapahtuvan myynnin ja markkinoinnin täysin. Yritys työllistää tällä hetkellä yrityksen perustajan ja toimitusjohtajan Jenni Kähkösen lisäksi kolme vakituista työntekijää sekä freelancereita. Lisää kasvua on todennäköisesti tiedossa tulevaisuudessa, koska yrittäjien tarve some-markkinoinnin asiantuntija-avulle kasvaa jatkuvasti.\nTäsmäajoitus uuden yrityksen kannalta\nGreenGrow-hanke tulikin erinomaiseen aikaan vasta perustetun yrityksen kannalta, sillä pilotoinnissa yritys pääsi testaamaan ja yhteiskehittämään asiantuntijoiden kanssa hankkeen työkaluja. Tämä auttoi sekä uuden palvelukonseptin hiomisessa että laajemmin omien vahvuuksien ja kehittämiskohteiden tarkastelussa. Pilotointi oli yrityksille ilmainen, ja se kerrytti yrityksille de minimis -tukea.\nKuvassa: Toimitusjohtaja Jenni Kähkönen (vas.) ja toimistopäällikkö Aletta Kuru (oik.)\nKähkönen kertoo olleensa tyytyväinen pilotointiprosessiin.\n"Tämä oli mukava prosessi; oli hienoa olla mukana ideoimassa ja miettimässä syvällisemmin tätä koko palvelua erilaisista näkökulmista", Kähkönen kertoo.\nEnsimmäisessä työpajassa testattiin tutkimus-, kehittämis- ja innovointitoiminnan arviointityökalua, jonka tavoitteena on konkretisoida yrityksen vahvuuksia ja kehittämiskohteita. Toinen työpaja keskittyi uuden palvelukonseptin ideointiin ja suunnitteluun Innovaatiocanvas-työkalun avulla.\n"Kyllä kaikki nämä työkalut, joita on testattu, ovat toimineet hyvin. Tämähän on tosi hyvä prosessi palvelujen kehittämiseen", Kähkönen pohtii.\nHänen mukaansa työpajatyöskentely oli hyödyllistä erityisesti tuoreen yrityksen kehittämiskohteiden tunnistamisessa.\nYrittäjän kannattaa lähteä rohkeasti mukaan hankkeisiin!\n"Parasta oli se, kun sai uusia näkökulmia. On menty pienellä ryhmällä eteenpäin, ja siksi on aina avartavaa, kun saa näkemyksiä myös ulkopuolelta. Kyllä tämä on herättänyt ajatuksia uudella lailla. Hankkeesta oli hyötyä, ja saamme siitä jatkossakin hyvää pohjaa erilaisten palveluprosessien syvempään kehittämiseen ja pohtimiseen sekä vahvuuksien ja kehityskohteiden havaitsemiseen, Kähkönen kertoo.\nHän kannustaa erityisesti uusia yrittäjiä lähtemään rohkeasti mukaan hankkeisiin.\n"Tuoreena yrittäjänä jää helposti kiertämään kehää omien ajatusten ja toimintaprosessien kanssa. Toisaalta voi myös ajautua innostuksissaan kehittelemään liian monia ideoita yhtäaikaisesti, mutta yhtäkään ei tarpeeksi syvällisesti. On siis tärkeää ja oivalluttavaa saada myös ulkopuolista näkemystä ja kokemusta, jotta välttyisi tällaisilta noidankehiltä."\nKähkönen kannustaa muitakin yrittäjiä osallistumaan hankkeisiin.\n"Suosittelen ehdottomasti lähtemään hankkeisiin mukaan. Se vie vain pienen hetken aikaa, mutta antaa yritykselle arvokasta tietoa ja näkemystä siitä, mihin suuntaan ja miten toimintaa kannattaa lähteä kehittämään kestävästi sekä mihin asioihin on järkevää keskittyä."\nGreenGrow – pk-yritysten vihreän ja inklusiivisen kasvun tukeminen Etelä-Pohjanmaalla – hanke (1.8.2021 – 31.8.2023) rahoitetaan REACT-EU-välineen määrärahoista osana Euroopan unionin COVID-19-pandemian johdosta toteuttamia toimia. Rahoitus on saatu Etelä-Pohjanmaan liitolta.\nHanketiedot\nHankkeen nimi: GreenGrow – pk-yritysten vihreän ja inklusiivisen kasvun tukeminen Etelä-Pohjanmaalla\nToteuttaja: Seinäjoen ammattikorkeakoulu Oy\nToimintalinja ja erityistavoite: Toimintalinja 8. REACT-EU:n EAKR-toimenpiteet, erityistavoite 12.2. Tutkimus- ja innovaatiotoiminnan kehittäminen erityisesti digitalisaation edistämisen ja yhteiskunnan hiilineutraalisuustavoitteen toteutumisen näkökulmasta\nAika: 1.8.20221–31.8.2023\nMyönnetty EU- ja valtion rahoitus: 180 928 €\nHankekoodi: A77498', 'Kesäyrittäjänä teet itse itsellesi kesätyön. Yrittäjyyden resepti on yksinkertainen: keksi, kokeile ja ole sinnikäs. 4H-yrittäjänä et ole yksin: yrityskurssi tai valmennus auttaa alkuun ja oma yritysohjaajasi tukee ja neuvoo matkan varrella.\nNurmikonleikkuu, seinien maalaus, jäätelönmyynti uimarannalla, kukkien kastelu, taimikonhoito, kahvin keittäminen ja leivonnaisten leipominen ja niiden myynti turisteille, rikkaruohojen kitkeminen, lemmikin ulkoiluttaminen. Kymmenen kilometrin säteellä sinusta on satoja tekemättömiä hommia, jotka odottavat yritteliästä ja oma-aloitteista tyyppiä. Olisiko joku niistä tuleva kesäduunisi?\n4H-yritys on valmis paketti nuorelle, joka haluaa tehdä itse ja kokeilla yrittäjyyttä. Olemme miettineet puolestasi tärkeät rajat, jotta sinä voit keskittyä itse tekemiseen. Tarvittaessa saat apua omalta yritysohjaajaltasi ja 4H-yhdistyksestäsi. Voitte perustaa 4H-yrityksen myös porukalla!\nKokeile reseptiämme: yritä, opi ja tienaa 4H-yrittäjänä jo ensi kesänä!'],
]
scores = model.predict(pairs)
print(scores)
# [2.4726e-03 9.9998e-01 7.5541e-04 2.8896e-03 2.6759e-02]

# Or rank different texts based on similarity to a single text
ranks = model.rank(
    "Dadka reer Ukrain ayaa maanta codadkooda ka dhiibtay doorashada madaxtinimada, taasoo uu ku guuleystay nin majaajiliista ah oo aanan laheyn khibrad siyaasadeed.\nNatiijooyinka hordhaca ah ayaa muujineya in Volodymyr Zelenskiy oo horay u jilay musalsal TV-ga laga daawaday oo uu ku matalay madaxweyne mala'awaal ah uu ka guuleysanayo madaxweynaha talada haya Petro Poroshenko.\nCodadka doorashada wareegga labaad ee la tiriyey dadka codkooda dhiibtay 75% waxay codkooda siiyeen Mr Volodymyr Zelensky.",
    [
        'Pekka Toveri: Tilanne Ukrainassa on muuttunut\nPresidentti Volodymyr Zelenskyi on komentanut armeijansa valtaamaan Venäjän miehittämät alueet takaisin. Jos operaatio käynnistyy, sota saavuttaa uuden virstanpylvään: Ukraina muokkaa sen kulkua.\nUkrainan armeija on saanut merkittävän määrän HIMARS-ohjusjärjestelmiä lännen aseapuna. Eilen Yhdysvallat ilmoitti toimittavansa niitä lisää.\nStudiossa selvitettiin pitkän kantaman rakettien roolia Venäjän hyökkäyksen hyytymisessä.\nISTV:n Ukraina-studion asiantuntijavieras oli pääesikunnan ex-tiedustelupäällikkö Pekka Toveri. Toimittaja oli ISTV:n Antti Virolainen.\nTallenteen kenraalimajuri evp. Pekka Toverin studiohaastattelusta voi katsoa artikkelin yläosasta löytyvältä videolta.',
        "काठमाडौं, माघ १५ ।प्रत्येक वर्ष पौषशुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना विधिपूर्वक गरिने श्री स्वस्थानी व्रत एवं माघस्नान आजदेखि सुरु भएको छ।\nपौष शुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना स्वस्थानी व्रत र माघ स्नान गरिन्छ। पौषशुक्ल चतुर्दशीको दिन हात गोडाका नङ काटी स्नान गरी शुद्ध वस्त्र पहिरिएर यसको सुरुवात हुन्छ।\nबिहान माघ स्नान गरी नित्य मध्याह्नकालमा महादेवको पूजा गरिन्छ । बेलुकी स्कन्द पुराणको केदार खण्डअन्तर्गत माघ माहात्म्यको कुमार अगस्त्यबीच संवाद भएको स्वस्थानी व्रत कथा सुन्ने सुनाउने परम्परा छ।\nस्वस्थानी देवीको विधिपूर्वक व्रत गरेमा बिछोड भएका जोडीको पुनर्मिलन हुन्छ भन्ने धार्मिक विश्वास छ । रोग ब्याध लागेको भए ठीक हुने र पति वा पत्नीका रुपमा कसैलाई इच्छाएको भए प्राप्त हुने कथासमेत नेपाली समुदायमा प्रचलित छ।\nसत्य युगमा हिमालय पर्वतकी पुत्री पार्वतीले महादेवलाई पति पाऊँ भनी विष्णुको निर्देशानुसार स्वस्थानीको व्रत गरेको कथा स्वस्थानीमा वर्णन गरिएको छ । व्रतपछि बिछोडमा परेका नाग नागिनीको समेत पुनर्मिलन भएको कथामा उल्लेख छ।\nगोमा ब्राह्मणीले सप्तऋषिले सिकाएको व्रतविधिअनुसार व्रत गर्दा पुत्र वियोगबाट मुक्ति मिलेको र व्रतकै प्रभावले छोरा नवराज लावण्य देश अहिलेको साँखु क्षेत्रको राजा भएको कथासमेत स्वस्थानीमा वर्णन गरिएको साँखुको ऐतिहासिक, धार्मिक, पुरातात्विक, सांस्कृतिक र पर्यटकीय विषयमा अनुसन्धानरत इतिहासकार प्रकाश श्रेष्ठ 'सक्व' ले जानकारी दिए।\nयसैबीच आजदेखि काठमाडौंको साँखुमा रहेको शालिनदीमा माघस्नानसहित माधवनारायणको मेला सुरु भएको छ। प्राचीनकालदेखि लाग्दै आएको मेलामा यस वर्ष भने कोरोनाका कारण धेरै चहलपहल नहुने श्रेष्ठले बताए।\nव्रतालुका लागि साँखुमा रहेको शालिनदीमा सम्पूर्ण तयारी पूरा गरिएको श्री माधवनारायण स्वस्थानी व्रत तथा शालीनदी सुधार समितिका अध्यक्ष मीजेन्दकाजी श्रेष्ठले जानकारी दिए। यस वर्ष माघ १५ गतेदेखि फागुन १५ गतेसम्म शालीनदीमा मेला लाग्दै छ।\nविगत वर्षमा करिब ४०० ले माधवनारायण व्रत गर्ने गरेका थिए। यस वर्ष भने ४९ लाई मात्र स्वास्थ्य सुरक्षाका विधि अपनाएर सुरक्षितार्थ राख्ने समितिले जनाएको छ। महिला ३५ र पुरुष १४ गरी ४९ जना यसपटक व्रतमा सहभागी भएका छन्। विगत वर्षमा जस्तो मेला भने यसपटक नलाग्ने समितिले जनाएको छ।",
        'Kaum ääner von us glääwt haut noch an dat Märchen vonnem Herrgott, wo sein äänzijen Sunn óff de bockelisch Welt schéckt, fer de greilich Minschen von ihre "Schandtaten" zu erleesen, éndäm der sich an\'t Kreiz schlääen lisst. Dò hätt et fer e Gott doch anner Meechlichkääten génn. De anneren Religionen schiddeln iwwer so en Onverstand nur de Kopp…\nAwwer der Gedanken, et Bild vo Weihnachten éss trotzdem scheen. Mir, héij én Europa, wo mer (noch) Joareszeiten hann, hann de Herrgottsgeburt én de kalte Wénter verlaat, én e Schopp, én Stroh, bei\'t Véih – damét ma alles herrichten kónnten, die Hämlichkäät, wo ma fer so e Feschd brauch, fer all die dausend Krippcher, wo ma basteln ónn bewónnern móss. Heimat móss sénn, aach wenn se honnertmò nét stémmt. Kréschdbäämcher? Schnee? Rendiere mét rode Naasen? Iwwerall barmherzisch Minschen? Iwwerall Keeniche mét Geschenkern fer arm Eltern mét hongrisch Kénnern?\nRobert Antelme, e franseesicher Resistance-Kämpfer ónn KZ-Häftling én Buchenwald ónn Dachau, hat in seinem Buch "L\'espèce humaine" (Das Menschengeschlecht, 1947) iwwer Weihnachten 1944 in Gandersheim nur verzehlen kénnen, et hätt als "Sonderration" e béssjen Nachschlach an Hackflääsch génn, awwer nét dän Appel, wo innen versproch génn woar. Awwer an däm Daach brauchten se wenichdens nét schaffen ze gehn. An däm Owend hann se all óm de Bollerówen rom gesääß ónn von ihrem Hemm, von der Fraa, von de Kennern gedräämt. Von ihren Häälisch Famillen.\nGérard Carau lebt im moselfränkischen Beckingen.',
        'Quick Search\nCategories\nInformation\nThis is help page you can edit this in your admin area below is some example text Lorem ipsum dolor sit amet, consectetur adipiscing elit. Fusce mattis magna eu risus dapibus vitae porta magna vulputate. Nullam facilisis, ligula eget vulputate molestie, purus nibh tincidunt dolor, eget convallis massa nibh a velit. Curabitur at urna a eros convallis venenatis. Donec erat arcu, consectetur quis tristique sed, rhoncus sit amet est. Nam semper pellentesque metus, ut pretium mi varius eu. Sed feugiat rutrum velit et sagittis. Donec nisl leo, vestibulum ut eleifend id, consequat at dolor. Nullam rhoncus luctus neque, nec eleifend ipsum suscipit at. Donec in lectus dignissim dui dignissim imperdiet quis non diam. Praesent lectus lorem, auctor sit amet adipiscing tempor, consequat non libero. Vestibulum vel rhoncus odio. Cras consequat dui sit amet lorem laoreet volutpat. Curabitur luctus fringilla egestas. Fusce lobortis purus id lacus viverra quis tincidunt leo sagittis. Nulla cursus laoreet libero ut malesuada. Integer faucibus ligula in nisl ultrices nec vulputate quam vestibulum. Suspendisse tortor nisl, convallis non condimentum sit amet, feugiat in velit. Aliquam erat volutpat.\nUt sed erat quis turpis vulputate placerat et et nibh. Aenean consequat diam libero, a adipiscing eros. Praesent congue urna blandit purus tristique a tincidunt leo malesuada. Vestibulum et justo urna. Donec luctus purus venenatis urna laoreet varius. Etiam sit amet urna molestie turpis imperdiet fringilla quis at tortor. Fusce nec mauris sapien. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed ac tincidunt lorem. Vestibulum vel orci et dolor laoreet laoreet. Vivamus ut nunc nunc, vel hendrerit velit. Nunc a libero at dui posuere molestie. Cras ullamcorper, ante vel dapibus commodo, magna nulla interdum mi, ac pellentesque lectus quam ac felis. Vestibulum lacus velit, bibendum eget tristique eu, venenatis in risus. Vestibulum sodales urna nec mauris consectetur pretium. Suspendisse sed justo non turpis suscipit ornare. Nulla in odio nunc, eget porttitor velit.',
        'Kesäyrittäjänä teet itse itsellesi kesätyön. Yrittäjyyden resepti on yksinkertainen: keksi, kokeile ja ole sinnikäs. 4H-yrittäjänä et ole yksin: yrityskurssi tai valmennus auttaa alkuun ja oma yritysohjaajasi tukee ja neuvoo matkan varrella.\nNurmikonleikkuu, seinien maalaus, jäätelönmyynti uimarannalla, kukkien kastelu, taimikonhoito, kahvin keittäminen ja leivonnaisten leipominen ja niiden myynti turisteille, rikkaruohojen kitkeminen, lemmikin ulkoiluttaminen. Kymmenen kilometrin säteellä sinusta on satoja tekemättömiä hommia, jotka odottavat yritteliästä ja oma-aloitteista tyyppiä. Olisiko joku niistä tuleva kesäduunisi?\n4H-yritys on valmis paketti nuorelle, joka haluaa tehdä itse ja kokeilla yrittäjyyttä. Olemme miettineet puolestasi tärkeät rajat, jotta sinä voit keskittyä itse tekemiseen. Tarvittaessa saat apua omalta yritysohjaajaltasi ja 4H-yhdistyksestäsi. Voitte perustaa 4H-yrityksen myös porukalla!\nKokeile reseptiämme: yritä, opi ja tienaa 4H-yrittäjänä jo ensi kesänä!',
    ]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

## Evaluation

### Metrics

#### Cross Encoder Classification

* Dataset: `fineweb_c_eval`
* Evaluated with [<code>CrossEncoderClassificationEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderClassificationEvaluator)

| Metric                | Value      |
|:----------------------|:-----------|
| accuracy              | 0.9229     |
| accuracy_threshold    | 0.8105     |
| f1                    | 0.7368     |
| f1_threshold          | 0.646      |
| precision             | 0.72       |
| recall                | 0.7545     |
| **average_precision** | **0.7714** |

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset

* Size: 9,220 training samples
* Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
* Approximate statistics based on the first 100 samples:
  |          | anchor                                                                                | text                                                                                 | label                                                          |
  |:---------|:--------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:---------------------------------------------------------------|
  | type     | string                                                                                | string                                                                               | float                                                          |
  | modality | text                                                                                  | text                                                                                 |                                                                |
  | details  | <ul><li>min: 105 tokens</li><li>mean: 471.79 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 93 tokens</li><li>mean: 465.51 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.25</li><li>max: 1.0</li></ul> |
* Samples:
  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               | text                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | label            |
  |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
  | <code>Bamwe mu bakoresha imbuga nkoranyambaga muri Uganda ubu bari gukwirakwiza ku bwinshi amafoto abagaragaza bicaye ku dutebe bigana uko wabo Yoweri Museveni, yagaragaye kuwa Kabiri na we yiyicariye ku muhanda avugira kuri telefoni.<br>Perezida Museveni yagaragaye ku muhanda uri mu gace ka Kyeirumba kari mu Karere ka Isingiro ariho avugira kuri telefoni ubwo yari akubutse mu birori byo kwizihiza umunsi mpuzamahanga w'imiturire.<br>Ikinyamakuru Chimpreports cyandikirwa muri Uganda, cyanditse ko icyo gihe Perezida Museveni yasabye abamurinda kumukurira mu modoka intebe igendanwa n'akameza maze yicara ku ruhande rw'umuhanda aho ngo yavugiye kuri telefoni hafi iminota 30.<br>— Thee Trend Setter ™ (@xtiandela) July 12, 2016<br>Ubu ikigezweho ku bakoresha imbuga nkoranyambaga zirimo Twitter, Facebook na Instagram muri Uganda ndetse no muri Kenya, ni uko nabo bari kwigaragaza ku mafoto bavugira kuri telefoni nabo bicaye ku dutebe ku mu handa nk'uko Perezida Museveni nawe yagaragaye, bari gukoresha hashtg ya ...</code> | <code>Mu bikorwa byose birangwa hagati y'abashakanye, kuryoherwa n'imibonano mpuzabitsina, igomba gukorwa byitondewe kuko uburyo ikozwemo ishobora gukomeza cyangwa igahungabanya urukundo hagati y'abakundana.<br>Kimwe mu byiza bituruka muri icyo gikorwa nk'uko ubushakashatsi bwabigaragaje, ni ibyishimo bisangiwe kuruta ibyishimo by'umwe, ariyo mpamvu niba wajyaga ukora imibonano ukumva ntacyo bikumariye, ukwiye kujya wita cyane kuri ibi bintu by'ingenzi tugiye kukugezaho kugirango ubashe kuryoherwa, usangire ibyishimo bibonerwa mu gutera akabariro hamwe n'umufasha wawe.<br>Nta rwitwazo rwo kudatera akabariro rukwiye kubarangwamo<br>Ugomba kureka no guhagarika impamvu zose zidafatika wifashisha urwanya ko mwatera akabariro, muri zo twavuga nko kwitwaza ko urwaye umutwe, umunaniro n'ibindi. Imibonano mpuzabitsina irwanya umunaniro, ikavura umutwe ndetse ikavura n'ububabare. Ikindi twavuga aha iyo wirinze urwitwazo rwose rudafatika rwatuma mudatera akabariro uba urinze umufasha wawe kuguca inyuma cyangwa...</code> | <code>1.0</code> |
  | <code>Таке вимірювання в 1881 р провів американський фізик Альберт Майкельсон (1852-1931) за допомогоюсконструйованого ним приладу. Результат був вражаючим. До свого превеликий подив, ні в одному напрямку компаса він не виявив різниці в швидкості, з якою світло проходило певні відстані. Це було схоже на те, як якщо б пасажири автомобіля, що рухається не помічали дме їм в обличчя зустрічного вітру. Більшість фізиків відмовилися вірити результатам досвіду Майкельсона, втім, він і сам їм не дуже довіряв, оскільки використовуваний ним прилад не володів дуже високою точністю. Однак, не виявивши помилок у своєму досвіді, він намагався повторити його. Незабаром він познайомився з професором хімії одного американського університету Едвардом Морлі (1839-1923), і обидва дослідники приступили до спільних експериментів. У 1887 р вони провели знаменитий експеримент Майкельсона – Морлі, що став однією з поворотних точок фізики.<br>Прилад представляв собою систему дзеркал, що направляють світловий пучок в пев...</code>          | <code>Сьогодні ми розберемо, які кольори і як впливають на зовнішнє сприйняття, а точніше, які відтінки повнять фігуру, а які навпаки приховують вагу і об'єм.<br>«Кольори народжують форму предмета», — сказав французький живописець Поль Сезанн і висловив усю суть. Наше око по-різному сприймає кольорову гамму, саме тому стилісти і модельєри ретельно обирають відтінки для своїх шедеврів.<br>Всі ми знаємо про те, що чорний колір візуально робить фігуру стрункішою, а білий — повнить. І це не просто думка пересічних людей, цьому є фізичне пояснення. Ефект залежить від того, чи поглинає колір світлові промені, чи відбиває. Наприклад, речі білого кольору відбивають максимальну кількість світлових променів, які розсіюються у різні боки, через що межа між білим і навколишніми кольорами розмивається, а предмети здаються візуально більшими. А ось чорний, навпаки, поглинає світло, тому його межі здаються чіткішими, а предмет виглядає меншим.<br>Підемо далі. Жовтий, червоний, помаранчевий вибірково відбивають хвил...</code> | <code>0.0</code> |
  | <code>Dändändändänn-dändändändändädädän-dädäddädäädädäädä-dädäädää… Sehän on selvästi James Bondin tunnari jota tuossa tulkitsen. Se alkoi soida päässäni lukiessani juttua teknisistä ongelmista Iranissa sijaitsevissa Natanzin uraaninrikastuslaitoksessa sekä Bushehrin ydinvoimalassa.<br>Iranin ydinlaitokset ovat joutuneet vakavien cyber-iskujen kohteeksi kuluneen vuoden aikana. Syyllinen ongelmiin on huippumoderni Stuxnet-mato, joka turvallisuusasiantuntijoiden mukaan on liian hienostunut ollakseen energiajuomasta ja pizzasta voimansa saavien monniviiksisten teinien autotallissa kyhäämä. Viruksen suunnittelu ja toteutus on vaatinut kymmeniä ihmistyövuosia ja julkinen salaisuus onkin, että se on Israelin ja/tai Yhdysvaltain tiedustelupalveluiden luomus.<br>Stuxnetin tekee poikkeukselliseksi se, että se on kohdistettu erityisesti teollisuusjärjestelmiin ja Iranin tapauksessa uraanin väkevöimistä varten käytettyihin sentrifugeihin. Sentrifuugilla (ikään kuin turboahdettu vatkain) voidaan mm. erottaa e...</code>       | <code>Uusi Fx -kaupankäynnin tuote, joka tunnetaan nimellä Immediate Advantage Review, about Forex -kaupankäyntitekniikan seuraava kehitys . Se on ohjelma, jonka ovat luoneet kaksi ammattimaista valuuttasijoittajaa, John Grace ja Albert Perrie. He ovat yhdistäneet markkina -analyysitietonsa uusimpaan teknologiaan luodakseen tuotteen, joka voi tehdä sinulle paljon rahaa. Instant Edge upon suunniteltu erityisesti kohdentamaan ja löytämään kannattavia kauppamahdollisuuksia. Näin voit saada lähes voiton.<br>Mikä tekee välittömästä reunanarvioinnista niin ainutlaatuisen , about sen alusta. Toisin kuin useimmat Forex -kauppajärjestelmät, tämä alusta upon suunniteltu erityisesti valuuttamarkkinoille sijoittamiseen. Tämän tuotteen luojat ymmärsivät , että monet ihmiset ovat hämmentyneitä osakemarkkinoiden ja valuutanvaihtoteollisuuden välisestä erosta, koska -sääntöjen ja määräysten välillä about suuria eroja. Siellä in monia erilaisia välityspalveluja, mutta vain harvat tarjoavat valuutanvaihtopalvelu...</code>       | <code>0.0</code> |
* Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
  ```json
  {
      "activation_fn": "torch.nn.modules.linear.Identity",
      "pos_weight": 4.998698711395264
  }
  ```

### Evaluation Dataset

#### Unnamed Dataset

* Size: 1,024 evaluation samples
* Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
* Approximate statistics based on the first 100 samples:
  |          | anchor                                                                                | text                                                                                 | label                                                          |
  |:---------|:--------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:---------------------------------------------------------------|
  | type     | string                                                                                | string                                                                               | float                                                          |
  | modality | text                                                                                  | text                                                                                 |                                                                |
  | details  | <ul><li>min: 104 tokens</li><li>mean: 453.09 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 113 tokens</li><li>mean: 462.8 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.12</li><li>max: 1.0</li></ul> |
* Samples:
  | anchor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | text                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | label            |
  |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
  | <code>Dadka reer Ukrain ayaa maanta codadkooda ka dhiibtay doorashada madaxtinimada, taasoo uu ku guuleystay nin majaajiliista ah oo aanan laheyn khibrad siyaasadeed.<br>Natiijooyinka hordhaca ah ayaa muujineya in Volodymyr Zelenskiy oo horay u jilay musalsal TV-ga laga daawaday oo uu ku matalay madaxweyne mala'awaal ah uu ka guuleysanayo madaxweynaha talada haya Petro Poroshenko.<br>Codadka doorashada wareegga labaad ee la tiriyey dadka codkooda dhiibtay 75% waxay codkooda siiyeen Mr Volodymyr Zelensky.</code>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | <code>Pekka Toveri: Tilanne Ukrainassa on muuttunut<br>Presidentti Volodymyr Zelenskyi on komentanut armeijansa valtaamaan Venäjän miehittämät alueet takaisin. Jos operaatio käynnistyy, sota saavuttaa uuden virstanpylvään: Ukraina muokkaa sen kulkua.<br>Ukrainan armeija on saanut merkittävän määrän HIMARS-ohjusjärjestelmiä lännen aseapuna. Eilen Yhdysvallat ilmoitti toimittavansa niitä lisää.<br>Studiossa selvitettiin pitkän kantaman rakettien roolia Venäjän hyökkäyksen hyytymisessä.<br>ISTV:n Ukraina-studion asiantuntijavieras oli pääesikunnan ex-tiedustelupäällikkö Pekka Toveri. Toimittaja oli ISTV:n Antti Virolainen.<br>Tallenteen kenraalimajuri evp. Pekka Toverin studiohaastattelusta voi katsoa artikkelin yläosasta löytyvältä videolta.</code>                                                                                                                                                                                                                                                                                    | <code>0.0</code> |
  | <code>कर तिर्नेको लहर<br>बागलुङ — पोखरा पुगेर मात्र तिर्नुपर्ने बाध्यता हटेपछि कहरले कर तिर्नेहरू रहरले तिर्न थालेका छन् । जिल्लामा गत भदौदेखि आन्तरिक राजश्व कार्यालय खुलेपछि कर तिर्नेको लहर चलेको हो ।<br>एकै वर्षमा करदाताको संख्या दोब्बर बढ्नुको साथै लक्ष्यको ४२ प्रतिशत बढी कर संकलन भएको छ । कार्यालय प्रमुख हेमराज सुवेदीका अनुसार बागलुङमा चालु वर्षको पहिलो चार महिनामा मात्र १२ हजार करदाता सूचिकृत भएका छन् । गत बर्षको भदौमा करदाता सेवा कार्यालयबाट बढुवा भएर आन्तरिक राजश्व कार्यालय बनेकोमा १८ हजार ३ सय संस्थागत करदाता छन् । त्यस्तै १९ हजार १ सय जना व्यक्तिगत प्यान नम्बर लिएर कर तिर्न लागेको उनले बताए ।<br>कर तिर्नेले पनि नजिकमा सेवा पाएको बताए । 'प्यान नम्बर लिन र कर तिर्न पोखरा जानु पर्थ्यो, अहिले यहीं सेवा पाईयो,' जैमिनी नगरपालिका–१ की पुष्पा आचार्यले भनिन्, 'गाउँका साना करदाता समूह मिलाएर सदरमुकाम आउने गरेको छन् ।' सेवाग्राहीमै जागरण आएपछि गत बर्ष ५१ करोड २४ लाख रुपैयाँ कर संकलन गर्ने लक्ष्य राखेको कार्यालयले ४२ प्रतिशत बढी संकलन गरेको थियो ।<br>गत वर्ष ६८ करोड १८ लाख कर संकलन भएको थियो । चालु बर्ष उक...</code>  | <code>काठमाडौं, माघ १५ ।प्रत्येक वर्ष पौषशुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना विधिपूर्वक गरिने श्री स्वस्थानी व्रत एवं माघस्नान आजदेखि सुरु भएको छ।<br>पौष शुक्ल पूर्णिमादेखि माघशुक्ल पूर्णिमासम्म एक महिना स्वस्थानी व्रत र माघ स्नान गरिन्छ। पौषशुक्ल चतुर्दशीको दिन हात गोडाका नङ काटी स्नान गरी शुद्ध वस्त्र पहिरिएर यसको सुरुवात हुन्छ।<br>बिहान माघ स्नान गरी नित्य मध्याह्नकालमा महादेवको पूजा गरिन्छ । बेलुकी स्कन्द पुराणको केदार खण्डअन्तर्गत माघ माहात्म्यको कुमार अगस्त्यबीच संवाद भएको स्वस्थानी व्रत कथा सुन्ने सुनाउने परम्परा छ।<br>स्वस्थानी देवीको विधिपूर्वक व्रत गरेमा बिछोड भएका जोडीको पुनर्मिलन हुन्छ भन्ने धार्मिक विश्वास छ । रोग ब्याध लागेको भए ठीक हुने र पति वा पत्नीका रुपमा कसैलाई इच्छाएको भए प्राप्त हुने कथासमेत नेपाली समुदायमा प्रचलित छ।<br>सत्य युगमा हिमालय पर्वतकी पुत्री पार्वतीले महादेवलाई पति पाऊँ भनी विष्णुको निर्देशानुसार स्वस्थानीको व्रत गरेको कथा स्वस्थानीमा वर्णन गरिएको छ । व्रतपछि बिछोडमा परेका नाग नागिनीको समेत पुनर्मिलन भएको कथामा उल्लेख छ।<br>गोमा ब्राह्मणीले सप्तऋषिले सिकाएको ...</code> | <code>1.0</code> |
  | <code>Antoine Henri Becquerel<br>Antoine Henri Becquerel (* 15. Dezember 1852 in Paris; † 25. August 1908 in Le Croisic, Département Loire-Atlantique) weer en franzöösch Physiker. He kreeg 1903 gemeensam mit Marie un Pierre Curie den Nobelpries för Physik för dat Opdecken van de Radioaktivität. Sien Vader weer Alexandre Edmond Becquerel, de Opdecker van den photoelektrischen Effekt.<br>Inholtsverteken<br>Leven un Wark[ännern \| Bornkood ännern]<br>Henri Becquerel hett 1872 bit 1874 an de École Polytechnique studeert. 1874 hett he Lucie Jamin heiraadt. Ut disse Verbinnen stammt as Söhn de Physiker Jean Becquerel. Van 1874 bit 1877 hett Becquerel sien Studium an de École des Ponts et Chaussées fortsett. Dornah fung sien akademische Karriere as Assistent an de École polytechnique an, van de he 1895 deren Lehrstohl för Physik kreeg. Nahdem sien Ehefru storven weer, hett he 1890 Louise Lorieux heiraadt. 1896 hett Becquerel mit de Phosphoreszenz van Uransolten experimenteert. Nahdem he up eenige in en dunkeln ...</code> | <code>Kaum ääner von us glääwt haut noch an dat Märchen vonnem Herrgott, wo sein äänzijen Sunn óff de bockelisch Welt schéckt, fer de greilich Minschen von ihre "Schandtaten" zu erleesen, éndäm der sich an't Kreiz schlääen lisst. Dò hätt et fer e Gott doch anner Meechlichkääten génn. De anneren Religionen schiddeln iwwer so en Onverstand nur de Kopp…<br>Awwer der Gedanken, et Bild vo Weihnachten éss trotzdem scheen. Mir, héij én Europa, wo mer (noch) Joareszeiten hann, hann de Herrgottsgeburt én de kalte Wénter verlaat, én e Schopp, én Stroh, bei't Véih – damét ma alles herrichten kónnten, die Hämlichkäät, wo ma fer so e Feschd brauch, fer all die dausend Krippcher, wo ma basteln ónn bewónnern móss. Heimat móss sénn, aach wenn se honnertmò nét stémmt. Kréschdbäämcher? Schnee? Rendiere mét rode Naasen? Iwwerall barmherzisch Minschen? Iwwerall Keeniche mét Geschenkern fer arm Eltern mét hongrisch Kénnern?<br>Robert Antelme, e franseesicher Resistance-Kämpfer ónn KZ-Häftling én Buchenwald ónn Dachau,...</code>          | <code>0.0</code> |
* Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters:
  ```json
  {
      "activation_fn": "torch.nn.modules.linear.Identity",
      "pos_weight": 4.998698711395264
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `per_device_train_batch_size`: 32
- `num_train_epochs`: 2
- `learning_rate`: 2e-05
- `warmup_steps`: 0.1
- `weight_decay`: 0.01
- `bf16`: True
- `per_device_eval_batch_size`: 64
- `push_to_hub`: True
- `hub_model_id`: davanstrien/fineweb-c-quality-reranker-v2
- `load_best_model_at_end`: True
- `seed`: 12

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `per_device_train_batch_size`: 32
- `num_train_epochs`: 2
- `max_steps`: -1
- `learning_rate`: 2e-05
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: None
- `warmup_steps`: 0.1
- `optim`: adamw_torch_fused
- `optim_args`: None
- `weight_decay`: 0.01
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `optim_target_modules`: None
- `gradient_accumulation_steps`: 1
- `average_tokens_across_devices`: True
- `max_grad_norm`: 1.0
- `label_smoothing_factor`: 0.0
- `bf16`: True
- `fp16`: False
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `use_liger_kernel`: False
- `liger_kernel_config`: None
- `use_cache`: False
- `neftune_noise_alpha`: None
- `torch_empty_cache_steps`: None
- `auto_find_batch_size`: False
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `include_num_input_tokens_seen`: no
- `log_level`: passive
- `log_level_replica`: warning
- `disable_tqdm`: False
- `project`: huggingface
- `trackio_space_id`: None
- `trackio_bucket_id`: None
- `trackio_static_space_id`: None
- `per_device_eval_batch_size`: 64
- `prediction_loss_only`: True
- `eval_on_start`: False
- `eval_do_concat_batches`: True
- `eval_use_gather_object`: False
- `eval_accumulation_steps`: None
- `include_for_metrics`: []
- `batch_eval_metrics`: False
- `save_only_model`: False
- `save_on_each_node`: False
- `enable_jit_checkpoint`: False
- `push_to_hub`: True
- `hub_private_repo`: None
- `hub_model_id`: davanstrien/fineweb-c-quality-reranker-v2
- `hub_strategy`: every_save
- `hub_always_push`: False
- `hub_revision`: None
- `load_best_model_at_end`: True
- `ignore_data_skip`: False
- `restore_callback_states_from_checkpoint`: False
- `full_determinism`: False
- `seed`: 12
- `data_seed`: None
- `use_cpu`: False
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `parallelism_config`: None
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `dataloader_prefetch_factor`: None
- `remove_unused_columns`: True
- `label_names`: None
- `train_sampling_strategy`: random
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `ddp_static_graph`: None
- `ddp_backend`: None
- `ddp_timeout`: 1800
- `fsdp`: []
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `deepspeed`: None
- `debug`: []
- `skip_memory_metrics`: True
- `do_predict`: False
- `resume_from_checkpoint`: None
- `warmup_ratio`: None
- `local_rank`: -1
- `prompts`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: proportional
- `router_mapping`: {}
- `learning_rate_mapping`: {}

</details>

### Training Logs
<details><summary>Click to expand</summary>

| Epoch  | Step | Training Loss | Validation Loss | fineweb_c_eval_average_precision |
|:------:|:----:|:-------------:|:---------------:|:--------------------------------:|
| -1     | -1   | -             | -               | 0.1716                           |
| 0.0035 | 1    | 1.2347        | -               | -                                |
| 0.0208 | 6    | 1.5453        | -               | -                                |
| 0.0415 | 12   | 1.1330        | -               | -                                |
| 0.0623 | 18   | 1.3512        | -               | -                                |
| 0.0830 | 24   | 1.3640        | -               | -                                |
| 0.1038 | 30   | 1.3142        | -               | -                                |
| 0.1246 | 36   | 1.2629        | -               | -                                |
| 0.1453 | 42   | 1.1353        | -               | -                                |
| 0.1661 | 48   | 1.3934        | -               | -                                |
| 0.1869 | 54   | 1.1783        | -               | -                                |
| 0.2007 | 58   | -             | 1.1506          | 0.2253                           |
| 0.2076 | 60   | 1.2396        | -               | -                                |
| 0.2284 | 66   | 1.1510        | -               | -                                |
| 0.2491 | 72   | 1.1545        | -               | -                                |
| 0.2699 | 78   | 1.2084        | -               | -                                |
| 0.2907 | 84   | 1.1823        | -               | -                                |
| 0.3114 | 90   | 1.1707        | -               | -                                |
| 0.3322 | 96   | 0.9403        | -               | -                                |
| 0.3529 | 102  | 1.1831        | -               | -                                |
| 0.3737 | 108  | 1.1537        | -               | -                                |
| 0.3945 | 114  | 1.0772        | -               | -                                |
| 0.4014 | 116  | -             | 1.1264          | 0.2967                           |
| 0.4152 | 120  | 1.0160        | -               | -                                |
| 0.4360 | 126  | 1.1722        | -               | -                                |
| 0.4567 | 132  | 1.0133        | -               | -                                |
| 0.4775 | 138  | 1.0978        | -               | -                                |
| 0.4983 | 144  | 0.9355        | -               | -                                |
| 0.5190 | 150  | 1.1273        | -               | -                                |
| 0.5398 | 156  | 0.8814        | -               | -                                |
| 0.5606 | 162  | 1.0361        | -               | -                                |
| 0.5813 | 168  | 0.9421        | -               | -                                |
| 0.6021 | 174  | 0.9503        | 0.8597          | 0.4518                           |
| 0.6228 | 180  | 0.9766        | -               | -                                |
| 0.6436 | 186  | 1.1067        | -               | -                                |
| 0.6644 | 192  | 1.0229        | -               | -                                |
| 0.6851 | 198  | 0.9341        | -               | -                                |
| 0.7059 | 204  | 0.7538        | -               | -                                |
| 0.7266 | 210  | 1.1375        | -               | -                                |
| 0.7474 | 216  | 1.0365        | -               | -                                |
| 0.7682 | 222  | 0.9019        | -               | -                                |
| 0.7889 | 228  | 1.0598        | -               | -                                |
| 0.8028 | 232  | -             | 0.8322          | 0.5407                           |
| 0.8097 | 234  | 0.7411        | -               | -                                |
| 0.8304 | 240  | 0.7821        | -               | -                                |
| 0.8512 | 246  | 1.0670        | -               | -                                |
| 0.8720 | 252  | 0.6204        | -               | -                                |
| 0.8927 | 258  | 0.9307        | -               | -                                |
| 0.9135 | 264  | 0.7861        | -               | -                                |
| 0.9343 | 270  | 0.9402        | -               | -                                |
| 0.9550 | 276  | 0.7917        | -               | -                                |
| 0.9758 | 282  | 0.9496        | -               | -                                |
| 0.9965 | 288  | 0.8691        | -               | -                                |
| 1.0035 | 290  | -             | 0.7659          | 0.6180                           |
| 1.0173 | 294  | 0.6524        | -               | -                                |
| 1.0381 | 300  | 0.7019        | -               | -                                |
| 1.0588 | 306  | 0.4723        | -               | -                                |
| 1.0796 | 312  | 0.5579        | -               | -                                |
| 1.1003 | 318  | 0.5251        | -               | -                                |
| 1.1211 | 324  | 0.6861        | -               | -                                |
| 1.1419 | 330  | 0.4643        | -               | -                                |
| 1.1626 | 336  | 0.5970        | -               | -                                |
| 1.1834 | 342  | 0.4205        | -               | -                                |
| 1.2042 | 348  | 0.4822        | 0.9538          | 0.6967                           |
| 1.2249 | 354  | 0.5008        | -               | -                                |
| 1.2457 | 360  | 0.4902        | -               | -                                |
| 1.2664 | 366  | 0.6269        | -               | -                                |
| 1.2872 | 372  | 0.4861        | -               | -                                |
| 1.3080 | 378  | 0.6288        | -               | -                                |
| 1.3287 | 384  | 0.4038        | -               | -                                |
| 1.3495 | 390  | 0.5267        | -               | -                                |
| 1.3702 | 396  | 0.4614        | -               | -                                |
| 1.3910 | 402  | 0.3266        | -               | -                                |
| 1.4048 | 406  | -             | 0.7257          | 0.7126                           |
| 1.4118 | 408  | 0.4361        | -               | -                                |
| 1.4325 | 414  | 0.4928        | -               | -                                |
| 1.4533 | 420  | 0.4441        | -               | -                                |
| 1.4740 | 426  | 0.2820        | -               | -                                |
| 1.4948 | 432  | 0.5146        | -               | -                                |
| 1.5156 | 438  | 0.6355        | -               | -                                |
| 1.5363 | 444  | 0.4136        | -               | -                                |
| 1.5571 | 450  | 0.2685        | -               | -                                |
| 1.5779 | 456  | 0.6273        | -               | -                                |
| 1.5986 | 462  | 0.5283        | -               | -                                |
| 1.6055 | 464  | -             | 0.6483          | 0.7402                           |
| 1.6194 | 468  | 0.3476        | -               | -                                |
| 1.6401 | 474  | 0.3913        | -               | -                                |
| 1.6609 | 480  | 0.2521        | -               | -                                |
| 1.6817 | 486  | 0.4420        | -               | -                                |
| 1.7024 | 492  | 0.4638        | -               | -                                |
| 1.7232 | 498  | 0.2845        | -               | -                                |
| 1.7439 | 504  | 0.5491        | -               | -                                |
| 1.7647 | 510  | 0.4394        | -               | -                                |
| 1.7855 | 516  | 0.3467        | -               | -                                |
| 1.8062 | 522  | 0.3586        | 0.6696          | 0.7617                           |
| 1.8270 | 528  | 0.4339        | -               | -                                |
| 1.8478 | 534  | 0.3417        | -               | -                                |
| 1.8685 | 540  | 0.3653        | -               | -                                |
| 1.8893 | 546  | 0.1870        | -               | -                                |
| 1.9100 | 552  | 0.1759        | -               | -                                |
| 1.9308 | 558  | 0.3405        | -               | -                                |
| 1.9516 | 564  | 0.3644        | -               | -                                |
| 1.9723 | 570  | 0.5313        | -               | -                                |
| 1.9931 | 576  | 0.3601        | -               | -                                |
| 2.0    | 578  | -             | 0.6740          | 0.7714                           |

</details>

### Training Time
- **Training**: 9.5 minutes
- **Evaluation**: 3.5 minutes
- **Total**: 12.9 minutes

### Framework Versions
- Python: 3.12.12
- Sentence Transformers: 5.5.0
- Transformers: 5.8.1
- PyTorch: 2.12.0+cu130
- Accelerate: 1.13.0
- Datasets: 4.8.5
- Tokenizers: 0.22.2

## Additional Resources

- [Training and Finetuning Reranker Models with Sentence Transformers](https://huggingface.co/blog/train-reranker): the end-to-end guide for training or finetuning Cross Encoder (reranker) models.
- [Multimodal Embedding & Reranker Models with Sentence Transformers](https://huggingface.co/blog/multimodal-sentence-transformers): use text, image, audio, and video reranker models through the same API.
- [Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers](https://huggingface.co/blog/train-multimodal-sentence-transformers): training multimodal Cross Encoders.

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->