Text Ranking
sentence-transformers
Safetensors
xlm-roberta
cross-encoder
reranker
Generated from Trainer
dataset_size:628
loss:FitMixinLoss
text-embeddings-inference
Instructions to use Hizlan/ciso-cross-encoder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use Hizlan/ciso-cross-encoder with sentence-transformers:
from sentence_transformers import CrossEncoder model = CrossEncoder("Hizlan/ciso-cross-encoder") query = "Which planet is known as the Red Planet?" passages = [ "Venus is often called Earth's twin because of its similar size and proximity.", "Mars, known for its reddish appearance, is often referred to as the Red Planet.", "Jupiter, the largest planet in our solar system, has a prominent red spot.", "Saturn, famous for its rings, is sometimes mistaken for the Red Planet." ] scores = model.predict([(query, passage) for passage in passages]) print(scores) - Notebooks
- Google Colab
- Kaggle
2nd finetuned-version
Browse files- README.md +55 -51
- config.json +2 -2
- model.safetensors +1 -1
README.md
CHANGED
|
@@ -2,8 +2,9 @@
|
|
| 2 |
tags:
|
| 3 |
- sentence-transformers
|
| 4 |
- cross-encoder
|
|
|
|
| 5 |
- generated_from_trainer
|
| 6 |
-
- dataset_size:
|
| 7 |
- loss:FitMixinLoss
|
| 8 |
base_model: cross-encoder/mmarco-mMiniLMv2-L12-H384-v1
|
| 9 |
pipeline_tag: text-ranking
|
|
@@ -50,11 +51,11 @@ from sentence_transformers import CrossEncoder
|
|
| 50 |
model = CrossEncoder("cross_encoder_model_id")
|
| 51 |
# Get scores for pairs of texts
|
| 52 |
pairs = [
|
| 53 |
-
['Die
|
| 54 |
-
['
|
| 55 |
-
['
|
| 56 |
-
['
|
| 57 |
-
['
|
| 58 |
]
|
| 59 |
scores = model.predict(pairs)
|
| 60 |
print(scores.shape)
|
|
@@ -62,13 +63,13 @@ print(scores.shape)
|
|
| 62 |
|
| 63 |
# Or rank different texts based on similarity to a single text
|
| 64 |
ranks = model.rank(
|
| 65 |
-
'Die
|
| 66 |
[
|
| 67 |
-
'
|
| 68 |
-
'
|
| 69 |
-
'
|
| 70 |
-
'
|
| 71 |
-
'
|
| 72 |
]
|
| 73 |
)
|
| 74 |
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
|
|
@@ -116,19 +117,19 @@ You can finetune this model on your own dataset.
|
|
| 116 |
|
| 117 |
#### Unnamed Dataset
|
| 118 |
|
| 119 |
-
* Size:
|
| 120 |
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
|
| 121 |
-
* Approximate statistics based on the first
|
| 122 |
| | sentence_0 | sentence_1 | label |
|
| 123 |
|:--------|:--------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------|:--------------------------------------------------------------|
|
| 124 |
| type | string | string | float |
|
| 125 |
-
| details | <ul><li>min: 30 characters</li><li>mean:
|
| 126 |
* Samples:
|
| 127 |
-
| sentence_0
|
| 128 |
-
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
|
| 129 |
-
| <code>Die
|
| 130 |
-
| <code>
|
| 131 |
-
| <code>
|
| 132 |
* Loss: [<code>FitMixinLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#fitmixinloss)
|
| 133 |
|
| 134 |
### Training Hyperparameters
|
|
@@ -207,7 +208,7 @@ You can finetune this model on your own dataset.
|
|
| 207 |
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 208 |
- `deepspeed`: None
|
| 209 |
- `label_smoothing_factor`: 0.0
|
| 210 |
-
- `optim`:
|
| 211 |
- `optim_args`: None
|
| 212 |
- `adafactor`: False
|
| 213 |
- `group_by_length`: False
|
|
@@ -256,46 +257,49 @@ You can finetune this model on your own dataset.
|
|
| 256 |
- `prompts`: None
|
| 257 |
- `batch_sampler`: batch_sampler
|
| 258 |
- `multi_dataset_batch_sampler`: proportional
|
|
|
|
|
|
|
| 259 |
|
| 260 |
</details>
|
| 261 |
|
| 262 |
### Training Logs
|
| 263 |
| Epoch | Step | Training Loss |
|
| 264 |
|:-------:|:-----:|:-------------:|
|
| 265 |
-
| 0.
|
| 266 |
-
| 1.
|
| 267 |
-
| 2.
|
| 268 |
-
| 3.
|
| 269 |
-
|
|
| 270 |
-
| 4.
|
| 271 |
-
| 5.
|
| 272 |
-
| 6.
|
| 273 |
-
| 7.
|
| 274 |
-
|
|
| 275 |
-
|
|
| 276 |
-
| 9.
|
| 277 |
-
| 10.
|
| 278 |
-
| 11.
|
| 279 |
-
|
|
| 280 |
-
|
|
| 281 |
-
| 13.
|
| 282 |
-
| 14.
|
| 283 |
-
| 15.
|
| 284 |
-
|
|
| 285 |
-
|
|
| 286 |
-
|
|
| 287 |
-
| 18.
|
| 288 |
-
| 19.
|
|
|
|
| 289 |
|
| 290 |
|
| 291 |
### Framework Versions
|
| 292 |
-
- Python: 3.
|
| 293 |
-
- Sentence Transformers:
|
| 294 |
-
- Transformers: 4.
|
| 295 |
-
- PyTorch: 2.
|
| 296 |
-
- Accelerate: 1.
|
| 297 |
- Datasets: 4.0.0
|
| 298 |
-
- Tokenizers: 0.21.
|
| 299 |
|
| 300 |
## Citation
|
| 301 |
|
|
|
|
| 2 |
tags:
|
| 3 |
- sentence-transformers
|
| 4 |
- cross-encoder
|
| 5 |
+
- reranker
|
| 6 |
- generated_from_trainer
|
| 7 |
+
- dataset_size:628
|
| 8 |
- loss:FitMixinLoss
|
| 9 |
base_model: cross-encoder/mmarco-mMiniLMv2-L12-H384-v1
|
| 10 |
pipeline_tag: text-ranking
|
|
|
|
| 51 |
model = CrossEncoder("cross_encoder_model_id")
|
| 52 |
# Get scores for pairs of texts
|
| 53 |
pairs = [
|
| 54 |
+
['9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.', 'Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.'],
|
| 55 |
+
['Der Emittent der Sicherheiten muss eine hohe Bonität aufweisen und die Sicherheiten dürfen nicht von der Gegenpartei oder von einer dem Konzern der Gegenpartei angehörigen oder davon abhängigen Gesellschaft begeben sein.', 'Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.'],
|
| 56 |
+
['5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.', '5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.'],
|
| 57 |
+
['1. Die Fondsleitung darf für Rechnung der Teilvermögen keine Kredite gewähren.', 'Verbot von Krediten und Bürgschaften: Zulasten eines Effektenfonds dürfen keine Kredite gewährt und keine Bürgschaften abgeschlossen werden.'],
|
| 58 |
+
['Zudem müssen die den Derivaten zugrunde liegenden Basiswerte nach diesem Fondsvertrag für das entsprechende Teilvermögen als Anlagen zulässig sein.', 'Deckung mit anderen Anlagen bei Indexderivaten: Deckung mit anderen Anlagen ist zulässig, wenn das Derivat auf einen extern berechneten Index lautet, der repräsentativ und korreliert ist.'],
|
| 59 |
]
|
| 60 |
scores = model.predict(pairs)
|
| 61 |
print(scores.shape)
|
|
|
|
| 63 |
|
| 64 |
# Or rank different texts based on similarity to a single text
|
| 65 |
ranks = model.rank(
|
| 66 |
+
'9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.',
|
| 67 |
[
|
| 68 |
+
'Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.',
|
| 69 |
+
'Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.',
|
| 70 |
+
'5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.',
|
| 71 |
+
'Verbot von Krediten und Bürgschaften: Zulasten eines Effektenfonds dürfen keine Kredite gewährt und keine Bürgschaften abgeschlossen werden.',
|
| 72 |
+
'Deckung mit anderen Anlagen bei Indexderivaten: Deckung mit anderen Anlagen ist zulässig, wenn das Derivat auf einen extern berechneten Index lautet, der repräsentativ und korreliert ist.',
|
| 73 |
]
|
| 74 |
)
|
| 75 |
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
|
|
|
|
| 117 |
|
| 118 |
#### Unnamed Dataset
|
| 119 |
|
| 120 |
+
* Size: 628 training samples
|
| 121 |
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
|
| 122 |
+
* Approximate statistics based on the first 628 samples:
|
| 123 |
| | sentence_0 | sentence_1 | label |
|
| 124 |
|:--------|:--------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------|:--------------------------------------------------------------|
|
| 125 |
| type | string | string | float |
|
| 126 |
+
| details | <ul><li>min: 30 characters</li><li>mean: 235.09 characters</li><li>max: 1055 characters</li></ul> | <ul><li>min: 30 characters</li><li>mean: 205.17 characters</li><li>max: 696 characters</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.5</li><li>max: 1.0</li></ul> |
|
| 127 |
* Samples:
|
| 128 |
+
| sentence_0 | sentence_1 | label |
|
| 129 |
+
|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
|
| 130 |
+
| <code>9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.</code> | <code>Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.</code> | <code>1.0</code> |
|
| 131 |
+
| <code>Der Emittent der Sicherheiten muss eine hohe Bonität aufweisen und die Sicherheiten dürfen nicht von der Gegenpartei oder von einer dem Konzern der Gegenpartei angehörigen oder davon abhängigen Gesellschaft begeben sein.</code> | <code>Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.</code> | <code>1.0</code> |
|
| 132 |
+
| <code>5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.</code> | <code>5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.</code> | <code>1.0</code> |
|
| 133 |
* Loss: [<code>FitMixinLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#fitmixinloss)
|
| 134 |
|
| 135 |
### Training Hyperparameters
|
|
|
|
| 208 |
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 209 |
- `deepspeed`: None
|
| 210 |
- `label_smoothing_factor`: 0.0
|
| 211 |
+
- `optim`: adamw_torch_fused
|
| 212 |
- `optim_args`: None
|
| 213 |
- `adafactor`: False
|
| 214 |
- `group_by_length`: False
|
|
|
|
| 257 |
- `prompts`: None
|
| 258 |
- `batch_sampler`: batch_sampler
|
| 259 |
- `multi_dataset_batch_sampler`: proportional
|
| 260 |
+
- `router_mapping`: {}
|
| 261 |
+
- `learning_rate_mapping`: {}
|
| 262 |
|
| 263 |
</details>
|
| 264 |
|
| 265 |
### Training Logs
|
| 266 |
| Epoch | Step | Training Loss |
|
| 267 |
|:-------:|:-----:|:-------------:|
|
| 268 |
+
| 0.7962 | 500 | 2.0688 |
|
| 269 |
+
| 1.5924 | 1000 | 1.0619 |
|
| 270 |
+
| 2.3885 | 1500 | 0.3302 |
|
| 271 |
+
| 3.1847 | 2000 | 0.4093 |
|
| 272 |
+
| 3.9809 | 2500 | 0.2725 |
|
| 273 |
+
| 4.7771 | 3000 | 0.1523 |
|
| 274 |
+
| 5.5732 | 3500 | 0.0737 |
|
| 275 |
+
| 6.3694 | 4000 | 0.0784 |
|
| 276 |
+
| 7.1656 | 4500 | 0.1115 |
|
| 277 |
+
| 7.9618 | 5000 | 0.1435 |
|
| 278 |
+
| 8.7580 | 5500 | 0.1006 |
|
| 279 |
+
| 9.5541 | 6000 | 0.0482 |
|
| 280 |
+
| 10.3503 | 6500 | 0.033 |
|
| 281 |
+
| 11.1465 | 7000 | 0.0273 |
|
| 282 |
+
| 11.9427 | 7500 | 0.127 |
|
| 283 |
+
| 12.7389 | 8000 | 0.2191 |
|
| 284 |
+
| 13.5350 | 8500 | 0.0331 |
|
| 285 |
+
| 14.3312 | 9000 | 0.0001 |
|
| 286 |
+
| 15.1274 | 9500 | 0.0137 |
|
| 287 |
+
| 15.9236 | 10000 | 0.0136 |
|
| 288 |
+
| 16.7197 | 10500 | 0.0235 |
|
| 289 |
+
| 17.5159 | 11000 | 0.0001 |
|
| 290 |
+
| 18.3121 | 11500 | 0.012 |
|
| 291 |
+
| 19.1083 | 12000 | 0.0112 |
|
| 292 |
+
| 19.9045 | 12500 | 0.0113 |
|
| 293 |
|
| 294 |
|
| 295 |
### Framework Versions
|
| 296 |
+
- Python: 3.12.11
|
| 297 |
+
- Sentence Transformers: 5.1.0
|
| 298 |
+
- Transformers: 4.55.4
|
| 299 |
+
- PyTorch: 2.8.0+cu126
|
| 300 |
+
- Accelerate: 1.10.1
|
| 301 |
- Datasets: 4.0.0
|
| 302 |
+
- Tokenizers: 0.21.4
|
| 303 |
|
| 304 |
## Citation
|
| 305 |
|
config.json
CHANGED
|
@@ -26,10 +26,10 @@
|
|
| 26 |
"position_embedding_type": "absolute",
|
| 27 |
"sentence_transformers": {
|
| 28 |
"activation_fn": "torch.nn.modules.linear.Identity",
|
| 29 |
-
"version": "
|
| 30 |
},
|
| 31 |
"torch_dtype": "float32",
|
| 32 |
-
"transformers_version": "4.
|
| 33 |
"type_vocab_size": 1,
|
| 34 |
"use_cache": true,
|
| 35 |
"vocab_size": 250002
|
|
|
|
| 26 |
"position_embedding_type": "absolute",
|
| 27 |
"sentence_transformers": {
|
| 28 |
"activation_fn": "torch.nn.modules.linear.Identity",
|
| 29 |
+
"version": "5.1.0"
|
| 30 |
},
|
| 31 |
"torch_dtype": "float32",
|
| 32 |
+
"transformers_version": "4.55.4",
|
| 33 |
"type_vocab_size": 1,
|
| 34 |
"use_cache": true,
|
| 35 |
"vocab_size": 250002
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 470588492
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:404408c41eaafa90f0c7ea036320d8b64aab22d3e7d8db24dda98f428f23df39
|
| 3 |
size 470588492
|