Hizlan commited on
Commit
2bf225f
·
1 Parent(s): 87631a9

2nd finetuned-version

Browse files
Files changed (3) hide show
  1. README.md +55 -51
  2. config.json +2 -2
  3. model.safetensors +1 -1
README.md CHANGED
@@ -2,8 +2,9 @@
2
  tags:
3
  - sentence-transformers
4
  - cross-encoder
 
5
  - generated_from_trainer
6
- - dataset_size:610
7
  - loss:FitMixinLoss
8
  base_model: cross-encoder/mmarco-mMiniLMv2-L12-H384-v1
9
  pipeline_tag: text-ranking
@@ -50,11 +51,11 @@ from sentence_transformers import CrossEncoder
50
  model = CrossEncoder("cross_encoder_model_id")
51
  # Get scores for pairs of texts
52
  pairs = [
53
- ['Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.', 'Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.'],
54
- ['3. Die Fondsleitung darf einschliesslich der Derivate und strukturierten Produkte höchstens 10% des Vermögens eines Teilvermogens in Effekten und Geldmarktinstrumenten desselben Emittenten anlegen.', '3. Die Fondsleitung darf einschliesslich der Derivate und strukturierten Produkte höchstens 10% des Vermögens eines Teilvermogens in Effekten und Geldmarktinstrumenten desselben Emittenten anlegen.'],
55
- ['Das Teilvermögen BLKB iQ Fund (CH) iQ Responsible Vorsorge Balanced darf bis zu 100% der Anteile des BLKB iQ Fund (CH) iQ Responsible Bond Fund CHF erwerben.', 'Maximalanteil pro Emission: Höchstens 30 Prozent des Fondsvermögens dürfen in Effekten und Geldmarktinstrumenten derselben Emission angelegt werden.'],
56
- ['e) Geldmarktinstrumente, wenn diese liquide und bewertbar sind sowie an einer Börse oder an einem anderen geregelten, dem Publikum offenstehenden Markt gehandelt werden; Geldmarktinstrumente, die nicht an einer Börse oder an einem anderen geregelten, dem Publikum offenstehenden Markt gehandelt werden, dürfen nur erworben werden, wenn die Emission oder der Emittent Vorschriften über den Gläubigerund den Anlegerschutz unterliegt und wenn die Geldmarktinstrumente von Emittenten gemäss Artikel 74 Absatz 2 KKV begeben oder garantiert sind.', 'Institution: beaufsichtigte Bank oder Institut: Geldmarktinstrumente müssen von einer Bank, einem Effektenhändler oder einem anderen beaufsichtigten Institut begeben oder garantiert sein, das einer Aufsicht untersteht, die der Schweizer Aufsicht gleichwertig ist.'],
57
- ['d) Termingeschäfte (Futures und Forwards), deren Wert linear vom Wert des Basiswertes abhängt.', 'Derivate: Derivative Finanzinstrumente sind zulässig, wenn ihnen als Basiswerte Anlagen im Sinne von Artikel 70 Absatz 1 Buchstaben a-d, Finanzindizes, Zinssätze, Wechselkurse, Kredite oder Währungen zugrunde liegen.'],
58
  ]
59
  scores = model.predict(pairs)
60
  print(scores.shape)
@@ -62,13 +63,13 @@ print(scores.shape)
62
 
63
  # Or rank different texts based on similarity to a single text
64
  ranks = model.rank(
65
- 'Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.',
66
  [
67
- 'Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.',
68
- '3. Die Fondsleitung darf einschliesslich der Derivate und strukturierten Produkte höchstens 10% des Vermögens eines Teilvermogens in Effekten und Geldmarktinstrumenten desselben Emittenten anlegen.',
69
- 'Maximalanteil pro Emission: Höchstens 30 Prozent des Fondsvermögens dürfen in Effekten und Geldmarktinstrumenten derselben Emission angelegt werden.',
70
- 'Institution: beaufsichtigte Bank oder Institut: Geldmarktinstrumente müssen von einer Bank, einem Effektenhändler oder einem anderen beaufsichtigten Institut begeben oder garantiert sein, das einer Aufsicht untersteht, die der Schweizer Aufsicht gleichwertig ist.',
71
- 'Derivate: Derivative Finanzinstrumente sind zulässig, wenn ihnen als Basiswerte Anlagen im Sinne von Artikel 70 Absatz 1 Buchstaben a-d, Finanzindizes, Zinssätze, Wechselkurse, Kredite oder Währungen zugrunde liegen.',
72
  ]
73
  )
74
  # [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
@@ -116,19 +117,19 @@ You can finetune this model on your own dataset.
116
 
117
  #### Unnamed Dataset
118
 
119
- * Size: 610 training samples
120
  * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
121
- * Approximate statistics based on the first 610 samples:
122
  | | sentence_0 | sentence_1 | label |
123
  |:--------|:--------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------|:--------------------------------------------------------------|
124
  | type | string | string | float |
125
- | details | <ul><li>min: 30 characters</li><li>mean: 233.99 characters</li><li>max: 1055 characters</li></ul> | <ul><li>min: 30 characters</li><li>mean: 202.09 characters</li><li>max: 696 characters</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.5</li><li>max: 1.0</li></ul> |
126
  * Samples:
127
- | sentence_0 | sentence_1 | label |
128
- |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
129
- | <code>Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.</code> | <code>Die Einzellimiten von Ziffer 3 und 5 jedoch dürfen mit der vorliegenden Limite von 35% nicht kumuliert werden.</code> | <code>1.0</code> |
130
- | <code>3. Die Fondsleitung darf einschliesslich der Derivate und strukturierten Produkte höchstens 10% des Verm��gens eines Teilvermogens in Effekten und Geldmarktinstrumenten desselben Emittenten anlegen.</code> | <code>3. Die Fondsleitung darf einschliesslich der Derivate und strukturierten Produkte höchstens 10% des Vermögens eines Teilvermogens in Effekten und Geldmarktinstrumenten desselben Emittenten anlegen.</code> | <code>1.0</code> |
131
- | <code>Das Teilvermögen BLKB iQ Fund (CH) iQ Responsible Vorsorge Balanced darf bis zu 100% der Anteile des BLKB iQ Fund (CH) iQ Responsible Bond Fund CHF erwerben.</code> | <code>Maximalanteil pro Emission: Höchstens 30 Prozent des Fondsvermögens dürfen in Effekten und Geldmarktinstrumenten derselben Emission angelegt werden.</code> | <code>0.0</code> |
132
  * Loss: [<code>FitMixinLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#fitmixinloss)
133
 
134
  ### Training Hyperparameters
@@ -207,7 +208,7 @@ You can finetune this model on your own dataset.
207
  - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
208
  - `deepspeed`: None
209
  - `label_smoothing_factor`: 0.0
210
- - `optim`: adamw_torch
211
  - `optim_args`: None
212
  - `adafactor`: False
213
  - `group_by_length`: False
@@ -256,46 +257,49 @@ You can finetune this model on your own dataset.
256
  - `prompts`: None
257
  - `batch_sampler`: batch_sampler
258
  - `multi_dataset_batch_sampler`: proportional
 
 
259
 
260
  </details>
261
 
262
  ### Training Logs
263
  | Epoch | Step | Training Loss |
264
  |:-------:|:-----:|:-------------:|
265
- | 0.8197 | 500 | 1.9143 |
266
- | 1.6393 | 1000 | 0.7914 |
267
- | 2.4590 | 1500 | 0.5883 |
268
- | 3.2787 | 2000 | 0.3915 |
269
- | 4.0984 | 2500 | 0.2119 |
270
- | 4.9180 | 3000 | 0.2049 |
271
- | 5.7377 | 3500 | 0.1157 |
272
- | 6.5574 | 4000 | 0.1367 |
273
- | 7.3770 | 4500 | 0.0336 |
274
- | 8.1967 | 5000 | 0.0912 |
275
- | 9.0164 | 5500 | 0.0517 |
276
- | 9.8361 | 6000 | 0.1057 |
277
- | 10.6557 | 6500 | 0.037 |
278
- | 11.4754 | 7000 | 0.0875 |
279
- | 12.2951 | 7500 | 0.057 |
280
- | 13.1148 | 8000 | 0.0274 |
281
- | 13.9344 | 8500 | 0.0277 |
282
- | 14.7541 | 9000 | 0.0133 |
283
- | 15.5738 | 9500 | 0.0473 |
284
- | 16.3934 | 10000 | 0.0272 |
285
- | 17.2131 | 10500 | 0.025 |
286
- | 18.0328 | 11000 | 0.0481 |
287
- | 18.8525 | 11500 | 0.0111 |
288
- | 19.6721 | 12000 | 0.0226 |
 
289
 
290
 
291
  ### Framework Versions
292
- - Python: 3.11.13
293
- - Sentence Transformers: 4.1.0
294
- - Transformers: 4.53.3
295
- - PyTorch: 2.6.0+cu124
296
- - Accelerate: 1.9.0
297
  - Datasets: 4.0.0
298
- - Tokenizers: 0.21.2
299
 
300
  ## Citation
301
 
 
2
  tags:
3
  - sentence-transformers
4
  - cross-encoder
5
+ - reranker
6
  - generated_from_trainer
7
+ - dataset_size:628
8
  - loss:FitMixinLoss
9
  base_model: cross-encoder/mmarco-mMiniLMv2-L12-H384-v1
10
  pipeline_tag: text-ranking
 
51
  model = CrossEncoder("cross_encoder_model_id")
52
  # Get scores for pairs of texts
53
  pairs = [
54
+ ['9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.', 'Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.'],
55
+ ['Der Emittent der Sicherheiten muss eine hohe Bonität aufweisen und die Sicherheiten dürfen nicht von der Gegenpartei oder von einer dem Konzern der Gegenpartei angehörigen oder davon abhängigen Gesellschaft begeben sein.', 'Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.'],
56
+ ['5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.', '5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.'],
57
+ ['1. Die Fondsleitung darf für Rechnung der Teilvermögen keine Kredite gewähren.', 'Verbot von Krediten und Bürgschaften: Zulasten eines Effektenfonds dürfen keine Kredite gewährt und keine Bürgschaften abgeschlossen werden.'],
58
+ ['Zudem müssen die den Derivaten zugrunde liegenden Basiswerte nach diesem Fondsvertrag für das entsprechende Teilvermögen als Anlagen zulässig sein.', 'Deckung mit anderen Anlagen bei Indexderivaten: Deckung mit anderen Anlagen ist zulässig, wenn das Derivat auf einen extern berechneten Index lautet, der repräsentativ und korreliert ist.'],
59
  ]
60
  scores = model.predict(pairs)
61
  print(scores.shape)
 
63
 
64
  # Or rank different texts based on similarity to a single text
65
  ranks = model.rank(
66
+ '9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.',
67
  [
68
+ 'Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.',
69
+ 'Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.',
70
+ '5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.',
71
+ 'Verbot von Krediten und Bürgschaften: Zulasten eines Effektenfonds dürfen keine Kredite gewährt und keine Bürgschaften abgeschlossen werden.',
72
+ 'Deckung mit anderen Anlagen bei Indexderivaten: Deckung mit anderen Anlagen ist zulässig, wenn das Derivat auf einen extern berechneten Index lautet, der repräsentativ und korreliert ist.',
73
  ]
74
  )
75
  # [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
 
117
 
118
  #### Unnamed Dataset
119
 
120
+ * Size: 628 training samples
121
  * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
122
+ * Approximate statistics based on the first 628 samples:
123
  | | sentence_0 | sentence_1 | label |
124
  |:--------|:--------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------|:--------------------------------------------------------------|
125
  | type | string | string | float |
126
+ | details | <ul><li>min: 30 characters</li><li>mean: 235.09 characters</li><li>max: 1055 characters</li></ul> | <ul><li>min: 30 characters</li><li>mean: 205.17 characters</li><li>max: 696 characters</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.5</li><li>max: 1.0</li></ul> |
127
  * Samples:
128
+ | sentence_0 | sentence_1 | label |
129
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------|
130
+ | <code>9. Die Fondsleitung darf für das Vermögen eines Teilvermögens höchstens je 10% der stimmrechtslosen Beteiligungspapiere, Schuldverschreibungen und/oder Geldmarktinstrumente desselben Emittenten sowie höchstens 25% der Anteile an anderen kollektiven Kapitalanlagen erwerben.</code> | <code>Beschränkung für stimmrechtslose Schuldverschreibungen: Fondsleitung und SICAV dürfen höchstens 10 Prozent Schuldverschreibungen oder Geldmarktinstrumente desselben Emittenten erwerben.</code> | <code>1.0</code> |
131
+ | <code>Der Emittent der Sicherheiten muss eine hohe Bonität aufweisen und die Sicherheiten dürfen nicht von der Gegenpartei oder von einer dem Konzern der Gegenpartei angehörigen oder davon abhängigen Gesellschaft begeben sein.</code> | <code>Bonitätsanforderung für Gegenparteien und Garanten: Bei OTC-Geschäften muss die Gegenpartei oder deren Garant eine hohe Bonität aufweisen.</code> | <code>1.0</code> |
132
+ | <code>5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.</code> | <code>5. a) Bei engagementreduzierenden Derivaten müssen die eingegangenen Verpflichtungen unter Vorbehalt von Bst. b und d dauernd durch die dem Derivat zu Grunde liegenden Basiswerte gedeckt sein.</code> | <code>1.0</code> |
133
  * Loss: [<code>FitMixinLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#fitmixinloss)
134
 
135
  ### Training Hyperparameters
 
208
  - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
209
  - `deepspeed`: None
210
  - `label_smoothing_factor`: 0.0
211
+ - `optim`: adamw_torch_fused
212
  - `optim_args`: None
213
  - `adafactor`: False
214
  - `group_by_length`: False
 
257
  - `prompts`: None
258
  - `batch_sampler`: batch_sampler
259
  - `multi_dataset_batch_sampler`: proportional
260
+ - `router_mapping`: {}
261
+ - `learning_rate_mapping`: {}
262
 
263
  </details>
264
 
265
  ### Training Logs
266
  | Epoch | Step | Training Loss |
267
  |:-------:|:-----:|:-------------:|
268
+ | 0.7962 | 500 | 2.0688 |
269
+ | 1.5924 | 1000 | 1.0619 |
270
+ | 2.3885 | 1500 | 0.3302 |
271
+ | 3.1847 | 2000 | 0.4093 |
272
+ | 3.9809 | 2500 | 0.2725 |
273
+ | 4.7771 | 3000 | 0.1523 |
274
+ | 5.5732 | 3500 | 0.0737 |
275
+ | 6.3694 | 4000 | 0.0784 |
276
+ | 7.1656 | 4500 | 0.1115 |
277
+ | 7.9618 | 5000 | 0.1435 |
278
+ | 8.7580 | 5500 | 0.1006 |
279
+ | 9.5541 | 6000 | 0.0482 |
280
+ | 10.3503 | 6500 | 0.033 |
281
+ | 11.1465 | 7000 | 0.0273 |
282
+ | 11.9427 | 7500 | 0.127 |
283
+ | 12.7389 | 8000 | 0.2191 |
284
+ | 13.5350 | 8500 | 0.0331 |
285
+ | 14.3312 | 9000 | 0.0001 |
286
+ | 15.1274 | 9500 | 0.0137 |
287
+ | 15.9236 | 10000 | 0.0136 |
288
+ | 16.7197 | 10500 | 0.0235 |
289
+ | 17.5159 | 11000 | 0.0001 |
290
+ | 18.3121 | 11500 | 0.012 |
291
+ | 19.1083 | 12000 | 0.0112 |
292
+ | 19.9045 | 12500 | 0.0113 |
293
 
294
 
295
  ### Framework Versions
296
+ - Python: 3.12.11
297
+ - Sentence Transformers: 5.1.0
298
+ - Transformers: 4.55.4
299
+ - PyTorch: 2.8.0+cu126
300
+ - Accelerate: 1.10.1
301
  - Datasets: 4.0.0
302
+ - Tokenizers: 0.21.4
303
 
304
  ## Citation
305
 
config.json CHANGED
@@ -26,10 +26,10 @@
26
  "position_embedding_type": "absolute",
27
  "sentence_transformers": {
28
  "activation_fn": "torch.nn.modules.linear.Identity",
29
- "version": "4.1.0"
30
  },
31
  "torch_dtype": "float32",
32
- "transformers_version": "4.53.3",
33
  "type_vocab_size": 1,
34
  "use_cache": true,
35
  "vocab_size": 250002
 
26
  "position_embedding_type": "absolute",
27
  "sentence_transformers": {
28
  "activation_fn": "torch.nn.modules.linear.Identity",
29
+ "version": "5.1.0"
30
  },
31
  "torch_dtype": "float32",
32
+ "transformers_version": "4.55.4",
33
  "type_vocab_size": 1,
34
  "use_cache": true,
35
  "vocab_size": 250002
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:c206936da6eb9a47d569c7756e7e997840ab610b4e2236d41d9c06f8c8624812
3
  size 470588492
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:404408c41eaafa90f0c7ea036320d8b64aab22d3e7d8db24dda98f428f23df39
3
  size 470588492