SentenceTransformer based on intfloat/multilingual-e5-base
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-base on the core_uk and jargonisms_uk datasets. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-base
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Dot Product
- Training Datasets:
Model Sources
Full Model Architecture
RZTKSentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach")
sentences = [
'query: чоловічіпіжами',
'passage: Піжама чоловіча Homewear MAD 19544 M Noir/marine (3700465519857) Чоловічі піжами Homewear MAD Сезон Літній Розмір M Колір Чорний Колір Морська хвиля Матеріал Трикотаж Матеріал Бавовна Принт Однотонний Тип Піжамні шорти Тип комплекту Шорти+футболка',
'passage: Ноутбук 15.6FM/i7-1255U/16/1TB SSD/Intel Iris XE/D OS/F/BL/Black ThinkBook 15 G4 IAP Ноутбуки Lenovo Колір Сірий',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
Evaluation
Metrics
RZTKInformation Retrieval
- Datasets:
test-core-uk--matryoshka_dim-768--, test-core-ru--matryoshka_dim-768--, typos-uk--matryoshka_dim-768--, typos-ru--matryoshka_dim-768--, transliterations-uk--matryoshka_dim-768--, transliterations-ru--matryoshka_dim-768--, options-uk--matryoshka_dim-768--, options-ru--matryoshka_dim-768--, rusisms-uk--matryoshka_dim-768--, rusisms-ru--matryoshka_dim-768--, test-jargonisms-uk--matryoshka_dim-768--, test-jargonisms-ru--matryoshka_dim-768--, vespa-uk--matryoshka_dim-768-- and vespa-ru--matryoshka_dim-768--
- Evaluated with
sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator
| Metric |
test-core-uk--matryoshka_dim-768-- |
test-core-ru--matryoshka_dim-768-- |
typos-uk--matryoshka_dim-768-- |
typos-ru--matryoshka_dim-768-- |
transliterations-uk--matryoshka_dim-768-- |
transliterations-ru--matryoshka_dim-768-- |
options-uk--matryoshka_dim-768-- |
options-ru--matryoshka_dim-768-- |
rusisms-uk--matryoshka_dim-768-- |
rusisms-ru--matryoshka_dim-768-- |
test-jargonisms-uk--matryoshka_dim-768-- |
test-jargonisms-ru--matryoshka_dim-768-- |
vespa-uk--matryoshka_dim-768-- |
vespa-ru--matryoshka_dim-768-- |
| dot_accuracy_10 |
0.9921 |
0.9921 |
0.9803 |
0.9803 |
0.8556 |
0.8584 |
1.0 |
1.0 |
1.0 |
1.0 |
0.9744 |
0.9744 |
0.9348 |
0.9348 |
| dot_precision_10 |
0.4021 |
0.401 |
0.3837 |
0.3801 |
0.1998 |
0.2023 |
0.3388 |
0.3376 |
0.7242 |
0.7198 |
0.6282 |
0.6231 |
0.7174 |
0.7043 |
| dot_recall_10 |
0.4782 |
0.4783 |
0.4583 |
0.4544 |
0.3938 |
0.3974 |
0.4852 |
0.4834 |
0.3797 |
0.3766 |
0.4196 |
0.4174 |
0.2483 |
0.2406 |
| dot_ndcg_10 |
0.5967 |
0.5962 |
0.5591 |
0.5529 |
0.4768 |
0.4802 |
0.5786 |
0.5739 |
0.8232 |
0.8205 |
0.7656 |
0.7538 |
0.7983 |
0.7857 |
| dot_mrr_10 |
0.8874 |
0.8924 |
0.8383 |
0.8288 |
0.7681 |
0.7702 |
0.9 |
0.888 |
0.9571 |
0.9628 |
0.9282 |
0.8983 |
0.8926 |
0.8878 |
| dot_map_60 |
0.4291 |
0.4277 |
0.3961 |
0.3918 |
0.3651 |
0.3674 |
0.4183 |
0.4142 |
0.4704 |
0.4704 |
0.4487 |
0.4411 |
0.5878 |
0.5824 |
Training Details
Training Datasets
core_uk
- Dataset: core_uk
- Size: 47,443,077 training samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 6 tokens
- mean: 11.36 tokens
- max: 45 tokens
|
- min: 20 tokens
- mean: 97.0 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: бюстгальтер балалоум |
passage: Комплект нижньої білизни бюстгальтер формованая чашка і стрінги Balaloum 70В-S гіркий шоколад (9271К) Комплекти білизни Balaloum Посадка Середня Країна реєстрації бренда Італія Країна-виробник товару Китай Розмір 70B-S Стиль Романтичний Стиль Класичний Колір Шоколадний Колір Чорний Матеріал Поліамід Матеріал Бавовна Матеріал Еластан Матеріал Віскоза Чашка На кісточках (на каркасах) Трусики Стринги Форма бюстгальтера Балконет Вид комплекту З бюстгальтером |
query: терморегулятор с wifi для теплых полов nexans |
passage: Тепла підлога Nexans TXLP/2R двожильний кабель 840 Вт 5.0 - 6.2 м2 в комплекті з Wi-Fi Black терморегулятором (0878) Нагрівальні кабелі Nexans Гарантія 20 років Площа 5 - 6.2 |
query: магазин для ак 5,45 на 30 патронов |
passage: Підсумок PA m2 під два магазини АК 23х10х6 см (MOLLE, подсумок на разгрузку, жилет) EFPABK23 Тактичні сумки та підсумки EasyFit Матеріал Cordura Колір Чорний Призначення Для магазинів довгодульної зброї Тип Підсумки Кількість вантажних місць 1 Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
jargonisms_uk
- Dataset: jargonisms_uk
- Size: 3,162,050 training samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 12.96 tokens
- max: 45 tokens
|
- min: 15 tokens
- mean: 113.45 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: лифчик балалоум |
passage: Комплект нижньої білизни бюстгальтер формованая чашка і стрінги Balaloum 70В-S гіркий шоколад (9271К) Комплекти білизни Balaloum Посадка Середня Країна реєстрації бренда Італія Країна-виробник товару Китай Розмір 70B-S Стиль Романтичний Стиль Класичний Колір Шоколадний Колір Чорний Матеріал Поліамід Матеріал Бавовна Матеріал Еластан Матеріал Віскоза Чашка На кісточках (на каркасах) Трусики Стринги Форма бюстгальтера Балконет Вид комплекту З бюстгальтером |
query: трусішки чоловічі jiber 127 |
passage: Чоловічі сімейні труси Jiber сірі 127 L Труси чоловічі Jiber Модель Боксери Країна-виробник товару Туреччина Розмір L Колір Сірий Принт Однотонний |
query: акум на xbox |
passage: Акумуляторна батарея Dobe TYX-2610B для Xbox Series S/X 800mAh Black Ігрові маніпулятори й аксесуари до консолей Dobe Тип Аксесуари Сумісність Microsoft Xbox Series S Кількість предметів, шт 1 Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
Evaluation Datasets
core_uk
- Dataset: core_uk
- Size: 3,220 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 10.66 tokens
- max: 16 tokens
|
- min: 19 tokens
- mean: 114.2 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: лампочка е27 |
passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA |
query: лампочка е27 |
passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA |
query: лампочка е27 |
passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
core_ru
- Dataset: core_ru
- Size: 3,220 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 10.66 tokens
- max: 16 tokens
|
- min: 18 tokens
- mean: 109.38 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: лампочка е27 |
passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA |
query: лампочка е27 |
passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA |
query: лампочка е27 |
passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
typos_uk
- Dataset: typos_uk
- Size: 3,220 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 11.58 tokens
- max: 17 tokens
|
- min: 19 tokens
- mean: 114.2 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: лампочка е7 |
passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA |
query: лампочка е7 |
passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA |
query: лампочка е7 |
passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
typos_ru
- Dataset: typos_ru
- Size: 3,220 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 11.58 tokens
- max: 17 tokens
|
- min: 18 tokens
- mean: 109.38 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: лампочка е7 |
passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA |
query: лампочка е7 |
passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA |
query: лампочка е7 |
passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
transliterations_uk
- Dataset: transliterations_uk
- Size: 13,144 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 10.38 tokens
- max: 56 tokens
|
- min: 16 tokens
- mean: 108.83 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: апиэу |
passage: Зволожувальний лактокрем для обличчя A'pieu Lactobacillus 50 мл (8809643517201) Крем для обличчя A'pieu Клас косметики Мідл-маркет Час застосування Ніч Вік Від 18 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 50 мл Вид Крем Сфера застосування Обличчя Тип шкіри Суха Тип шкіри Нормальна Призначення Відновлююче Призначення Зволожувальне Доставка Доставка в магазини ROZETKA |
query: апиэу |
passage: Тональний засіб A'pieu Клас косметики Мідл-маркет |
query: апиэу |
passage: Емульсія мінеральна A'pieu Aqua Marine 180 мл (8809530043608) Засіб для вмивання A'pieu Клас косметики Натуральна Час застосування Універсально Вік Від 20 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Серія Aqua Marine Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 180 мл Вид Емульсія Дія Тонізує Дія Зволожує Дія Очищає Тип шкіри Для всіх типів Призначення Зволожувальне Тип гарантійного талона Без гарантійного талона Можливість доставки Почтомати |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
transliterations_ru
- Dataset: transliterations_ru
- Size: 13,144 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 10.38 tokens
- max: 56 tokens
|
- min: 21 tokens
- mean: 105.61 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: апиэу |
passage: Увлажняющий лакто-крем для лица A'pieu Lactobacillus 50 мл (8809643517201) Крем для лица A'pieu Класс косметики Миддл-маркет Время применения Ночь Возраст От 18 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Страна-производитель товара Республика Корея (Южная Корея) Объем 50 мл Вид Крем Область применения Лицо Тип кожи Сухая Тип кожи Нормальная Назначение Восстанавливающее Назначение Увлажняющее Доставка Доставка в магазины ROZETKA |
query: апиэу |
passage: Воздушный хлопковый кушон с матовым финишем. Air-Fit A'pieu Cushion PPOSONG SPF50+/PA+++ 13,5g A'pieu Тональное средство A'pieu Класс косметики Миддл-маркет |
query: апиэу |
passage: Эмульсия минеральная A'pieu Aqua Marine 180 мл (8809530043608) Средство для умывания A'pieu Класс косметики Натуральная Время применения Универсально Возраст От 20 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Серия Aqua Marine Страна-производитель товара Республика Корея (Южная Корея) Объем 180 мл Вид Эмульсия Действие Тонизирует Действие Увлажняет Действие Очищает Тип кожи Для всех типов Назначение Увлажняющее Тип гарантийного талона Без гарантийного талона Возможность доставки Почтоматы |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
options_uk
- Dataset: options_uk
- Size: 1,442 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 10.71 tokens
- max: 22 tokens
|
- min: 18 tokens
- mean: 165.12 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: спортивные шорты женские |
passage: Спортивні шорти жіночі Traum 2410-17 M (44-46) Чорні (4820024101721) Жіночі спортивні шорти Traum Сезон Осінній Сезон Літній Сезон Весняний Сезон Демісезонний Кількість вантажних місць 1 Довжина Коротка Країна реєстрації бренда Україна Країна-виробник товару Україна Декор З лампасами Розмір 46 Розмір 44 Стиль Спортивний Колір Чорний Матеріал Трикотаж Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA |
query: спортивные шорты женские |
passage: Спортивні шорти жіночі ISSA PLUS 11377 S Чорні (issa2000239538884) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір S Стиль Спортивний Колір Чорний Матеріал Поліестер Матеріал Поліамід Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Доставка Доставка в магазини ROZETKA |
query: спортивные шорты женские |
passage: Спортивні шорти жіночі ISSA PLUS 7770 L Чорні (issa2000260293349) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Довжина Подовжена Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір L Стиль Спортивний Колір Чорний Матеріал Поліестер Тип гарантійного талона Гарантія по чеку Доставка Premium Принт Напис Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
options_ru
- Dataset: options_ru
- Size: 1,442 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 8 tokens
- mean: 10.71 tokens
- max: 22 tokens
|
- min: 23 tokens
- mean: 159.8 tokens
- max: 512 tokens
|
- Samples:
| query |
text |
query: спортивные шорты женские |
passage: Спортивные шорты женские Traum 2410-17 M (44-46) Черные (4820024101721) Женские спортивные шорты Traum Сезон Осенний Сезон Летний Сезон Весенний Сезон Демисезонный Количество грузовых мест 1 Длина Короткая Страна регистрации бренда Украина Страна-производитель товара Украина Декор С лампасами Размер 46 Размер 44 Стиль Спортивный Цвет Черный Материал Трикотаж Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA |
query: спортивные шорты женские |
passage: Спортивные шорты женские ISSA PLUS 11377 S Черные (issa2000239538884) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Украина Размер S Стиль Спортивный Цвет Черный Материал Полиэстер Материал Полиамид Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Доставка Доставка в магазины ROZETKA |
query: спортивные шорты женские |
passage: Спортивные шорты женские ISSA PLUS 7770 L Черные (issa2000260293349) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Длина Удлинённая Страна регистрации бренда Украина Страна-производитель товара Украина Размер L Стиль Спортивный Цвет Черный Материал Полиэстер Тип гарантийного талона Гарантия по чеку Доставка Premium Принт Надпись Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
rusisms_uk
- Dataset: rusisms_uk
- Size: 1,061 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 9 tokens
- mean: 11.14 tokens
- max: 15 tokens
|
- min: 18 tokens
- mean: 107.85 tokens
- max: 366 tokens
|
- Samples:
| query |
text |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Джерела безперебійного живлення LogicPower Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 10 ТЕГИ У кредит |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 20 ТЕГИ У кредит |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Особливості З дисплеєм Час роботи за повного навантаження, хв 8 ТЕГИ У кредит Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
rusisms_ru
- Dataset: rusisms_ru
- Size: 1,061 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 9 tokens
- mean: 11.14 tokens
- max: 15 tokens
|
- min: 20 tokens
- mean: 104.92 tokens
- max: 343 tokens
|
- Samples:
| query |
text |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Источники бесперебойного питания LogicPower Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 10 ТЕГИ В кредит |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 20 ТЕГИ В кредит |
query: блок безперебійного пітанія |
passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Особенности С дисплеем Время работы при полной нагрузке, мин 8 ТЕГИ В кредит Доставка Доставка в магазины ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
jargonisms_uk
- Dataset: jargonisms_uk
- Size: 338 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 338 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 11.42 tokens
- max: 18 tokens
|
- min: 31 tokens
- mean: 138.73 tokens
- max: 503 tokens
|
- Samples:
| query |
text |
query: сумка для лептопа |
passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки та чохли для ноутбуків 2E Гарантія 14 днів Діагональ ноутбука 15.6"-16" Матеріал Нейлон Колір Grey Тип Сумка Спосіб закриття Змійка Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Китай Діагональ сумки/рюкзака 15.6" Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Особливості Відділення для аксесуарів |
query: аккумуляторка |
passage: Акумуляторна ланцюгова пила Greenworks G24CS25 (2000007) Акумуляторні пилки Greenworks Гарантія 36 місяців Кількість вантажних місць 1 Країна реєстрації бренда США Країна-виробник товару Китай Теги недорогі Теги туристичні Теги професійні Для прив'язки тегів Неймовірно тихий Для прив'язки тегів Потужний двигун Для прив'язки тегів Швидкий запуск Довжина шини, мм 250 Особливості Автоматичне змащування ланцюга Особливості Блокування кнопки увімкнення Вага, кг 2.7 Розташування двигуна в пилі Поперечний (бічний) Швидкість обертання ланцюга, м/сек 4.2 Тип гарантійного талона Гарантійний талон магазина Доставка Premium Напруга акумулятора, В 24 Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA |
query: аккумуляторка |
passage: Акумуляторна ланцюгова пила Stark BCS-3610 (310100101) Акумуляторні пилки Stark Гарантія 12 місяців Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Країна-виробник товару Китай Теги недорогі Теги туристичні Довжина шини, мм 250 Особливості SDS система Особливості Гальмо ланцюга Особливості Блокування кнопки увімкнення Особливості Легкий запуск Особливості Автоматичне змащування ланцюга Вага, кг 3.2 Розташування двигуна в пилі Поперечний (бічний) Тип гарантійного талона Гарантійний талон магазина Тип двигуна Безщітковий Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
jargonisms_ru
- Dataset: jargonisms_ru
- Size: 338 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 338 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 11.42 tokens
- max: 18 tokens
|
- min: 28 tokens
- mean: 133.38 tokens
- max: 468 tokens
|
- Samples:
| query |
text |
query: сумка для лептопа |
passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки и чехлы для ноутбуков 2E Гарантия 14 дней Диагональ ноутбука 15.6"-16" Материал Нейлон Цвет Grey Тип Сумка Способ закрытия Молния Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Китай Диагональ сумки/рюкзака 15.6" Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Особенности Отделение для аксессуаров |
query: аккумуляторка |
passage: Аккумуляторная цепная пила Greenworks G24CS25 (2000007) Аккумуляторные пилы Greenworks Гарантия 36 месяцев Количество грузовых мест 1 Страна регистрации бренда США Страна-производитель товара Китай Теги недорогие Теги туристические Теги профессиональные Для привязки тегов Невероятно тихий Для привязки тегов Мощный двигатель Для привязки тегов Быстрый запуск Длина шины, мм 250 Особенности Автоматическая смазка цепи Особенности Блокировка кнопки включения Вес, кг 2.7 Расположение двигателя в пиле Поперечное (боковое) Скорость вращения цепи, м/сек 4.2 Тип гарантийного талона Гарантийный талон магазина Доставка Premium Напряжение аккумулятора, В 24 Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA |
query: аккумуляторка |
passage: Аккумуляторная цепная пила Stark BCS-3610 (310100101) Аккумуляторные пилы Stark Гарантия 12 месяцев Количество грузовых мест 1 Страна регистрации бренда Германия Страна-производитель товара Китай Теги недорогие Теги туристические Длина шины, мм 250 Особенности SDS система Особенности Тормоз цепи Особенности Блокировка кнопки включения Особенности Легкий запуск Особенности Автоматическая смазка цепи Вес, кг 3.2 Расположение двигателя в пиле Поперечное (боковое) Тип гарантийного талона Гарантийный талон магазина Тип двигателя Бесщеточный Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
vespa_uk
- Dataset: vespa_uk
- Size: 5,315 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 9.58 tokens
- max: 22 tokens
|
- min: 19 tokens
- mean: 89.9 tokens
- max: 239 tokens
|
- Samples:
| query |
text |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: Перехідники для шлангу басейну Intex з 32 мм на 38 мм (IP-175136) Обладнання для басейнів Intex Вид Комплектувальні |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: З'єднання для шланга Peraqua діаметр 32 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: З'єднання для шлангу Peraqua діаметр 32/38 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
vespa_ru
- Dataset: vespa_ru
- Size: 5,315 evaluation samples
- Columns:
query and text
- Approximate statistics based on the first 1000 samples:
|
query |
text |
| type |
string |
string |
| details |
- min: 7 tokens
- mean: 9.58 tokens
- max: 22 tokens
|
- min: 20 tokens
- mean: 87.33 tokens
- max: 232 tokens
|
- Samples:
| query |
text |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: Переходники для шланга бассейна Intex с 32 мм на 38 мм (IP-175136) Оборудование для бассейнов Intex Вид Комплектующие |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: Соединение для шланга Peraqua диаметр 32 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов |
query: шланга диаметром 32 мм для викачки брудної води з басейну |
passage: Соединение для шланга Peraqua диаметр 32/38 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов |
- Loss:
sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters:{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy: steps
per_device_train_batch_size: 80
per_device_eval_batch_size: 16
learning_rate: 2e-05
num_train_epochs: 1.0
warmup_ratio: 0.1
bf16: True
bf16_full_eval: True
tf32: True
dataloader_num_workers: 4
load_best_model_at_end: True
optim: adafactor
push_to_hub: True
hub_model_id: yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach
hub_private_repo: True
prompts: {'query': 'query: ', 'text': 'passage: '}
batch_sampler: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir: False
do_predict: False
eval_strategy: steps
prediction_loss_only: True
per_device_train_batch_size: 80
per_device_eval_batch_size: 16
per_gpu_train_batch_size: None
per_gpu_eval_batch_size: None
gradient_accumulation_steps: 1
eval_accumulation_steps: None
torch_empty_cache_steps: None
learning_rate: 2e-05
weight_decay: 0.0
adam_beta1: 0.9
adam_beta2: 0.999
adam_epsilon: 1e-08
max_grad_norm: 1.0
num_train_epochs: 1.0
max_steps: -1
lr_scheduler_type: linear
lr_scheduler_kwargs: {}
warmup_ratio: 0.1
warmup_steps: 0
log_level: passive
log_level_replica: warning
log_on_each_node: True
logging_nan_inf_filter: True
save_safetensors: True
save_on_each_node: False
save_only_model: False
restore_callback_states_from_checkpoint: False
no_cuda: False
use_cpu: False
use_mps_device: False
seed: 42
data_seed: None
jit_mode_eval: False
use_ipex: False
bf16: True
fp16: False
fp16_opt_level: O1
half_precision_backend: auto
bf16_full_eval: True
fp16_full_eval: False
tf32: True
local_rank: 0
ddp_backend: None
tpu_num_cores: None
tpu_metrics_debug: False
debug: []
dataloader_drop_last: True
dataloader_num_workers: 4
dataloader_prefetch_factor: None
past_index: -1
disable_tqdm: False
remove_unused_columns: True
label_names: None
load_best_model_at_end: True
ignore_data_skip: False
fsdp: []
fsdp_min_num_params: 0
fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
fsdp_transformer_layer_cls_to_wrap: None
accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
deepspeed: None
label_smoothing_factor: 0.0
optim: adafactor
optim_args: None
adafactor: False
group_by_length: False
length_column_name: length
ddp_find_unused_parameters: None
ddp_bucket_cap_mb: None
ddp_broadcast_buffers: False
dataloader_pin_memory: True
dataloader_persistent_workers: False
skip_memory_metrics: True
use_legacy_prediction_loop: False
push_to_hub: True
resume_from_checkpoint: None
hub_model_id: yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach
hub_strategy: every_save
hub_private_repo: True
hub_always_push: False
gradient_checkpointing: False
gradient_checkpointing_kwargs: None
include_inputs_for_metrics: False
include_for_metrics: []
eval_do_concat_batches: True
fp16_backend: auto
push_to_hub_model_id: None
push_to_hub_organization: None
mp_parameters:
auto_find_batch_size: False
full_determinism: False
torchdynamo: None
ray_scope: last
ddp_timeout: 1800
torch_compile: False
torch_compile_backend: None
torch_compile_mode: None
dispatch_batches: None
split_batches: None
include_tokens_per_second: False
include_num_input_tokens_seen: False
neftune_noise_alpha: None
optim_target_modules: None
batch_eval_metrics: False
eval_on_start: False
use_liger_kernel: False
eval_use_gather_object: False
average_tokens_across_devices: False
prompts: {'query': 'query: ', 'text': 'passage: '}
batch_sampler: no_duplicates
multi_dataset_batch_sampler: proportional
ddp_static_graph: False
ddp_comm_hook: bf16
gradient_as_bucket_view: False
num_proc: 30
Training Logs
| Epoch |
Step |
Training Loss |
core uk loss |
core ru loss |
typos uk loss |
typos ru loss |
transliterations uk loss |
transliterations ru loss |
options uk loss |
options ru loss |
rusisms uk loss |
rusisms ru loss |
jargonisms uk loss |
jargonisms ru loss |
vespa uk loss |
vespa ru loss |
test-core-uk--matryoshka_dim-768--_dot_ndcg_10 |
test-core-ru--matryoshka_dim-768--_dot_ndcg_10 |
typos-uk--matryoshka_dim-768--_dot_ndcg_10 |
typos-ru--matryoshka_dim-768--_dot_ndcg_10 |
transliterations-uk--matryoshka_dim-768--_dot_ndcg_10 |
transliterations-ru--matryoshka_dim-768--_dot_ndcg_10 |
options-uk--matryoshka_dim-768--_dot_ndcg_10 |
options-ru--matryoshka_dim-768--_dot_ndcg_10 |
rusisms-uk--matryoshka_dim-768--_dot_ndcg_10 |
rusisms-ru--matryoshka_dim-768--_dot_ndcg_10 |
test-jargonisms-uk--matryoshka_dim-768--_dot_ndcg_10 |
test-jargonisms-ru--matryoshka_dim-768--_dot_ndcg_10 |
vespa-uk--matryoshka_dim-768--_dot_ndcg_10 |
vespa-ru--matryoshka_dim-768--_dot_ndcg_10 |
| 0.0050 |
791 |
4.2875 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0100 |
1582 |
4.0854 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0150 |
2373 |
3.6173 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0200 |
3164 |
2.9035 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0250 |
3955 |
2.0941 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0300 |
4746 |
1.7178 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0350 |
5537 |
1.633 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0400 |
6328 |
1.4813 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0450 |
7119 |
1.3263 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.05 |
7907 |
- |
0.6864 |
0.6294 |
0.6578 |
0.7209 |
1.5118 |
1.4681 |
0.8203 |
0.6540 |
0.5308 |
0.6432 |
0.7704 |
1.5918 |
0.5597 |
0.6601 |
0.5816 |
0.5733 |
0.5305 |
0.5268 |
0.4486 |
0.4590 |
0.5466 |
0.5369 |
0.7887 |
0.7986 |
0.7449 |
0.7367 |
0.7797 |
0.7636 |
| 0.0500 |
7910 |
1.3341 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0550 |
8701 |
1.1477 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0600 |
9492 |
1.1108 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0650 |
10283 |
1.0593 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0700 |
11074 |
1.0071 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0750 |
11865 |
0.983 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0800 |
12656 |
0.8944 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0850 |
13447 |
0.8962 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0900 |
14238 |
0.8461 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.0950 |
15029 |
0.7794 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1 |
15814 |
- |
0.4231 |
0.4040 |
0.4953 |
0.5252 |
1.3402 |
1.3510 |
0.5112 |
0.6594 |
0.3408 |
0.2651 |
0.8411 |
0.4260 |
0.3287 |
0.3096 |
0.5955 |
0.5920 |
0.5514 |
0.5424 |
0.4686 |
0.4757 |
0.5612 |
0.5540 |
0.8266 |
0.8256 |
0.7414 |
0.7422 |
0.7830 |
0.7774 |
| 0.1000 |
15820 |
0.7825 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1050 |
16611 |
0.7571 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1100 |
17402 |
0.7322 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1150 |
18193 |
0.7172 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1200 |
18984 |
0.7028 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1250 |
19775 |
0.7024 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1300 |
20566 |
0.6688 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1351 |
21357 |
0.6408 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1401 |
22148 |
0.6299 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1451 |
22939 |
0.6077 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.15 |
23721 |
- |
0.3401 |
0.3455 |
0.4534 |
0.4498 |
1.2558 |
1.2689 |
0.4413 |
0.3933 |
0.2799 |
0.2071 |
0.3209 |
0.3756 |
0.2587 |
0.2515 |
0.5978 |
0.5941 |
0.5555 |
0.5479 |
0.4679 |
0.4743 |
0.5721 |
0.5669 |
0.8177 |
0.8190 |
0.7456 |
0.7587 |
0.7894 |
0.7812 |
| 0.1501 |
23730 |
0.604 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1551 |
24521 |
0.6272 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1601 |
25312 |
0.5768 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1651 |
26103 |
0.5699 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1701 |
26894 |
0.5542 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1751 |
27685 |
0.5503 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1801 |
28476 |
0.5524 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1851 |
29267 |
0.5424 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1901 |
30058 |
0.5238 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.1951 |
30849 |
0.5418 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2 |
31628 |
- |
0.2773 |
0.2884 |
0.3668 |
0.3492 |
1.2221 |
1.1874 |
0.4122 |
0.4389 |
0.2193 |
0.2667 |
0.2431 |
0.4595 |
0.2278 |
0.2324 |
0.5961 |
0.5952 |
0.5575 |
0.5499 |
0.4712 |
0.4752 |
0.5726 |
0.5669 |
0.8267 |
0.8228 |
0.7533 |
0.7598 |
0.7899 |
0.7849 |
| 0.2001 |
31640 |
0.5181 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2051 |
32431 |
0.5116 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2101 |
33222 |
0.4928 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2151 |
34013 |
0.5228 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2201 |
34804 |
0.5071 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2251 |
35595 |
0.5006 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2301 |
36386 |
0.4802 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2351 |
37177 |
0.464 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2401 |
37968 |
0.4752 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2451 |
38759 |
0.4719 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.25 |
39535 |
- |
0.2823 |
0.2975 |
0.3885 |
0.3945 |
1.1898 |
1.1150 |
0.4622 |
0.3916 |
0.1848 |
0.2463 |
0.4574 |
0.4815 |
0.2194 |
0.2514 |
0.5978 |
0.5938 |
0.5559 |
0.5495 |
0.4731 |
0.4778 |
0.5722 |
0.5688 |
0.8231 |
0.8195 |
0.7488 |
0.7539 |
0.7874 |
0.7820 |
| 0.2501 |
39550 |
0.4816 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2551 |
40341 |
0.4838 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2601 |
41132 |
0.4726 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2651 |
41923 |
0.4741 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2701 |
42714 |
0.4486 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2751 |
43505 |
0.4783 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2801 |
44296 |
0.4656 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2851 |
45087 |
0.4526 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2901 |
45878 |
0.4583 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.2951 |
46669 |
0.4659 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3 |
47442 |
- |
0.2731 |
0.2857 |
0.3243 |
0.4003 |
1.1616 |
1.1314 |
0.4140 |
0.4132 |
0.2176 |
0.1832 |
0.5629 |
0.3869 |
0.2059 |
0.2369 |
0.5960 |
0.5952 |
0.5581 |
0.5508 |
0.4749 |
0.4789 |
0.5739 |
0.5725 |
0.8248 |
0.8212 |
0.7526 |
0.7485 |
0.7942 |
0.7869 |
| 0.3001 |
47460 |
0.4584 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3051 |
48251 |
0.4462 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3101 |
49042 |
0.4492 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3151 |
49833 |
0.4334 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3201 |
50624 |
0.4468 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3251 |
51415 |
0.4277 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3301 |
52206 |
0.4605 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3351 |
52997 |
0.4523 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3401 |
53788 |
0.4642 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.3451 |
54579 |
0.4244 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
| 0.35 |
55349 |
- |
0.2588 |
0.2903 |
0.3666 |
0.3502 |
1.1220 |
1.1029 |
0.4220 |
0.4102 |
0.1680 |
0.1905 |
0.2735 |
0.1803 |
0.1954 |
0.2161 |
0.5967 |
0.5962 |
0.5591 |
0.5529 |
0.4768 |
0.4802 |
0.5786 |
0.5739 |
0.8232 |
0.8205 |
0.7656 |
0.7538 |
0.7983 |
0.7857 |
Framework Versions
- Python: 3.11.10
- Sentence Transformers: 3.3.0
- Transformers: 4.46.3
- PyTorch: 2.5.1+cu124
- Accelerate: 1.1.1
- Datasets: 3.1.0
- Tokenizers: 0.20.3
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}