sergeyzh
/

rubert-mini-frida

@@ -34,7 +34,7 @@ base_model: sergeyzh/rubert-mini-sts
 ## Префиксы
 Все префиксы унаследованы от FRIDA.
-Оптимальный (обеспечивающий средние результаты) для большинства задач - "categorize: " прописан по умолчанию в [config_sentence_transformers.json](https://huggingface.co/sergeyzh/rubert-mini-frida/config_sentence_transformers.json)
 Перечень используемых префиксов и их влияние на оценки модели в [encodechka](https://github.com/avidale/encodechka):
@@ -58,6 +58,8 @@ base_model: sergeyzh/rubert-mini-sts
 - Sentiment analysis (**SA**);
 - Toxicity identification (**TI**).
 # Метрики
 Оценки модели на бенчмарке [ruMTEB](https://habr.com/ru/companies/sberdevices/articles/831150/):
@@ -142,35 +144,8 @@ print(sim_scores.diag().tolist())
 # [0.9360030293464661, 0.8591322302818298, 0.728583037853241] - FRIDA
 ```
-## Использование с `sentence_transformers`:
-```python
-from sentence_transformers import SentenceTransformer
-inputs = [
-    #
-    "paraphrase: В Ярославской области разрешили работу бань, но без посетителей",
-    "categorize_entailment: Женщину доставили в больницу, за ее жизнь сейчас борются врачи.",
-    "search_query: Сколько программистов нужно, чтобы вкрутить лампочку?",
-    #
-    "paraphrase: Ярославским баням разрешили работать без посетителей",
-    "categorize_entailment: Женщину спасают врачи.",
-    "search_document: Чтобы вкрутить лампочку, требуется три программиста: один напишет программу извлечения лампочки, другой — вкручивания лампочки, а третий проведет тестирование."
-]
-# loads model with mean pooling
-model = SentenceTransformer("sergeyzh/rubert-mini-frida")
-# embeddings are normalized by default
-embeddings = model.encode(inputs, convert_to_tensor=True)
-sim_scores = embeddings[:3] @ embeddings[3:].T
-print(sim_scores.diag().tolist())
-# [0.9413310289382935, 0.8383190631866455, 0.7195918560028076]
-# [0.9360026717185974, 0.8591331243515015, 0.7285830974578857] - FRIDA
-```
-### рекомендуемый с использованием prompt (sentence-transformers>=2.4.0):
 ```python
 from sentence_transformers import SentenceTransformer

 ## Префиксы
 Все префиксы унаследованы от FRIDA.
+Оптимальный (обеспечивающий средние результаты) для большинства задач - "categorize: " прописан по умолчанию в [config_sentence_transformers.json](https://huggingface.co/sergeyzh/rubert-mini-frida/blob/main/config_sentence_transformers.json)
 Перечень используемых префиксов и их влияние на оценки модели в [encodechka](https://github.com/avidale/encodechka):
 - Sentiment analysis (**SA**);
 - Toxicity identification (**TI**).
 # Метрики
 Оценки модели на бенчмарке [ruMTEB](https://habr.com/ru/companies/sberdevices/articles/831150/):
 # [0.9360030293464661, 0.8591322302818298, 0.728583037853241] - FRIDA
 ```
+## Использование с `sentence_transformers` (sentence-transformers>=2.4.0):
 ```python
 from sentence_transformers import SentenceTransformer