Egor-3926
/

ToxicLord

Text Classification

toxicity-classification

Eval Results (legacy)

Model card Files Files and versions

Egor-3926 commited on 19 days ago

Commit

8576421

·

verified ·

1 Parent(s): ca7785f

Remove profanity and add examples

Files changed (1) hide show

README.md +30 -1

README.md CHANGED Viewed

@@ -95,7 +95,7 @@ tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForSequenceClassification.from_pretrained(model_id)
 model.eval()
-text = "ты еблан"
 inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=192)
 with torch.inference_mode():
@@ -108,6 +108,35 @@ label = "toxic" if toxic_score >= 0.90 else "clean"
 print(label, toxic_score)
 ```
 ## Обучающие данные
 Модель дообучалась на смеси публичных русскоязычных датасетов токсичности и приватных модерационных разметок/исправлений.

 model = AutoModelForSequenceClassification.from_pretrained(model_id)
 model.eval()
+text = "ты грубый и неприятный человек"
 inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=192)
 with torch.inference_mode():
 print(label, toxic_score)
 ```
+## Примеры
+Ниже приведены безопасные демонстрационные примеры без явной нецензурной лексики. Итоговый результат зависит от выбранного порога и контекста сообщения.
+```text
+Сообщение: Спасибо за помощь, всё получилось
+Ожидаемый класс: clean
+```
+```text
+Сообщение: Я устал, сегодня был сложный день
+Ожидаемый класс: clean
+```
+```text
+Сообщение: Ты грубый и неприятный человек
+Ожидаемый класс: toxic
+```
+```text
+Сообщение: Сам ты лох
+Ожидаемый класс: toxic
+```
+```text
+Сообщение: Уйди отсюда, ты всем мешаешь
+Ожидаемый класс: toxic
+```
 ## Обучающие данные
 Модель дообучалась на смеси публичных русскоязычных датасетов токсичности и приватных модерационных разметок/исправлений.