You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Turkish Sentiment Analysis — BERT

Türkçe ürün yorumları için fine-tune edilmiş, iki sınıflı (olumlu/olumsuz) BERT tabanlı duygu analiz modeli.

Model Özeti

Bu model, Türkçe e-ticaret ürün yorumlarında pozitif ve negatif duyguyu ayırt etmek için savasy/bert-base-turkish-sentiment-cased üzerine fine-tune edilmiştir. Yüksek skorlar eğitim/test splitinin dar olduğuna işaret edebilir — kendi verinizde mutlaka yeniden değerlendirin.

Etiketler

LABEL_1 → Olumlu (Positive)
LABEL_0 → Olumsuz (Negative)

Kullanım

from transformers import pipeline

classifier = pipeline(
    "sentiment-analysis",
    model="tugrulkaya/bert-turkish-sentiment-analysis",
)

print(classifier("Bu ürün harika, çok beğendim!"))
# [{'label': 'LABEL_1', 'score': 0.98...}]

Manuel Kullanım

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

tok = AutoTokenizer.from_pretrained("tugrulkaya/bert-turkish-sentiment-analysis")
mdl = AutoModelForSequenceClassification.from_pretrained("tugrulkaya/bert-turkish-sentiment-analysis")

def predict(text):
    inputs = tok(text, return_tensors="pt", truncation=True, max_length=128)
    with torch.no_grad():
        logits = mdl(**inputs).logits
    probs = torch.softmax(logits, dim=-1)[0]
    label = "OLUMLU" if probs.argmax().item() == 1 else "OLUMSUZ"
    return {"label": label, "confidence": probs.max().item()}

print(predict("Harika bir ürün!"))
print(predict("Berbat, tavsiye etmem."))

Eğitim Detayları

Parametre	Değer
Base model	`savasy/bert-base-turkish-sentiment-cased`
Dataset	Turkish Product Reviews
Görev	Binary text classification
Epoch	3
Batch size	16
Learning rate	2e-5
Max length	128

Sınırlamalar

Sadece Türkçe ürün yorumları için optimize edilmiştir — haber, resmi metin, argo içeren içeriklerde doğruluk düşebilir.
Nötr/ikircikli yorumlar için uygun değildir (yalnızca iki sınıf).
Test skorlarının %100'e yakın olması eğitim verisinin dar bir dağılımdan geldiğine işaret eder; gerçek dünya performansı daha düşük olabilir.

Lisans

Apache 2.0

Downloads last month: -

Safetensors

Model size

0.1B params

Tensor type

F32

Dataset used to train tugrulkaya/bert-turkish-sentiment-analysis

Evaluation results

Accuracy on Turkish Product Reviews
self-reported

1.000
F1 Score on Turkish Product Reviews
self-reported

1.000