Cludoy
/

IntentClassifier

+"""
+Training pipeline for TinyBert-CNN Intent Classifier.
+Features: discriminative fine-tuning, warmup+cosine LR, early stopping,
+comprehensive per-class/epoch metric tracking.
+"""
+import torch
+import torch.nn as nn
+from torch.utils.data import DataLoader
+import pandas as pd
+import numpy as np
+from tqdm import tqdm
+import time
+import json
+import math
+from sklearn.metrics import (
+    classification_report, confusion_matrix,
+    accuracy_score, precision_recall_fscore_support
+)
+import warnings
+warnings.filterwarnings('ignore')
+from TinyBert import IntentClassifier, IntentDataset
+INTENT_NAMES = ['On-Topic Question', 'Off-Topic Question', 'Emotional-State', 'Pace-Related', 'Repeat/clarification']
+# ─────────────────────────────────────────────────────────────────────
+# UTILITIES
+# ─────────────────────────────────────────────────────────────────────
+class EarlyStopping:
+    def __init__(self, patience=3, min_delta=0.001, verbose=True):
+        self.patience = patience
+        self.min_delta = min_delta
+        self.verbose = verbose
+        self.counter = 0
+        self.best_loss = None
+        self.early_stop = False
+        self.best_epoch = 0
+    def __call__(self, val_loss, epoch):
+        if self.best_loss is None:
+            self.best_loss = val_loss
+            self.best_epoch = epoch
+        elif val_loss > self.best_loss - self.min_delta:
+            self.counter += 1
+            if self.verbose:
+                print(f"  Early stopping counter: {self.counter}/{self.patience}")
+            if self.counter >= self.patience:
+                self.early_stop = True
+                if self.verbose:
+                    print(f"  [!] Early stopping triggered! Best epoch was {self.best_epoch}")
+        else:
+            self.best_loss = val_loss
+            self.best_epoch = epoch
+            self.counter = 0
+class WarmupCosineScheduler:
+    def __init__(self, optimizer, warmup_steps, total_steps):
+        self.optimizer = optimizer
+        self.warmup_steps = warmup_steps
+        self.total_steps = total_steps
+        self.base_lrs = [pg['lr'] for pg in optimizer.param_groups]
+        self.current_step = 0
+    def step(self):
+        self.current_step += 1
+        if self.current_step <= self.warmup_steps:
+            scale = self.current_step / max(1, self.warmup_steps)
+        else:
+            progress = (self.current_step - self.warmup_steps) / max(1, self.total_steps - self.warmup_steps)
+            scale = 0.5 * (1.0 + math.cos(math.pi * progress))
+        for pg, base_lr in zip(self.optimizer.param_groups, self.base_lrs):
+            pg['lr'] = base_lr * scale
+def load_data(train_path, val_path, test_path):
+    train_df = pd.read_csv(train_path)
+    val_df = pd.read_csv(val_path)
+    test_df = pd.read_csv(test_path)
+    return train_df, val_df, test_df
+def compute_class_weights(labels, num_classes, device):
+    counts = np.bincount(labels, minlength=num_classes).astype(float)
+    counts[counts == 0] = 1.0
+    weights = 1.0 / counts
+    weights = weights / weights.sum() * num_classes
+    return torch.tensor(weights, dtype=torch.float32).to(device)
+def evaluate_model_full(classifier, loader):
+    """Full evaluation returning all metrics."""
+    classifier.model.eval()
+    all_preds, all_labels = [], []
+    total_loss = 0
+    criterion = nn.CrossEntropyLoss()
+    with torch.no_grad():
+        for batch in loader:
+            input_ids = batch['input_ids'].to(classifier.device)
+            attention_mask = batch['attention_mask'].to(classifier.device)
+            labels = batch['labels'].to(classifier.device)
+            token_type_ids = batch.get('token_type_ids')
+            if token_type_ids is not None:
+                token_type_ids = token_type_ids.to(classifier.device)
+            logits = classifier.model(input_ids, attention_mask, token_type_ids=token_type_ids)
+            loss = criterion(logits, labels)
+            total_loss += loss.item() * labels.size(0)
+            preds = torch.argmax(logits, dim=1).cpu().numpy()
+            all_preds.extend(preds)
+            all_labels.extend(labels.cpu().numpy())
+    n = len(all_labels)
+    avg_loss = total_loss / n
+    accuracy = accuracy_score(all_labels, all_preds)
+    precision, recall, f1, _ = precision_recall_fscore_support(
+        all_labels, all_preds, average='weighted', zero_division=0
+    )
+    return avg_loss, accuracy, precision, recall, f1, all_preds, all_labels
+# ─────────────────────────────────────────────────────────────────────
+# MAIN
+# ─────────────────────────────────────────────────────────────────────
+def main():
+    # ── Hyperparameters ─────────────────────────────────────────────
+    TRAIN_PATH  = 'data/train.csv'
+    VAL_PATH    = 'data/val.csv'
+    TEST_PATH   = 'data/test.csv'
+    BATCH_SIZE  = 16
+    EPOCHS      = 20
+    BERT_LR     = 2e-5       # Lower LR for BERT backbone
+    HEAD_LR     = 1e-3       # Higher LR for CNN + FC head
+    WEIGHT_DECAY = 0.01
+    MAX_LENGTH  = 128
+    PATIENCE    = 5
+    hyperparams = {
+        'batch_size': BATCH_SIZE,
+        'epochs': EPOCHS,
+        'bert_lr': BERT_LR,
+        'head_lr': HEAD_LR,
+        'weight_decay': WEIGHT_DECAY,
+        'max_length': MAX_LENGTH,
+        'patience': PATIENCE,
+        'label_smoothing': 0.1
+    }
+    print("=" * 60)
+    print("TinyBert-CNN Multi-Input Model Training")
+    print("=" * 60)
+    start_time = time.time()
+    # ── Data ────────────────────────────────────────────────────────
+    train_df, val_df, test_df = load_data(TRAIN_PATH, VAL_PATH, TEST_PATH)
+    num_classes = train_df['label'].nunique()
+    print(f"Train: {len(train_df)} | Val: {len(val_df)} | Test: {len(test_df)} | Classes: {num_classes}")
+    classifier = IntentClassifier(num_classes=num_classes)
+    train_dataset = IntentDataset(train_df.to_dict('records'), classifier.tokenizer, max_length=MAX_LENGTH)
+    val_dataset   = IntentDataset(val_df.to_dict('records'),   classifier.tokenizer, max_length=MAX_LENGTH)
+    test_dataset  = IntentDataset(test_df.to_dict('records'),  classifier.tokenizer, max_length=MAX_LENGTH)
+    train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
+    val_loader   = DataLoader(val_dataset,   batch_size=BATCH_SIZE, shuffle=False)
+    test_loader  = DataLoader(test_dataset,  batch_size=BATCH_SIZE, shuffle=False)
+    # ── Optimizer with discriminative fine-tuning ───────────────────
+    class_weights = compute_class_weights(train_df['label'].values, num_classes, classifier.device)
+    criterion = nn.CrossEntropyLoss(label_smoothing=0.1, weight=class_weights)
+    bert_params = list(classifier.model.bert.parameters())
+    head_params = [p for n, p in classifier.model.named_parameters() if not n.startswith('bert.')]
+    optimizer = torch.optim.AdamW([
+        {'params': bert_params, 'lr': BERT_LR},
+        {'params': head_params, 'lr': HEAD_LR}
+    ], weight_decay=WEIGHT_DECAY)
+    total_steps = len(train_loader) * EPOCHS
+    warmup_steps = int(total_steps * 0.1)
+    scheduler = WarmupCosineScheduler(optimizer, warmup_steps, total_steps)
+    early_stopping = EarlyStopping(patience=PATIENCE)
+    best_val_f1 = 0.0
+    best_model_path = "best_tinybert.pt"
+    # ── Training history ────────────────────────────────────────────
+    history = {
+        'train_loss': [],
+        'val_loss': [],
+        'val_acc': [],
+        'val_f1': []
+    }
+    # ── Training loop ──────────────────────────────────────────────
+    for epoch in range(EPOCHS):
+        classifier.model.train()
+        train_loss = 0
+        train_pbar = tqdm(train_loader, desc=f"Epoch {epoch+1}/{EPOCHS}")
+        for batch in train_pbar:
+            loss = classifier.train_step(batch, optimizer, criterion)
+            torch.nn.utils.clip_grad_norm_(classifier.model.parameters(), max_norm=1.0)
+            scheduler.step()
+            train_loss += loss
+            train_pbar.set_postfix({'loss': f'{loss:.4f}'})
+        avg_train_loss = train_loss / len(train_loader)
+        val_loss, val_acc, val_prec, val_rec, val_f1, _, _ = evaluate_model_full(classifier, val_loader)
+        history['train_loss'].append(round(avg_train_loss, 4))
+        history['val_loss'].append(round(val_loss, 4))
+        history['val_acc'].append(round(val_acc, 4))
+        history['val_f1'].append(round(val_f1, 4))
+        print(f"Epoch {epoch+1}: Train Loss: {avg_train_loss:.4f} | Val Loss: {val_loss:.4f} | Val Acc: {val_acc:.4f} | Val F1: {val_f1:.4f}")
+        if val_f1 > best_val_f1:
+            best_val_f1 = val_f1
+            classifier.save_model(best_model_path)
+            print(f"  [+] Best model saved with F1: {val_f1:.4f}")
+        early_stopping(val_loss, epoch + 1)
+        if early_stopping.early_stop:
+            print("Stopping early.")
+            break
+    # ── Final evaluation on TEST set ────────────────────────────────
+    classifier.load_model(best_model_path)
+    test_loss, test_acc, test_prec, test_rec, test_f1, all_preds, all_labels = evaluate_model_full(classifier, test_loader)
+    training_duration = round(time.time() - start_time, 2)
+    # Per-class metrics
+    per_class_p, per_class_r, per_class_f1, per_class_support = precision_recall_fscore_support(
+        all_labels, all_preds, average=None, zero_division=0
+    )
+    per_class_metrics = {}
+    for i, name in enumerate(INTENT_NAMES):
+        per_class_metrics[name] = {
+            'precision': round(float(per_class_p[i]), 4),
+            'recall': round(float(per_class_r[i]), 4),
+            'f1_score': round(float(per_class_f1[i]), 4),
+            'support': int(per_class_support[i])
+        }
+    # Confusion matrix
+    cm = confusion_matrix(all_labels, all_preds).tolist()
+    # Classification report
+    cls_report = classification_report(all_labels, all_preds, target_names=INTENT_NAMES, zero_division=0)
+    # ── Save results ───────────────────────────────────────────────
+    results = {
+        'model': 'TinyBert-CNN',
+        'hyperparameters': hyperparams,
+        'training_duration_seconds': training_duration,
+        'epochs_trained': len(history['train_loss']),
+        'metrics': {
+            'accuracy': round(test_acc, 4),
+            'f1_score': round(test_f1, 4),
+            'precision': round(test_prec, 4),
+            'recall': round(test_rec, 4),
+            'test_loss': round(test_loss, 4)
+        },
+        'per_class_metrics': per_class_metrics,
+        'confusion_matrix': cm,
+        'training_history': history,
+        'classification_report': cls_report
+    }
+    with open('training_results.json', 'w') as f:
+        json.dump(results, f, indent=4)
+    print(f"\n{'='*60}")
+    print(f"TRAINING COMPLETE  ({training_duration:.1f}s)")
+    print(f"{'='*60}")
+    print(f"Test Acc: {test_acc:.4f} | Test F1: {test_f1:.4f} | Test Loss: {test_loss:.4f}")
+    print(f"\nPer-class results:")
+    print(cls_report)
+    print(f"Confusion Matrix:")
+    for row in cm:
+        print(f"  {row}")
+    print(f"\n[+] Results saved to 'training_results.json'")
+if __name__ == '__main__':
+    main()