"""
diagnose.py
-----------
Week 4: Generative reasoning layer.

Takes the feature dict output from features.py and calls the Claude API
to produce a structured engineering failure diagnosis.

The LLM receives:
  - Quantitative morphological features from the segmentation
  - Material context (Ti-6Al-4V, LPBF process)
  - Defect type classification
  And returns:
  - Natural language diagnosis
  - Crack initiation risk assessment
  - Recommended follow-up actions

Usage:
    # Single image full pipeline (segment → extract → diagnose)
    python diagnose.py --image data/all_defects/images/001-Overview-EP04V24.png
                       --subset all_defects

    # From existing feature JSON
    python diagnose.py --json output/features/all_defects_features.json

    # Interactive mode
    python diagnose.py --interactive --subset all_defects
"""

import argparse
import json
import time
from pathlib import Path

import torch
import torch.nn.functional as F
import numpy as np
import matplotlib
matplotlib.use("Agg")
import matplotlib.pyplot as plt
from PIL import Image
from transformers import SegformerForSemanticSegmentation

from dataset import FractographyDataset, IMAGE_SIZE, NUM_CLASSES
from features import (
    load_model, load_image_tensor, predict_mask,
    extract_features, visualize_features
)

# ── Anthropic API ─────────────────────────────────────────────────────────────
try:
    import anthropic
    HAS_ANTHROPIC = True
except ImportError:
    HAS_ANTHROPIC = False
    print("⚠️  anthropic package not found. Run: pip install anthropic")
# ─────────────────────────────────────────────────────────────────────────────

MATERIAL_CONTEXT = """
Material: Ti-6Al-4V (Grade 5 titanium alloy)
Process: Laser Powder Bed Fusion (LPBF) additive manufacturing
Application context: High-performance structural components (aerospace/defense)
Specimen type: Bend test bar, fractured in four-point bending
"""

SYSTEM_PROMPT = """You are an expert materials engineer specializing in fractography 
and failure analysis of additively manufactured aerospace components. 
You analyze quantitative defect features extracted from SEM (Scanning Electron Microscope) 
images of Ti-6Al-4V fracture surfaces produced by Laser Powder Bed Fusion (LPBF).

Your role is to:
1. Interpret morphological defect features in the context of LPBF process physics
2. Assess crack initiation and propagation risk based on defect characteristics
3. Provide actionable engineering recommendations
4. Be precise and quantitative — reference the actual feature values in your diagnosis

Always structure your response as valid JSON with these exact keys:
{
  "diagnosis_summary": "2-3 sentence plain English summary",
  "defect_interpretation": "detailed interpretation of the morphological features",
  "crack_initiation_risk": "low | medium | high | critical",
  "risk_rationale": "why you assigned this risk level, referencing specific features",
  "dominant_failure_mechanism": "e.g. lack of fusion porosity, keyhole porosity, mixed",
  "critical_regions": "which quadrants or regions pose highest risk",
  "recommendations": ["recommendation 1", "recommendation 2", "recommendation 3"],
  "confidence": "low | medium | high",
  "confidence_rationale": "why"
}
"""

def build_user_prompt(features: dict, image_name: str = "") -> str:
    return f"""
Analyze the following defect features extracted from an SEM fractograph of a 
Ti-6Al-4V LPBF test bar.

Material & Process Context:
{MATERIAL_CONTEXT}

Image: {image_name}

Extracted Morphological Features:
- Defect area fraction:    {features.get('defect_area_fraction', 0):.3f}% of fracture surface
- Defect blob count:       {features.get('defect_count', 0)} distinct pores/defects
- Mean pore area:          {features.get('mean_pore_area_px', 0):.1f} px² (at 256×256 resolution)
- Max pore area:           {features.get('max_pore_area_px', 0)} px²
- Mean aspect ratio:       {features.get('mean_aspect_ratio', 0):.3f}
  (1.0 = perfectly circular/keyhole, >2.0 = elongated/lack-of-fusion)
- Spatial spread (std):    {features.get('spatial_concentration', 0):.2f} px
- Size heterogeneity:      {features.get('size_std', 0):.1f} px² std dev
- Quadrant distribution:
    Top-left:     {features.get('quadrant_distribution', [0,0,0,0])[0]:.3f}
    Top-right:    {features.get('quadrant_distribution', [0,0,0,0])[1]:.3f}
    Bottom-left:  {features.get('quadrant_distribution', [0,0,0,0])[2]:.3f}
    Bottom-right: {features.get('quadrant_distribution', [0,0,0,0])[3]:.3f}
- Rule-based defect type:  {features.get('defect_type', 'unknown')}
  (confidence: {features.get('confidence', 'unknown')})

Provide a structured engineering diagnosis as JSON.
"""

import time

def call_claude(features: dict, image_name: str = "") -> dict:
    if not HAS_ANTHROPIC:
        return {"error": "anthropic package not installed"}

    client = anthropic.Anthropic()
    prompt = build_user_prompt(features, image_name)

    for attempt in range(3):  # retry up to 3 times
        try:
            response = client.messages.create(
                model="claude-haiku-4-5-20251001",  # faster, higher availability
                max_tokens=2000,
                system=SYSTEM_PROMPT,
                messages=[{"role": "user", "content": prompt}]
            )
            raw_text = response.content[0].text.strip()
            if raw_text.startswith("```"):
                raw_text = raw_text.split("```")[1]
                if raw_text.startswith("json"):
                    raw_text = raw_text[4:]
            raw_text = raw_text.strip()
            return json.loads(raw_text)

        except json.JSONDecodeError as e:
            return {"error": f"JSON parse error: {e}"}
        except Exception as e:
            if "529" in str(e) or "overloaded" in str(e).lower():
                if attempt < 2:
                    print(f"API overloaded, retrying in 10s... (attempt {attempt+1}/3)")
                    time.sleep(10)
                    continue
            return {"error": str(e)}

    return {"error": "API overloaded after 3 retries — try again in a moment"}


def format_diagnosis_report(features: dict, diagnosis: dict, image_name: str = "") -> str:
    """Format a human-readable diagnosis report."""
    sep = "=" * 60
    lines = [
        sep,
        f"FAILURE ANALYSIS REPORT",
        f"Image: {image_name}",
        f"Material: Ti-6Al-4V (LPBF)",
        sep,
        "",
        "QUANTITATIVE FEATURES",
        f"  Defect area:      {features.get('defect_area_fraction', 0):.3f}%",
        f"  Defect count:     {features.get('defect_count', 0)}",
        f"  Mean aspect ratio:{features.get('mean_aspect_ratio', 0):.3f}",
        f"  Rule-based type:  {features.get('defect_type', 'unknown')}",
        "",
    ]

    if "error" in diagnosis:
        lines += [f"⚠️  Diagnosis error: {diagnosis['error']}"]
        return "\n".join(lines)

    lines += [
        "AI DIAGNOSIS",
        f"  Failure mechanism: {diagnosis.get('dominant_failure_mechanism', 'N/A')}",
        f"  Crack init. risk:  {diagnosis.get('crack_initiation_risk', 'N/A').upper()}",
        f"  Critical regions:  {diagnosis.get('critical_regions', 'N/A')}",
        f"  Confidence:        {diagnosis.get('confidence', 'N/A')}",
        "",
        "SUMMARY",
        f"  {diagnosis.get('diagnosis_summary', '')}",
        "",
        "DEFECT INTERPRETATION",
        f"  {diagnosis.get('defect_interpretation', '')}",
        "",
        "RISK RATIONALE",
        f"  {diagnosis.get('risk_rationale', '')}",
        "",
        "RECOMMENDATIONS",
    ]
    for i, rec in enumerate(diagnosis.get("recommendations", []), 1):
        lines.append(f"  {i}. {rec}")
    lines.append(sep)

    return "\n".join(lines)


def visualize_diagnosis(
    image_path: Path,
    mask: np.ndarray,
    features: dict,
    diagnosis: dict,
    out_path: Path,
):
    """Save a full diagnosis visualization."""
    raw = np.array(Image.open(image_path), dtype=np.float32)
    raw = (raw - raw.min()) / (raw.max() - raw.min() + 1e-8)
    raw_resized = np.array(
        Image.fromarray((raw * 255).astype(np.uint8)).resize(
            (IMAGE_SIZE[1], IMAGE_SIZE[0]), Image.BILINEAR
        )
    )

    # Risk color
    risk_colors = {
        "low": "#2ecc71", "medium": "#f39c12",
        "high": "#e74c3c", "critical": "#8e44ad"
    }
    risk = diagnosis.get("crack_initiation_risk", "medium")
    risk_color = risk_colors.get(risk, "#888888")

    fig = plt.figure(figsize=(18, 8))
    fig.patch.set_facecolor("#0d0d1a")

    # Title
    mech = diagnosis.get("dominant_failure_mechanism", "Unknown")
    fig.suptitle(
        f"FailureGPT — {image_path.name}\n"
        f"Mechanism: {mech}  |  Crack Risk: {risk.upper()}",
        fontsize=12, fontweight="bold", color="white", y=1.01
    )

    # Image panel
    ax1 = fig.add_subplot(1, 3, 1)
    ax1.imshow(raw_resized, cmap="gray")
    ax1.set_title("SEM Fractograph", color="white", fontsize=9)
    ax1.axis("off")
    ax1.set_facecolor("#0d0d1a")

    # Segmentation overlay
    ax2 = fig.add_subplot(1, 3, 2)
    overlay = np.stack([raw_resized]*3, axis=-1).copy()
    overlay[mask == 1] = [0, 212, 255]
    ax2.imshow(overlay)
    ax2.set_title(
        f"Defect Map\n{features['defect_area_fraction']:.2f}% | "
        f"{features['defect_count']} blobs | AR={features['mean_aspect_ratio']:.2f}",
        color="white", fontsize=9
    )
    ax2.axis("off")
    ax2.set_facecolor("#0d0d1a")

    # Diagnosis text panel
    ax3 = fig.add_subplot(1, 3, 3)
    ax3.set_facecolor("#0d0d1a")
    ax3.axis("off")

    if "error" not in diagnosis:
        summary = diagnosis.get("diagnosis_summary", "")
        interp  = diagnosis.get("defect_interpretation", "")
        recs    = diagnosis.get("recommendations", [])
        conf    = diagnosis.get("confidence", "")

        # Word wrap helper
        def wrap(text, width=42):
            words, lines, line = text.split(), [], ""
            for w in words:
                if len(line) + len(w) + 1 <= width:
                    line += (" " if line else "") + w
                else:
                    lines.append(line)
                    line = w
            if line:
                lines.append(line)
            return "\n".join(lines)

        report = (
            f"RISK: {risk.upper()}\n"
            f"{'─'*38}\n\n"
            f"SUMMARY\n{wrap(summary)}\n\n"
            f"INTERPRETATION\n{wrap(interp[:200])}\n\n"
            f"RECOMMENDATIONS\n"
        )
        for i, r in enumerate(recs[:3], 1):
            report += f"{i}. {wrap(r[:80])}\n"
        report += f"\nConfidence: {conf}"

        ax3.text(
            0.05, 0.97, report,
            transform=ax3.transAxes,
            fontsize=7.5, verticalalignment="top",
            fontfamily="monospace", color="white",
            bbox=dict(
                boxstyle="round", facecolor="#1a1a2e",
                alpha=0.9, edgecolor=risk_color, linewidth=2
            )
        )
    else:
        ax3.text(
            0.1, 0.5, f"API Error:\n{diagnosis['error']}",
            transform=ax3.transAxes, color="red", fontsize=9
        )

    ax3.set_title("AI Diagnosis", color="white", fontsize=9)

    plt.tight_layout()
    out_path.parent.mkdir(parents=True, exist_ok=True)
    plt.savefig(out_path, dpi=150, bbox_inches="tight",
                facecolor="#0d0d1a")
    plt.close()
    print(f"  Visualization → {out_path.resolve()}")


def run_full_pipeline(image_path: Path, subset: str, save_vis: bool = True) -> dict:
    """Full pipeline: image → segmentation → features → diagnosis."""
    ckpt_path = Path("checkpoints") / subset / "best_model.pt"
    if not ckpt_path.exists():
        print(f"❌ No checkpoint at {ckpt_path}")
        return {}

    print(f"\n{'='*60}")
    print(f"FailureGPT Pipeline")
    print(f"Image:    {image_path.name}")
    print(f"Subset:   {subset}")
    print(f"{'='*60}")

    # Step 1: Segment
    print("Step 1/3: Segmenting...")
    model      = load_model(ckpt_path)
    img_tensor = load_image_tensor(image_path, IMAGE_SIZE)
    mask       = predict_mask(model, img_tensor, IMAGE_SIZE)

    # Step 2: Extract features
    print("Step 2/3: Extracting features...")
    features = extract_features(mask, IMAGE_SIZE)
    print(f"  → {features['defect_count']} blobs, "
          f"{features['defect_area_fraction']:.2f}% defect, "
          f"AR={features['mean_aspect_ratio']:.2f}")

    # Step 3: Generate diagnosis
    print("Step 3/3: Generating diagnosis...")
    diagnosis = call_claude(features, image_path.name)

    # Print report
    report = format_diagnosis_report(features, diagnosis, image_path.name)
    print(report)

    # Save visualization
    if save_vis:
        out_path = Path("output/diagnosis") / f"{image_path.stem}_diagnosis.png"
        visualize_diagnosis(image_path, mask, features, diagnosis, out_path)

    # Save JSON
    result = {"image": str(image_path), "features": features, "diagnosis": diagnosis}
    json_out = Path("output/diagnosis") / f"{image_path.stem}_diagnosis.json"
    json_out.parent.mkdir(parents=True, exist_ok=True)
    with open(json_out, "w") as f:
        json.dump(result, f, indent=2)
    print(f"  JSON → {json_out.resolve()}")

    return result


def interactive_mode(subset: str, data_dir: Path):
    """Interactive CLI: pick an image, get a diagnosis."""
    subset_dir = data_dir / subset
    ds = FractographyDataset(subset_dir, split="all", image_size=IMAGE_SIZE)

    print(f"\nAvailable images in '{subset}':")
    for i, (img_path, _) in enumerate(ds.pairs[:20]):
        print(f"  [{i:2d}] {img_path.name}")

    try:
        idx = int(input("\nEnter image index: "))
        img_path, _ = ds.pairs[idx]
        run_full_pipeline(img_path, subset)
    except (ValueError, IndexError) as e:
        print(f"Invalid selection: {e}")


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--image",       type=str, default=None)
    parser.add_argument("--subset",      type=str, default="all_defects")
    parser.add_argument("--json",        type=str, default=None,
                        help="Path to existing features JSON from features.py")
    parser.add_argument("--interactive", action="store_true")
    parser.add_argument("--data_dir",    type=str, default="data")
    parser.add_argument("--n",           type=int, default=3,
                        help="Number of images to process in batch mode")
    args = parser.parse_args()

    if args.interactive:
        interactive_mode(args.subset, Path(args.data_dir))

    elif args.json:
        # Diagnose from existing feature JSON
        with open(args.json) as f:
            feature_list = json.load(f)
        if isinstance(feature_list, list):
            for item in feature_list[:args.n]:
                diagnosis = call_claude(item, item.get("image", ""))
                print(format_diagnosis_report(item, diagnosis, item.get("image", "")))
        else:
            diagnosis = call_claude(feature_list)
            print(format_diagnosis_report(feature_list, diagnosis))

    elif args.image:
        run_full_pipeline(Path(args.image), args.subset)

    else:
        # Batch: run on first n images of subset
        subset_dir = Path(args.data_dir) / args.subset
        ds = FractographyDataset(subset_dir, split="all", image_size=IMAGE_SIZE)
        for img_path, _ in list(ds.pairs)[:args.n]:
            run_full_pipeline(img_path, args.subset)