camdog920
/

aether-core

Model card Files Files and versions

xet

Community

camdog920 commited on 3 days ago

Commit

e34db8d

verified ·

1 Parent(s): a8a5298

Add AETHER v0.2.0 autonomous — fully self-evolving with automated oversight

Browse files

Files changed (1) hide show

aether_autonomous.py +1445 -0

aether_autonomous.py ADDED Viewed

	@@ -0,0 +1,1445 @@

+"""
+AETHER: Autonomous Self-Evolving Neuro-Symbolic Architecture
+===============================================================
+Fully automated — zero human-in-the-loop. All oversight is performed by
+automated regression gating, risk scoring, and stability validation.
+Architecture:
+  1. Neuro-Symbolic Fusion Gate     — learned attention over symbolic/neural split
+  2. Four-Agent Orchestration       — Researcher, Engineer, Analyzer, Integrator
+  3. MAP-Elites Quality-Diversity   — behavioral archive for evolutionary search
+  4. CoALA 4-Tier Memory            — Working, Episodic, Semantic, Procedural
+  5. Temporal Memory with Attention — long-horizon context retention
+  6. Knowledge Graph Engine         — RGCN + ComplEx + symbolic inference
+  7. AutoOversight System           — regression suites, risk scoring, auto-rollback
+  8. Recursive Evolution Loop       — generate → evaluate → select → mutate → validate → integrate
+Run:  python aether_autonomous.py
+Dependencies: torch, numpy, networkx
+"""
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import numpy as np
+import networkx as nx
+import copy, json, hashlib, time, random, logging, warnings
+from dataclasses import dataclass, field, asdict
+from typing import Dict, List, Any, Optional, Tuple, Callable
+from collections import deque
+from contextlib import contextmanager
+warnings.filterwarnings("ignore")
+logging.basicConfig(
+    level=logging.INFO,
+    format="%(asctime)s [%(name)s] %(levelname)s: %(message)s",
+)
+logger = logging.getLogger("AETHER")
+# ============================================================================
+# 0. CONFIGURATION
+# ============================================================================
+@dataclass
+class AetherConfig:
+    population_size: int = 8
+    generations: int = 10
+    mutation_rate: float = 0.15
+    crossover_rate: float = 0.30
+    macro_policy_dim: int = 256
+    micro_policy_dim: int = 128
+    num_agents: int = 4
+    working_memory_capacity: int = 16
+    episodic_buffer_size: int = 1000
+    kg_embedding_dim: int = 128
+    kg_num_relations: int = 20
+    learning_rate: float = 2e-5
+    batch_size: int = 4
+    enable_self_modification: bool = True
+    enable_parallel_agents: bool = True
+    # Auto-oversight thresholds (fully automated)
+    max_mutation_rate: float = 0.50
+    max_agents: int = 16
+    max_memory_mb: float = 8192.0
+    rollback_fitness_drop: float = 0.15
+    stability_window: int = 3
+    risk_threshold: float = 0.70
+    # MAP-Elites
+    archive_dims: Tuple[int, int] = (10, 10)
+    def to_vector(self) -> np.ndarray:
+        return np.array([
+            self.population_size,
+            self.mutation_rate,
+            self.learning_rate * 1e5,
+            self.macro_policy_dim,
+            self.micro_policy_dim,
+            self.num_agents,
+            self.kg_embedding_dim,
+        ], dtype=np.float32)
+    @classmethod
+    def from_vector(cls, vec: np.ndarray) -> "AetherConfig":
+        return cls(
+            population_size=int(np.clip(vec[0], 2, 64)),
+            mutation_rate=float(np.clip(vec[1], 0.01, 0.5)),
+            learning_rate=float(np.clip(vec[2] / 1e5, 1e-6, 1e-3)),
+            macro_policy_dim=int(np.clip(vec[3], 64, 512)),
+            micro_policy_dim=int(np.clip(vec[4], 32, 256)),
+            num_agents=int(np.clip(vec[5], 1, 16)),
+            kg_embedding_dim=int(np.clip(vec[6], 32, 512)),
+        )
+# ============================================================================
+# 1. AUTO-OVERSIGHT (replaces human-in-the-loop)
+# ============================================================================
+class AutoOversight:
+    """
+    Fully automated oversight. No human approval.
+    Components:
+      - Risk scorer: estimates danger of proposed mutation
+      - Regression suite: quick benchmarks that must not degrade
+      - Stability validator: checks config bounds, memory, consistency
+      - Auto-rollback: reverts to last known good if fitness drops
+    """
+    def __init__(self, config: AetherConfig):
+        self.config = config
+        self.audit_log: List[Dict] = []
+        self.modification_history: List[Dict] = []
+        self.baseline_fitness: float = 0.0
+        self.fitness_history: deque = deque(maxlen=config.stability_window * 2)
+        self.last_good_config: Optional[AetherConfig] = None
+        self.last_good_fitness: float = -float("inf")
+        self.consecutive_rejections: int = 0
+    def risk_score(self, candidate: AetherConfig) -> float:
+        """Return 0..1 risk. >threshold = reject."""
+        risks = []
+        # Mutation rate risk
+        risks.append(min(1.0, candidate.mutation_rate / self.config.max_mutation_rate))
+        # Agent count risk
+        risks.append(min(1.0, candidate.num_agents / self.config.max_agents))
+        # Memory estimate risk
+        est_mem = (candidate.macro_policy_dim * candidate.micro_policy_dim *
+                   candidate.num_agents * 4) / 1e6
+        risks.append(min(1.0, est_mem / self.config.max_memory_mb))
+        # Dimension consistency risk
+        if candidate.micro_policy_dim > candidate.macro_policy_dim:
+            risks.append(1.0)
+        else:
+            risks.append(0.0)
+        return float(np.mean(risks))
+    def validate_stability(self, candidate: AetherConfig) -> Tuple[bool, str]:
+        checks = {
+            "population_size": (2, 64),
+            "mutation_rate": (0.0, self.config.max_mutation_rate),
+            "learning_rate": (1e-6, 1e-3),
+            "num_agents": (1, self.config.max_agents),
+            "macro_policy_dim": (32, 512),
+            "micro_policy_dim": (16, 256),
+        }
+        violations = []
+        for field_name, (lo, hi) in checks.items():
+            val = getattr(candidate, field_name, None)
+            if val is not None and not (lo <= val <= hi):
+                violations.append(f"{field_name}={val} not in [{lo},{hi}]")
+        if candidate.micro_policy_dim > candidate.macro_policy_dim:
+            violations.append("micro > macro")
+        if violations:
+            return False, "; ".join(violations)
+        return True, "ok"
+    def regression_suite(self, candidate: AetherConfig,
+                         core: "AetherCore") -> Tuple[bool, float]:
+        """
+        Quick synthetic benchmarks. Returns (pass, composite_score).
+        Higher = better.
+        """
+        scores = []
+        # Benchmark 1: memory throughput
+        try:
+            wm = WorkingMemory(capacity=candidate.working_memory_capacity)
+            for i in range(100):
+                wm.store({"idx": i, "data": torch.randn(16)})
+            retrieved = wm.retrieve("idx", top_k=5)
+            scores.append(len(retrieved) / 5.0)
+        except Exception as e:
+            scores.append(0.0)
+        # Benchmark 2: knowledge graph query speed
+        try:
+            kg = KnowledgeGraphEngine(
+                embedding_dim=candidate.kg_embedding_dim,
+                num_relations=candidate.kg_num_relations,
+            )
+            for i in range(20):
+                kg.add_fact(f"Node{i}", "relates_to", f"Node{i+1}")
+            q = kg.query("Node0 relates_to", top_k=3)
+            scores.append(min(1.0, len(q["results"]) / 3.0))
+        except Exception:
+            scores.append(0.0)
+        # Benchmark 3: agent orchestration latency
+        try:
+            orch = AetherAgentOrchestrator(candidate)
+            task_embed = torch.randn(1, candidate.macro_policy_dim)
+            blueprint = orch.hierarchical.generate_blueprint(task_embed)
+            scores.append(min(1.0, len(blueprint) / 3.0))
+        except Exception:
+            scores.append(0.0)
+        composite = float(np.mean(scores))
+        # Must beat baseline by at least rollback threshold, or be first run
+        if self.baseline_fitness > 0 and composite < self.baseline_fitness * (1 - self.config.rollback_fitness_drop):
+            return False, composite
+        return True, composite
+    def should_rollback(self, current_fitness: float) -> bool:
+        """Auto-rollback if fitness drops significantly."""
+        if self.last_good_fitness == -float("inf"):
+            return False
+        drop = (self.last_good_fitness - current_fitness) / (abs(self.last_good_fitness) + 1e-8)
+        return drop > self.config.rollback_fitness_drop
+    def decide(self, candidate: AetherConfig, core: "AetherCore") -> Tuple[bool, float, str]:
+        """
+        Automated decision gate. Returns (approved, score, reason).
+        No human involved.
+        """
+        risk = self.risk_score(candidate)
+        if risk > self.config.risk_threshold:
+            self._log(candidate, False, f"risk={risk:.2f} > threshold")
+            self.consecutive_rejections += 1
+            return False, risk, "auto-rejected: high risk"
+        stable, stability_reason = self.validate_stability(candidate)
+        if not stable:
+            self._log(candidate, False, stability_reason)
+            self.consecutive_rejections += 1
+            return False, risk, f"auto-rejected: unstable ({stability_reason})"
+        reg_pass, reg_score = self.regression_suite(candidate, core)
+        if not reg_pass:
+            self._log(candidate, False, f"regression fail score={reg_score:.3f}")
+            self.consecutive_rejections += 1
+            return False, reg_score, "auto-rejected: regression failure"
+        self._log(candidate, True, f"risk={risk:.2f} reg={reg_score:.3f}")
+        self.consecutive_rejections = 0
+        self.baseline_fitness = max(self.baseline_fitness, reg_score)
+        return True, reg_score, "auto-approved"
+    def _log(self, candidate: AetherConfig, approved: bool, reason: str):
+        entry = {
+            "timestamp": time.time(),
+            "approved": approved,
+            "config_hash": hashlib.sha256(
+                json.dumps(asdict(candidate), sort_keys=True).encode()
+            ).hexdigest()[:16],
+            "reason": reason,
+        }
+        self.modification_history.append(entry)
+        self.audit_log.append(entry)
+    def update_good_checkpoint(self, config: AetherConfig, fitness: float):
+        self.last_good_config = copy.deepcopy(config)
+        self.last_good_fitness = fitness
+    def summary(self) -> Dict[str, Any]:
+        total = len(self.modification_history)
+        approved = sum(1 for m in self.modification_history if m["approved"])
+        return {
+            "total_attempted": total,
+            "approved": approved,
+            "rejected": total - approved,
+            "consecutive_rejections": self.consecutive_rejections,
+            "baseline_fitness": self.baseline_fitness,
+            "last_good_fitness": self.last_good_fitness,
+        }
+# ============================================================================
+# 2. MEMORY SYSTEM (CoALA 4-tier + Temporal)
+# ============================================================================
+class WorkingMemory:
+    def __init__(self, capacity: int = 16):
+        self.capacity = capacity
+        self.buffer: deque = deque(maxlen=capacity)
+        self.attention = nn.Parameter(torch.ones(capacity))
+    def store(self, item: Dict[str, Any]):
+        item["_t"] = time.time()
+        self.buffer.append(item)
+    def retrieve(self, query: str, top_k: int = 3) -> List[Dict]:
+        if not self.buffer:
+            return []
+        scores = []
+        buf = list(self.buffer)
+        for i, item in enumerate(buf):
+            text = json.dumps(item)
+            score = sum(1 for w in query.lower().split() if w in text.lower())
+            # attention weighting (learned)
+            attn = torch.sigmoid(self.attention[i % self.capacity]).item()
+            scores.append(score * attn)
+        indices = sorted(range(len(scores)), key=lambda i: scores[i], reverse=True)[:top_k]
+        return [buf[i] for i in indices]
+    def export(self) -> List[Dict]:
+        return list(self.buffer)
+class EpisodicMemory:
+    def __init__(self, buffer_size: int = 1000):
+        self.buffer: deque = deque(maxlen=buffer_size)
+    def store(self, episode: Dict[str, Any]):
+        episode["_t"] = time.time()
+        self.buffer.append(episode)
+    def retrieve_similar(self, query: str, top_k: int = 5) -> List[Dict]:
+        if not self.buffer:
+            return []
+        buf = list(self.buffer)
+        scores = []
+        for item in buf:
+            text = json.dumps(item)
+            scores.append(sum(1 for w in query.lower().split() if w in text.lower()))
+        indices = sorted(range(len(scores)), key=lambda i: scores[i], reverse=True)[:top_k]
+        return [buf[i] for i in indices]
+    def get_recent(self, n: int = 10) -> List[Dict]:
+        return list(self.buffer)[-n:]
+    def export(self) -> List[Dict]:
+        return list(self.buffer)
+class SemanticMemory:
+    def __init__(self):
+        self.facts: Dict[str, Any] = {}
+    def store_fact(self, key: str, value: Any, confidence: float = 1.0):
+        self.facts[key] = {"value": value, "confidence": confidence, "t": time.time()}
+    def retrieve(self, key: str) -> Optional[Dict]:
+        return self.facts.get(key)
+    def query(self, query: str) -> List[Dict]:
+        return [v for k, v in self.facts.items() if query.lower() in k.lower()]
+    def export(self) -> Dict:
+        return self.facts
+class ProceduralMemory:
+    def __init__(self):
+        self.tools: Dict[str, Dict] = {}
+        self.usage: Dict[str, int] = {}
+    def register_tool(self, name: str, code: str, description: str, tags: List[str] = None):
+        self.tools[name] = {
+            "code": code, "description": description,
+            "tags": tags or [], "registered_at": time.time(), "version": 1,
+        }
+        self.usage[name] = 0
+    def get_tool(self, name: str) -> Optional[Dict]:
+        if name in self.tools:
+            self.usage[name] += 1
+            return self.tools[name]
+        return None
+    def search_tools(self, query: str) -> List[Dict]:
+        out = []
+        for name, tool in self.tools.items():
+            text = f"{name} {tool['description']} {' '.join(tool['tags'])}"
+            if query.lower() in text.lower():
+                out.append({"name": name, **tool})
+        return out
+    def merge_tools(self, cluster: List[str]) -> Optional[str]:
+        if len(cluster) < 2:
+            return None
+        canonical = max(cluster, key=lambda t: self.usage.get(t, 0))
+        merged_desc = " | ".join(self.tools[t]["description"] for t in cluster if t in self.tools)
+        self.tools[canonical]["description"] = merged_desc
+        self.tools[canonical]["version"] += 1
+        for t in cluster:
+            if t != canonical and t in self.tools:
+                del self.tools[t]
+        return canonical
+    def export(self) -> Dict:
+        return {"tools": self.tools, "usage": self.usage}
+class CoALAMemory:
+    def __init__(self, capacity: int = 16):
+        self.working = WorkingMemory(capacity=capacity)
+        self.episodic = EpisodicMemory(buffer_size=1000)
+        self.semantic = SemanticMemory()
+        self.procedural = ProceduralMemory()
+    def store(self, item: Dict[str, Any], memory_type: str = "working"):
+        if memory_type == "working":
+            self.working.store(item)
+        elif memory_type == "episodic":
+            self.episodic.store(item)
+        elif memory_type == "semantic":
+            for k, v in item.items():
+                self.semantic.store_fact(k, v)
+        elif memory_type == "procedural":
+            if "name" in item and "code" in item:
+                self.procedural.register_tool(
+                    item["name"], item["code"],
+                    item.get("description", ""), item.get("tags", [])
+                )
+    def retrieve(self, query: str, memory_type: str = "all", top_k: int = 5) -> List[Dict]:
+        if memory_type == "all":
+            out = []
+            out.extend(self.working.retrieve(query, top_k=top_k // 2))
+            out.extend(self.episodic.retrieve_similar(query, top_k=top_k))
+            out.extend(self.semantic.query(query)[:top_k])
+            return out[:top_k]
+        elif memory_type == "working":
+            return self.working.retrieve(query, top_k)
+        elif memory_type == "episodic":
+            return self.episodic.retrieve_similar(query, top_k)
+        elif memory_type == "semantic":
+            return self.semantic.query(query)[:top_k]
+        elif memory_type == "procedural":
+            return self.procedural.search_tools(query)
+        return []
+    @property
+    def buffer(self):
+        return self.working.buffer
+    def export(self) -> Dict[str, Any]:
+        return {
+            "working": self.working.export(),
+            "episodic": self.episodic.export(),
+            "semantic": self.semantic.export(),
+            "procedural": self.procedural.export(),
+        }
+class TemporalMemory(nn.Module):
+    def __init__(self, buffer_size: int = 1000, hidden_dim: int = 64):
+        super().__init__()
+        self.buffer_size = buffer_size
+        self.hidden_dim = hidden_dim
+        self.buffer: deque = deque(maxlen=buffer_size)
+        self.temporal_gate = nn.Sequential(
+            nn.Linear(2, hidden_dim), nn.ReLU(),
+            nn.Linear(hidden_dim, 1), nn.Sigmoid(),
+        )
+    def store(self, event: Dict[str, Any]):
+        event["_t"] = time.time()
+        self.buffer.append(event)
+    def retrieve_context(self, current_time: Optional[float] = None,
+                         lookback: float = 3600.0) -> List[Dict]:
+        current_time = current_time or time.time()
+        relevant = []
+        for event in self.buffer:
+            age = current_time - event.get("_t", current_time)
+            if age <= lookback:
+                recency = torch.exp(torch.tensor(-age / lookback)).item()
+                relevant.append({**event, "recency": recency, "age": age})
+        relevant.sort(key=lambda x: x["recency"], reverse=True)
+        return relevant
+    def retrieve_with_attention(self, query_embed: torch.Tensor, top_k: int = 10) -> List[Dict]:
+        # Simplified: use recency-weighted retrieval
+        return self.retrieve_context()[:top_k]
+    def export(self) -> List[Dict]:
+        return list(self.buffer)
+    def __len__(self):
+        return len(self.buffer)
+# ============================================================================
+# 3. KNOWLEDGE GRAPH ENGINE (RGCN + ComplEx + Symbolic Rules)
+# ============================================================================
+class RGCNLayer(nn.Module):
+    def __init__(self, in_dim: int, out_dim: int, num_relations: int, num_bases: int = 4):
+        super().__init__()
+        self.num_relations = num_relations
+        self.bases = nn.Parameter(torch.Tensor(num_bases, in_dim, out_dim))
+        self.comp = nn.Parameter(torch.Tensor(num_relations, num_bases))
+        self.self_loop = nn.Parameter(torch.Tensor(in_dim, out_dim))
+        self.bias = nn.Parameter(torch.Tensor(out_dim))
+        self.reset_parameters()
+    def reset_parameters(self):
+        nn.init.xavier_uniform_(self.bases)
+        nn.init.xavier_uniform_(self.comp)
+        nn.init.xavier_uniform_(self.self_loop)
+        nn.init.zeros_(self.bias)
+    def forward(self, x, edge_index, edge_type):
+        num_nodes = int(edge_index.max().item()) + 1 if x is None else x.size(0)
+        if x is None:
+            x = torch.eye(num_nodes, self.bases.size(1), device=edge_index.device)
+        weight = torch.einsum("rb,bio->rio", self.comp, self.bases)
+        out = torch.zeros(num_nodes, weight.size(2), device=x.device)
+        for rid in range(self.num_relations):
+            mask = edge_type == rid
+            if mask.sum() == 0:
+                continue
+            ei = edge_index[:, mask]
+            messages = torch.mm(x[ei[0]], weight[rid])
+            out.index_add_(0, ei[1], messages)
+        out = out + torch.mm(x, self.self_loop) + self.bias
+        return out
+class KnowledgeGraphEncoder(nn.Module):
+    def __init__(self, num_nodes, hidden_dim, num_relations, num_layers=2, num_bases=4):
+        super().__init__()
+        self.node_embeddings = nn.Embedding(num_nodes, hidden_dim)
+        self.layers = nn.ModuleList([
+            RGCNLayer(hidden_dim, hidden_dim, num_relations, num_bases)
+            for _ in range(num_layers)
+        ])
+        self.norms = nn.ModuleList([nn.LayerNorm(hidden_dim) for _ in range(num_layers)])
+    def forward(self, edge_index, edge_type):
+        num_nodes = int(edge_index.max().item()) + 1
+        x = self.node_embeddings(torch.arange(num_nodes, device=edge_index.device))
+        for layer, norm in zip(self.layers, self.norms):
+            x = F.relu(norm(layer(x, edge_index, edge_type)))
+        return x
+class ComplExScorer(nn.Module):
+    def __init__(self, num_nodes, num_relations, hidden_dim=50):
+        super().__init__()
+        self.head_real = nn.Embedding(num_nodes, hidden_dim)
+        self.head_imag = nn.Embedding(num_nodes, hidden_dim)
+        self.tail_real = nn.Embedding(num_nodes, hidden_dim)
+        self.tail_imag = nn.Embedding(num_nodes, hidden_dim)
+        self.rel_real = nn.Embedding(num_relations, hidden_dim)
+        self.rel_imag = nn.Embedding(num_relations, hidden_dim)
+        self.reset_parameters()
+    def reset_parameters(self):
+        for p in self.parameters():
+            nn.init.xavier_uniform_(p)
+    def forward(self, h, r, t):
+        hr, hi = self.head_real(h), self.head_imag(h)
+        tr, ti = self.tail_real(t), self.tail_imag(t)
+        rr, ri = self.rel_real(r), self.rel_imag(r)
+        return torch.sum(hr * rr * tr + hr * ri * ti + hi * rr * ti - hi * ri * tr, dim=-1)
+    def loss(self, h, r, t, neg_t=None):
+        pos = self.forward(h, r, t)
+        if neg_t is None:
+            neg_t = torch.randint(0, self.tail_real.num_embeddings, t.size(), device=t.device)
+        neg = self.forward(h, r, neg_t)
+        return (F.softplus(-pos) + F.softplus(neg)).mean()
+class KnowledgeGraphEngine(nn.Module):
+    def __init__(self, embedding_dim=128, num_relations=20, max_nodes=10000):
+        super().__init__()
+        self.embedding_dim = embedding_dim
+        self.num_relations = num_relations
+        self.max_nodes = max_nodes
+        self.graph = nx.DiGraph()
+        self.node_id_map: Dict[str, int] = {}
+        self.relation_map: Dict[str, int] = {}
+        self.next_node_id = 0
+        self.next_rel_id = 0
+        self.encoder: Optional[KnowledgeGraphEncoder] = None
+        self.scorer: Optional[ComplExScorer] = None
+        self.symbolic_attention = nn.Parameter(torch.ones(num_relations))
+        self.rules: List[Tuple[Tuple[str, str, str], Tuple[str, str, str]]] = []
+    def _get_or_create_node(self, name: str) -> int:
+        if name not in self.node_id_map:
+            self.node_id_map[name] = self.next_node_id
+            self.graph.add_node(self.next_node_id, name=name)
+            self.next_node_id += 1
+        return self.node_id_map[name]
+    def _get_or_create_relation(self, name: str) -> int:
+        if name not in self.relation_map:
+            self.relation_map[name] = self.next_rel_id
+            self.next_rel_id += 1
+        return self.relation_map[name]
+    def add_fact(self, head: str, relation: str, tail: str, confidence: float = 1.0):
+        h = self._get_or_create_node(head)
+        t = self._get_or_create_node(tail)
+        r = self._get_or_create_relation(relation)
+        self.graph.add_edge(h, t, relation=r, name=relation, confidence=confidence)
+        self._ensure_capacity()
+    def add_rule(self, premise: Tuple[str, str, str], conclusion: Tuple[str, str, str]):
+        self.rules.append((premise, conclusion))
+    def _ensure_capacity(self):
+        if self.encoder is None and self.next_node_id > 0:
+            n = min(self.next_node_id, self.max_nodes)
+            r = max(self.next_rel_id, self.num_relations)
+            self.encoder = KnowledgeGraphEncoder(n, self.embedding_dim, r)
+            self.scorer = ComplExScorer(n, r, self.embedding_dim // 2)
+            logger.info(f"KG initialized: {n} nodes, {r} relations")
+    def _check_fact(self, fact: Tuple[str, str, str]) -> bool:
+        h, r, t = fact
+        if h not in self.node_id_map or t not in self.node_id_map or r not in self.relation_map:
+            return False
+        return self.graph.has_edge(self.node_id_map[h], self.node_id_map[t]) and \
+               self.graph.edges[self.node_id_map[h], self.node_id_map[t]].get("relation") == self.relation_map[r]
+    def reason_symbolic(self, query_head: str, query_relation: str) -> List[Dict]:
+        results = []
+        if query_head not in self.node_id_map:
+            return results
+        h_id = self.node_id_map[query_head]
+        r_name = query_relation
+        if r_name in self.relation_map:
+            r_id = self.relation_map[r_name]
+            for _, target, data in self.graph.out_edges(h_id, data=True):
+                if data.get("relation") == r_id:
+                    results.append({
+                        "head": query_head, "relation": r_name,
+                        "tail": self.graph.nodes[target].get("name", str(target)),
+                        "confidence": data.get("confidence", 1.0), "path": "direct",
+                    })
+        # Rule inference
+        for premise, conclusion in self.rules:
+            p_head, p_rel, p_tail = premise
+            c_head, c_rel, c_tail = conclusion
+            if p_head == query_head and self._check_fact(premise):
+                results.append({
+                    "head": c_head if c_head != "?" else query_head,
+                    "relation": c_rel, "tail": c_tail,
+                    "confidence": 0.8, "path": "inferred",
+                    "rule": f"{premise} -> {conclusion}",
+                })
+        # Multi-hop BFS
+        for neighbor in nx.bfs_tree(self.graph, h_id, depth_limit=2).nodes():
+            if neighbor != h_id:
+                for path in nx.all_simple_paths(self.graph, h_id, neighbor, cutoff=2):
+                    if len(path) > 1:
+                        ed = self.graph.edges[path[0], path[1]]
+                        results.append({
+                            "head": query_head,
+                            "relation": f"multi-hop via {ed.get('name', 'unknown')}",
+                            "tail": self.graph.nodes[neighbor].get("name", str(neighbor)),
+                            "confidence": 0.6 ** (len(path) - 1),
+                            "path": "->".join(str(n) for n in path),
+                        })
+        return sorted(results, key=lambda x: x["confidence"], reverse=True)
+    def reason_learned(self, query_head: str, query_relation: str, top_k: int = 5) -> List[Dict]:
+        if self.scorer is None or query_head not in self.node_id_map:
+            return []
+        h_id = self.node_id_map[query_head]
+        r_id = self.relation_map.get(query_relation)
+        if r_id is None:
+            return []
+        h_t = torch.tensor([h_id])
+        r_t = torch.tensor([r_id])
+        all_t = torch.arange(self.scorer.tail_real.num_embeddings)
+        scores = []
+        for i in range(0, len(all_t), 1000):
+            batch = all_t[i:i + 1000]
+            scores.extend(self.scorer(h_t.repeat(len(batch)), r_t.repeat(len(batch)), batch).tolist())
+        scores_t = torch.tensor(scores)
+        top_scores, top_idx = torch.topk(scores_t, min(top_k, len(scores_t)))
+        results = []
+        for idx, sc in zip(top_idx, top_scores):
+            node_name = self.graph.nodes[idx.item()].get("name", str(idx.item()))
+            results.append({
+                "head": query_head, "relation": query_relation,
+                "tail": node_name, "confidence": torch.sigmoid(sc).item(), "path": "learned",
+            })
+        return results
+    def query(self, text_query: str, top_k: int = 5) -> Dict[str, Any]:
+        parts = text_query.lower().split()
+        head = parts[0].capitalize() if parts else text_query.capitalize()
+        relation = " ".join(parts[1:]) if len(parts) > 1 else "related_to"
+        sym = self.reason_symbolic(head, relation)[:top_k]
+        learned = self.reason_learned(head, relation, top_k)
+        rel_id = self.relation_map.get(relation, 0)
+        sym_w = torch.sigmoid(self.symbolic_attention[rel_id % self.num_relations]).item()
+        learned_w = 1.0 - sym_w
+        for r in sym:
+            r["source"] = "symbolic"
+            r["fusion_weight"] = sym_w
+        for r in learned:
+            r["source"] = "learned"
+            r["fusion_weight"] = learned_w
+        all_r = sorted(sym + learned, key=lambda x: x.get("confidence", 0), reverse=True)
+        return {
+            "query": text_query, "results": all_r[:top_k],
+            "symbolic_weight": sym_w, "learned_weight": learned_w,
+            "num_symbolic": len(sym), "num_learned": len(learned),
+        }
+    def stats(self) -> Dict[str, Any]:
+        return {
+            "num_nodes": self.graph.number_of_nodes(),
+            "num_edges": self.graph.number_of_edges(),
+            "num_relations": len(self.relation_map),
+            "num_rules": len(self.rules),
+        }
+    def export(self) -> Dict[str, Any]:
+        edges = []
+        for u, v, d in self.graph.edges(data=True):
+            edges.append({"source": u, "target": v, "relation": d.get("name"), "confidence": d.get("confidence")})
+        return {
+            "nodes": {n: self.graph.nodes[n].get("name", str(n)) for n in self.graph.nodes()},
+            "edges": edges, "rules": self.rules,
+        }
+# ============================================================================
+# 4. AGENT ORCHESTRATION (4 roles + Hierarchical + BabyAGI loop)
+# ============================================================================
+class AgentRole:
+    RESEARCHER = "researcher"
+    ENGINEER = "engineer"
+    ANALYZER = "analyzer"
+    INTEGRATOR = "integrator"
+class BaseAgent(nn.Module):
+    def __init__(self, role: str, hidden_dim: int = 128, vocab_size: int = 32000):
+        super().__init__()
+        self.role = role
+        self.hidden_dim = hidden_dim
+        self.encoder = nn.Sequential(
+            nn.Embedding(vocab_size, hidden_dim),
+            nn.LSTM(hidden_dim, hidden_dim, batch_first=True),
+        )
+        self.policy_head = nn.Linear(hidden_dim, hidden_dim)
+        self.value_head = nn.Linear(hidden_dim, 1)
+        self.task_history: deque = deque(maxlen=100)
+        self.performance_log: List[float] = []
+    def forward(self, input_ids: torch.Tensor) -> Dict[str, torch.Tensor]:
+        embeds = self.encoder[0](input_ids)
+        lstm_out, _ = self.encoder[1](embeds)
+        hidden = lstm_out[:, -1, :]
+        return {
+            "policy_logits": self.policy_head(hidden),
+            "value": self.value_head(hidden),
+            "hidden": hidden,
+        }
+    def act(self, observation: str) -> str:
+        self.task_history.append({"observation": observation, "t": time.time()})
+        actions = {
+            AgentRole.RESEARCHER: f"[RESEARCHER] Exploring knowledge for: '{observation[:50]}...'",
+            AgentRole.ENGINEER: f"[ENGINEER] Synthesizing tool for: '{observation[:50]}...'",
+            AgentRole.ANALYZER: f"[ANALYZER] Evaluating solution for: '{observation[:50]}...'",
+            AgentRole.INTEGRATOR: f"[INTEGRATOR] Merging components for: '{observation[:50]}...'",
+        }
+        return actions.get(self.role, f"[{self.role.upper()}] Processing: '{observation}'")
+    def update(self, reward: float):
+        self.performance_log.append(reward)
+class HierarchicalAgent(nn.Module):
+    """Macro-policy generates blueprints; micro-policy executes conditioned on blueprint."""
+    def __init__(self, macro_dim: int = 256, micro_dim: int = 128, num_subgoals: int = 5):
+        super().__init__()
+        self.macro_dim = macro_dim
+        self.micro_dim = micro_dim
+        self.num_subgoals = num_subgoals
+        self.macro_decoder = nn.LSTM(macro_dim, macro_dim, batch_first=True)
+        self.subgoal_head = nn.Linear(macro_dim, num_subgoals)
+        self.termination_token = nn.Parameter(torch.randn(macro_dim))
+        self.micro_encoder = nn.LSTM(micro_dim + macro_dim, micro_dim, batch_first=True)
+        self.action_head = nn.Linear(micro_dim, 50)
+        self.current_blueprint: Optional[List[str]] = None
+        self.active_subgoal_idx = 0
+    def generate_blueprint(self, task_embedding: torch.Tensor) -> List[str]:
+        batch_size = task_embedding.size(0)
+        hidden = (torch.zeros(1, batch_size, self.macro_dim),
+                  torch.zeros(1, batch_size, self.macro_dim))
+        input_tok = task_embedding.unsqueeze(1)
+        blueprints = []
+        for _ in range(self.num_subgoals):
+            out, hidden = self.macro_decoder(input_tok, hidden)
+            sg_logits = self.subgoal_head(out.squeeze(1))
+            sg_id = torch.argmax(sg_logits, dim=-1)
+            sim = torch.cosine_similarity(out.squeeze(1), self.termination_token.unsqueeze(0))
+            if sim.item() > 0.9:
+                break
+            blueprints.append(f"subgoal_{sg_id.item()}")
+            input_tok = out
+        self.current_blueprint = blueprints
+        self.active_subgoal_idx = 0
+        return blueprints
+    def execute_action(self, observation: torch.Tensor, blueprint: Optional[List[str]] = None) -> torch.Tensor:
+        if blueprint is not None:
+            self.current_blueprint = blueprint
+        if not self.current_blueprint:
+            return torch.zeros(1, 50)
+        active = self.current_blueprint[min(self.active_subgoal_idx, len(self.current_blueprint) - 1)]
+        subgoal_embed = torch.randn(1, self.macro_dim)
+        combined = torch.cat([observation, subgoal_embed], dim=-1)
+        out, _ = self.micro_encoder(combined.unsqueeze(1))
+        return self.action_head(out.squeeze(1))
+    def advance_subgoal(self):
+        self.active_subgoal_idx += 1
+    def reset(self):
+        self.current_blueprint = None
+        self.active_subgoal_idx = 0
+class BabyAGILoop:
+    def __init__(self, objective: str, max_iterations: int = 50):
+        self.objective = objective
+        self.max_iterations = max_iterations
+        self.task_list: deque = deque()
+        self.completed: List[Dict] = []
+        self.results: Dict[int, Any] = {}
+        self.iteration = 0
+    def create_tasks(self, previous_result: str, task_desc: str) -> List[str]:
+        return [f"Sub-task {len(self.task_list) + i}: Analyze {previous_result[:30]}..." for i in range(3)]
+    def prioritize(self) -> List[str]:
+        tasks = list(self.task_list)
+        scores = [sum(1 for w in self.objective.lower().split() if w in t.lower()) for t in tasks]
+        return [t for _, t in sorted(zip(scores, tasks), reverse=True)]
+    def execute(self, task: str, agent: BaseAgent) -> str:
+        result = agent.act(task)
+        self.completed.append({"task": task, "result": result, "iteration": self.iteration})
+        return result
+    def run(self, agent: BaseAgent) -> Dict[str, Any]:
+        self.task_list.append(self.objective)
+        while self.iteration < self.max_iterations and self.task_list:
+            prioritized = self.prioritize()
+            self.task_list = deque(prioritized)
+            current = self.task_list.popleft()
+            prev = self.completed[-1]["result"] if self.completed else ""
+            result = self.execute(current, agent)
+            self.results[self.iteration] = result
+            for t in self.create_tasks(result, current):
+                if t not in self.task_list:
+                    self.task_list.append(t)
+            self.iteration += 1
+        return {
+            "completed": self.completed, "results": self.results,
+            "iterations": self.iteration, "objective": self.objective,
+        }
+class AetherAgentOrchestrator(nn.Module):
+    def __init__(self, config: AetherConfig):
+        super().__init__()
+        self.config = config
+        self.agents: Dict[str, BaseAgent] = nn.ModuleDict({
+            "researcher": BaseAgent(AgentRole.RESEARCHER, hidden_dim=config.macro_policy_dim),
+            "engineer": BaseAgent(AgentRole.ENGINEER, hidden_dim=config.micro_policy_dim),
+            "analyzer": BaseAgent(AgentRole.ANALYZER, hidden_dim=config.micro_policy_dim),
+            "integrator": BaseAgent(AgentRole.INTEGRATOR, hidden_dim=config.micro_policy_dim),
+        })
+        self.leader = BaseAgent("leader", hidden_dim=config.macro_policy_dim)
+        self.hierarchical = HierarchicalAgent(macro_dim=config.macro_policy_dim, micro_dim=config.micro_policy_dim)
+        self.routing_weights = nn.Parameter(torch.ones(len(self.agents)))
+        self.aggregation_gate = nn.Softmax(dim=0)
+        self.agent_tasks: Dict[str, BabyAGILoop] = {}
+        self.interactions: List[Dict] = []
+        self.task_count = 0
+    def forward(self, task: str, context: Dict[str, Any]) -> Dict[str, Any]:
+        task_embed = torch.randn(1, self.config.macro_policy_dim)
+        blueprint = self.hierarchical.generate_blueprint(task_embed)
+        routing_probs = self.aggregation_gate(self.routing_weights)
+        agent_outputs = {}
+        for i, (name, agent) in enumerate(self.agents.items()):
+            weight = routing_probs[i].item()
+            if weight < 0.10:
+                continue
+            sub_task = blueprint[min(i, len(blueprint) - 1)] if blueprint else task
+            output = agent.act(f"[{name}] {sub_task}")
+            agent_outputs[name] = {"output": output, "weight": weight, "sub_task": sub_task}
+        synthesis = self.leader.act(f"Synthesize: {task} with inputs: {list(agent_outputs.keys())}")
+        self.interactions.append({
+            "task": task, "blueprint": blueprint,
+            "agent_outputs": agent_outputs, "leader_synthesis": synthesis,
+            "routing_probs": routing_probs.detach().cpu().tolist(),
+            "t": time.time(),
+        })
+        self.task_count += 1
+        return {
+            "output": synthesis, "blueprint": blueprint,
+            "agent_outputs": agent_outputs,
+            "routing_weights": routing_probs.detach().cpu().tolist(),
+        }
+    def execute(self, task: str, kg_context: Any, context: Dict[str, Any]) -> Dict[str, Any]:
+        return self.forward(task, context)
+    def textual_backprop(self, global_gradient: str, performance_feedback: float, beta: float = 0.5) -> Dict[str, str]:
+        updates = {}
+        for name, agent in self.agents.items():
+            local_grad = f"{global_gradient} + {name} perf={performance_feedback:.3f}"
+            blended = local_grad
+            updates[name] = blended
+        self.routing_weights.data += performance_feedback * 0.01
+        return updates
+    def co_evolve_interactions(self) -> List[Dict]:
+        rewards = []
+        for interaction in self.interactions[-10:]:
+            n_agents = len(interaction.get("agent_outputs", {}))
+            complexity = len(interaction.get("blueprint", []))
+            reward = n_agents * 0.1 + min(complexity * 0.05, 0.5)
+            rewards.append({"reward": reward, "agents_involved": n_agents})
+        return rewards
+    def run_babyagi(self, objective: str, max_iterations: int = 20) -> Dict[str, Any]:
+        loop = BabyAGILoop(objective, max_iterations)
+        result = loop.run(self.agents["researcher"])
+        self.agent_tasks[objective] = loop
+        return result
+    def stats(self) -> Dict[str, Any]:
+        return {
+            "total_tasks": self.task_count,
+            "num_agents": len(self.agents),
+            "total_interactions": len(self.interactions),
+            "routing_weights": self.routing_weights.detach().cpu().tolist(),
+        }
+# ============================================================================
+# 5. EVOLUTION ENGINE (MAP-Elites + Quality-Diversity + Auto-Oversight)
+# ============================================================================
+class MAPelitesArchive:
+    def __init__(self, dims=(10, 10), ranges=None):
+        self.dims = dims
+        self.ranges = ranges or [(0, 1), (0, 1)]
+        self.archive: Dict[Tuple[int, int], Tuple[AetherConfig, float]] = {}
+    def _index(self, measures: np.ndarray) -> Tuple[int, int]:
+        indices = []
+        for m, (lo, hi), dim in zip(measures, self.ranges, self.dims):
+            norm = (m - lo) / (hi - lo + 1e-8)
+            idx = int(np.clip(norm * dim, 0, dim - 1))
+            indices.append(idx)
+        return tuple(indices)
+    def add(self, config: AetherConfig, fitness: float, measures: np.ndarray) -> bool:
+        idx = self._index(measures)
+        if idx not in self.archive or self.archive[idx][1] < fitness:
+            self.archive[idx] = (config, fitness)
+            return True
+        return False
+    def sample(self, n: int = 1) -> List[AetherConfig]:
+        if not self.archive:
+            return []
+        items = list(self.archive.values())
+        selected = random.sample(items, min(n, len(items)))
+        return [cfg for cfg, _ in selected]
+    def get_best(self) -> Optional[Tuple[AetherConfig, float]]:
+        if not self.archive:
+            return None
+        return max(self.archive.values(), key=lambda x: x[1])
+    def stats(self) -> Dict[str, float]:
+        total_cells = self.dims[0] * self.dims[1]
+        return {
+            "coverage": len(self.archive) / total_cells,
+            "qd_score": sum(f for _, f in self.archive.values()),
+            "max_fitness": max((f for _, f in self.archive.values()), default=0),
+        }
+class AetherEvolutionEngine:
+    def __init__(self, config: AetherConfig):
+        self.config = config
+        self.archive = MAPelitesArchive(
+            dims=config.archive_dims,
+            ranges=[(0, 1), (0, 1)],  # (symbolic_bias_proxy, fitness)
+        )
+        self.generation = 0
+        self.experience_log: List[Dict] = []
+    def generate_candidates(self, base_config: AetherConfig, population_size: int = 8) -> List[AetherConfig]:
+        candidates = [base_config]
+        archive_seeds = self.archive.sample(n=min(2, len(self.archive.archive)))
+        for _ in range(population_size - len(archive_seeds) - 1):
+            candidates.append(self._mutate(base_config))
+        for cfg in archive_seeds:
+            candidates.append(cfg)
+        return candidates
+    def _mutate(self, config: AetherConfig) -> AetherConfig:
+        vec = config.to_vector()
+        noise = np.random.normal(0, config.mutation_rate, size=vec.shape)
+        mutated = vec + noise * vec
+        new_cfg = AetherConfig.from_vector(mutated)
+        # Preserve meta fields
+        new_cfg.generations = config.generations
+        new_cfg.enable_self_modification = config.enable_self_modification
+        new_cfg.enable_parallel_agents = config.enable_parallel_agents
+        new_cfg.archive_dims = config.archive_dims
+        return new_cfg
+    def select(self, candidates: List[AetherConfig], fitness_scores: List[float],
+               alpha_exploration: float = 0.3) -> List[AetherConfig]:
+        if not candidates or not fitness_scores:
+            return candidates[:2] if len(candidates) >= 2 else candidates
+        vectors = np.array([c.to_vector() for c in candidates])
+        f = np.array(fitness_scores)
+        f_norm = (f - f.min()) / (f.max() - f.min() + 1e-8)
+        k = min(4, len(candidates) - 1)
+        novelties = []
+        for i, v in enumerate(vectors):
+            dists = np.linalg.norm(vectors - v, axis=1)
+            dists[i] = np.inf
+            knn = np.partition(dists, k)[:k]
+            novelties.append(np.mean(knn))
+        nov_norm = np.array(novelties) / (max(novelties) + 1e-8)
+        scores = f_norm * np.sqrt(nov_norm + 1e-8)
+        n_select = max(1, len(candidates) // 2)
+        top_indices = np.argsort(scores)[-n_select:]
+        return [candidates[i] for i in top_indices]
+    def mutate(self, candidates: List[AetherConfig], mutation_rate: float = 0.15) -> List[AetherConfig]:
+        mutated = []
+        for cfg in candidates:
+            new_cfg = self._mutate(cfg)
+            # Hard constraints
+            if new_cfg.macro_policy_dim > 512:
+                new_cfg.macro_policy_dim = 512
+            if new_cfg.micro_policy_dim > new_cfg.macro_policy_dim:
+                new_cfg.micro_policy_dim = new_cfg.macro_policy_dim // 2
+            mutated.append(new_cfg)
+        return mutated
+    def update_archive(self, candidates: List[AetherConfig], fitness_scores: List[float]):
+        for cfg, fitness in zip(candidates, fitness_scores):
+            if fitness == -float("inf"):
+                continue
+            # Behavioral descriptor: symbolic bias proxy = num_agents / max_agents
+            sym_proxy = cfg.num_agents / cfg.max_agents
+            measures = np.array([sym_proxy, np.clip(fitness, 0, 1)])
+            improved = self.archive.add(cfg, fitness, measures)
+            if improved:
+                logger.debug(f"Archive improved at cell fitness={fitness:.4f}")
+    def get_diversity_stats(self) -> Dict[str, float]:
+        return self.archive.stats()
+# ============================================================================
+# 6. AETHER CORE (Orchestrator + Evolution Loop + Auto-Oversight)
+# ============================================================================
+class AetherCore(nn.Module):
+    def __init__(self, config: Optional[AetherConfig] = None):
+        super().__init__()
+        self.config = config or AetherConfig()
+        self.generation = 0
+        self.architecture_history: List[Dict] = []
+        self.fitness_log: List[float] = []
+        self.metadata = {"birth": time.time(), "version": "0.2.0-autonomous"}
+        # Subsystems (lazily initialized where possible)
+        self._memory: Optional[CoALAMemory] = None
+        self._temporal: Optional[TemporalMemory] = None
+        self._evolution: Optional[AetherEvolutionEngine] = None
+        self._agents: Optional[AetherAgentOrchestrator] = None
+        self._knowledge: Optional[KnowledgeGraphEngine] = None
+        self._oversight: Optional[AutoOversight] = None
+        # Neuro-symbolic fusion gate (trainable)
+        self.symbolic_gate = nn.Parameter(torch.tensor(0.0))
+        self.neural_gate = nn.Parameter(torch.tensor(0.0))
+        logger.info("AETHER Core v0.2.0-autonomous initialized")
+    @property
+    def memory(self) -> CoALAMemory:
+        if self._memory is None:
+            self._memory = CoALAMemory(capacity=self.config.working_memory_capacity)
+        return self._memory
+    @property
+    def temporal(self) -> TemporalMemory:
+        if self._temporal is None:
+            self._temporal = TemporalMemory(buffer_size=self.config.episodic_buffer_size)
+        return self._temporal
+    @property
+    def evolution(self) -> AetherEvolutionEngine:
+        if self._evolution is None:
+            self._evolution = AetherEvolutionEngine(self.config)
+        return self._evolution
+    @property
+    def agents(self) -> AetherAgentOrchestrator:
+        if self._agents is None:
+            self._agents = AetherAgentOrchestrator(self.config)
+        return self._agents
+    @property
+    def knowledge(self) -> KnowledgeGraphEngine:
+        if self._knowledge is None:
+            self._knowledge = KnowledgeGraphEngine(
+                embedding_dim=self.config.kg_embedding_dim,
+                num_relations=self.config.kg_num_relations,
+            )
+        return self._knowledge
+    @property
+    def oversight(self) -> AutoOversight:
+        if self._oversight is None:
+            self._oversight = AutoOversight(self.config)
+        return self._oversight
+    def forward(self, task: str, context: Optional[Dict] = None) -> Dict[str, Any]:
+        context = context or {}
+        kg_context = self.knowledge.query(task, top_k=5)
+        self.memory.store({"task": task, "kg_context": kg_context, "t": time.time()})
+        result = self.agents.execute(task, kg_context, context)
+        # Neuro-symbolic fusion
+        sym_w = torch.sigmoid(self.symbolic_gate)
+        neu_w = torch.sigmoid(self.neural_gate)
+        total = sym_w + neu_w + 1e-8
+        sym_w, neu_w = sym_w / total, neu_w / total
+        self.temporal.store({
+            "task": task, "result": result,
+            "weights": {"symbolic": sym_w.item(), "neural": neu_w.item()},
+        })
+        return {
+            "output": result, "symbolic_weight": sym_w.item(),
+            "neural_weight": neu_w.item(), "kg_context": kg_context,
+            "generation": self.generation,
+        }
+    def _default_evaluator(self, candidate: AetherConfig) -> float:
+        """
+        Fully automated fitness function — no external API.
+        Scores: synthetic reasoning benchmarks + memory stress + knowledge graph coverage.
+        """
+        scores = []
+        try:
+            # 1. Agent orchestration efficiency
+            orch = AetherAgentOrchestrator(candidate)
+            task_embed = torch.randn(1, candidate.macro_policy_dim)
+            blueprint = orch.hierarchical.generate_blueprint(task_embed)
+            scores.append(min(1.0, len(blueprint) / 4.0))
+            # 2. Knowledge graph reasoning coverage
+            kg = KnowledgeGraphEngine(embedding_dim=candidate.kg_embedding_dim, num_relations=candidate.kg_num_relations)
+            for i in range(15):
+                kg.add_fact(f"Entity{i}", "connects_to", f"Entity{i+1}")
+            q = kg.query("Entity0 connects_to", top_k=5)
+            scores.append(min(1.0, len(q["results"]) / 3.0))
+            # 3. Memory throughput
+            mem = WorkingMemory(capacity=candidate.working_memory_capacity)
+            for i in range(50):
+                mem.store({"idx": i, "data": list(range(10))})
+            retrieved = mem.retrieve("idx", top_k=5)
+            scores.append(min(1.0, len(retrieved) / 5.0))
+            # 4. Config balance penalty (prefer moderate values)
+            balance = 1.0 - abs(candidate.macro_policy_dim - 256) / 256.0
+            scores.append(max(0.0, balance))
+        except Exception as e:
+            logger.warning(f"Fitness evaluation failed: {e}")
+            return -float("inf")
+        return float(np.mean(scores))
+    def evolve(self, num_generations: Optional[int] = None,
+               evaluator: Optional[Callable[[AetherConfig], float]] = None) -> Dict[str, Any]:
+        num_generations = num_generations or self.config.generations
+        evaluator = evaluator or self._default_evaluator
+        logger.info(f"=== AUTONOMOUS EVOLUTION: {num_generations} generations ===")
+        best_fitness = -float("inf")
+        best_config: Optional[AetherConfig] = None
+        for gen in range(num_generations):
+            self.generation = gen
+            logger.info(f"\n--- Generation {gen} ---")
+            # 1. Generate candidates
+            candidates = self.evolution.generate_candidates(self.config, self.config.population_size)
+            logger.info(f"Generated {len(candidates)} candidates")
+            # 2. Evaluate + Auto-oversight gate
+            fitness_scores = []
+            approved_candidates = []
+            for candidate in candidates:
+                # Automated decision — no human
+                approved, score, reason = self.oversight.decide(candidate, self)
+                if approved:
+                    # Full fitness evaluation
+                    fitness = evaluator(candidate)
+                    fitness_scores.append(fitness)
+                    approved_candidates.append(candidate)
+                    logger.info(f"  Candidate approved | reason={reason} | fitness={fitness:.4f}")
+                else:
+                    fitness_scores.append(-float("inf"))
+                    logger.info(f"  Candidate REJECTED | reason={reason}")
+            # 3. Auto-rollback check
+            current_best = max((f for f in fitness_scores if f > -float("inf")), default=-float("inf"))
+            if self.oversight.should_rollback(current_best):
+                logger.warning(f"ROLLBACK TRIGGERED: fitness dropped to {current_best:.4f}")
+                if self.oversight.last_good_config is not None:
+                    self.config = copy.deepcopy(self.oversight.last_good_config)
+                    logger.info("Rolled back to last known good configuration")
+                continue
+            # 4. Select (Performance-Novelty)
+            selected = self.evolution.select(candidates, fitness_scores)
+            # 5. Mutate
+            mutated = self.evolution.mutate(selected)
+            # 6. Validate via oversight (second pass for mutated)
+            validated = []
+            validated_scores = []
+            for m in mutated:
+                ok, _, reason = self.oversight.decide(m, self)
+                if ok:
+                    validated.append(m)
+                    validated_scores.append(evaluator(m))
+                else:
+                    logger.info(f"  Mutated candidate rejected: {reason}")
+            # 7. Integrate best
+            if validated and validated_scores:
+                best_idx = int(np.argmax(validated_scores))
+                best_mutated = validated[best_idx]
+                current_fitness = validated_scores[best_idx]
+                if current_fitness > best_fitness:
+                    best_fitness = current_fitness
+                    best_config = best_mutated
+                    self.config = best_mutated
+                    self.oversight.update_good_checkpoint(best_mutated, best_fitness)
+                    arch_hash = hashlib.sha256(
+                        json.dumps(asdict(best_mutated), sort_keys=True).encode()
+                    ).hexdigest()[:16]
+                    self.architecture_history.append({
+                        "generation": gen, "hash": arch_hash,
+                        "fitness": best_fitness, "config": asdict(best_mutated),
+                    })
+                    logger.info(f"*** NEW BEST: gen={gen} fitness={best_fitness:.4f} hash={arch_hash} ***")
+            # 8. Update MAP-Elites archive
+            self.evolution.update_archive(candidates, fitness_scores)
+            self.fitness_log.append(best_fitness)
+            # 9. Self-reflection per generation
+            reflection = self.self_reflect()
+            logger.info(f"Reflection: {reflection['recommendations']}")
+        return {
+            "best_fitness": best_fitness,
+            "best_config": asdict(best_config) if best_config else None,
+            "generations": num_generations,
+            "history": self.architecture_history,
+            "oversight_summary": self.oversight.summary(),
+            "archive_stats": self.evolution.get_diversity_stats(),
+        }
+    def self_reflect(self) -> Dict[str, Any]:
+        recs = []
+        if len(self.fitness_log) > 5:
+            recent = self.fitness_log[-5:]
+            if max(recent) - min(recent) < 0.01:
+                recs.append("Fitness plateau detected. Increase diversity or mutation rate.")
+            if recent[-1] < recent[0]:
+                recs.append("Declining trend. Rollback or expand search.")
+        sym = torch.sigmoid(self.symbolic_gate).item()
+        if sym < 0.3:
+            recs.append("Symbolic reasoning underutilized. Boost KG integration.")
+        elif sym > 0.7:
+            recs.append("Symbolic dominance. Increase neural flexibility.")
+        return {
+            "generation": self.generation,
+            "architectures_tested": len(self.architecture_history),
+            "fitness_trend": self.fitness_log,
+            "neuro_symbolic_balance": {"symbolic": sym, "neural": 1.0 - sym},
+            "recommendations": recs,
+            "oversight": self.oversight.summary(),
+        }
+    def export_state(self) -> Dict[str, Any]:
+        return {
+            "config": asdict(self.config),
+            "generation": self.generation,
+            "architecture_history": self.architecture_history,
+            "fitness_log": self.fitness_log,
+            "metadata": self.metadata,
+            "knowledge": self.knowledge.export(),
+            "memory": self.memory.export(),
+            "model_state_dict": {k: v.cpu().tolist() for k, v in self.state_dict().items()},
+        }
+    @classmethod
+    def from_state(cls, state: Dict[str, Any]) -> "AetherCore":
+        cfg = AetherConfig(**state["config"])
+        core = cls(config=cfg)
+        core.generation = state["generation"]
+        core.architecture_history = state["architecture_history"]
+        core.fitness_log = state["fitness_log"]
+        core.metadata = state["metadata"]
+        return core
+# ============================================================================
+# 7. RUNNABLE MAIN
+# ============================================================================
+def run_autonomous_demo():
+    print("=" * 70)
+    print(" AETHER v0.2.0 — AUTONOMOUS SELF-EVOLVING ARCHITECTURE")
+    print(" Zero human oversight. Automated regression gating + rollback.")
+    print("=" * 70)
+    config = AetherConfig(
+        population_size=6,
+        generations=5,
+        mutation_rate=0.12,
+        macro_policy_dim=128,
+        micro_policy_dim=64,
+        num_agents=4,
+        working_memory_capacity=16,
+        episodic_buffer_size=500,
+        kg_embedding_dim=64,
+        kg_num_relations=10,
+    )
+    core = AetherCore(config)
+    # Seed knowledge graph
+    print("\n[1] Seeding Knowledge Graph...")
+    kg = core.knowledge
+    facts = [
+        ("Intelligence", "requires", "Reasoning"),
+        ("Reasoning", "requires", "Memory"),
+        ("Memory", "enables", "Learning"),
+        ("Learning", "produces", "Intelligence"),
+        ("Agent", "has_role", "Researcher"),
+        ("Agent", "has_role", "Engineer"),
+        ("Agent", "has_role", "Analyzer"),
+        ("Agent", "has_role", "Integrator"),
+    ]
+    for h, r, t in facts:
+        kg.add_fact(h, r, t)
+    print(f"   KG: {kg.stats()}")
+    # Single forward pass demo
+    print("\n[2] Forward Pass Demo (neuro-symbolic query)...")
+    result = core.forward("Intelligence requires")
+    print(f"   Symbolic weight: {result['symbolic_weight']:.3f}")
+    print(f"   Neural weight:   {result['neural_weight']:.3f}")
+    print(f"   Results: {len(result['kg_context']['results'])} items")
+    for r in result["kg_context"]["results"]:
+        print(f"      → {r['head']} --{r['relation']}--> {r['tail']} (conf={r.get('confidence',0):.2f}, src={r.get('source','?')})")
+    # Agent orchestration demo
+    print("\n[3] Agent Orchestration Demo...")
+    agent_result = core.agents.execute("Optimize reasoning pipeline", {}, {})
+    print(f"   Leader synthesis: {agent_result['output'][:80]}...")
+    print(f"   Agents activated: {list(agent_result['agent_outputs'].keys())}")
+    print(f"   Routing weights: {[f'{w:.3f}' for w in agent_result['routing_weights']]}")
+    # Evolution loop (fully automated)
+    print("\n[4] AUTONOMOUS EVOLUTION LOOP (no human oversight)...")
+    evolution_result = core.evolve(num_generations=5)
+    print("\n[5] EVOLUTION RESULTS")
+    print(f"   Best fitness achieved:     {evolution_result['best_fitness']:.4f}")
+    print(f"   Generations run:           {evolution_result['generations']}")
+    print(f"   Architecture changes:      {len(evolution_result['history'])}")
+    print(f"   MAP-Elites coverage:       {evolution_result['archive_stats']['coverage']:.2%}")
+    print(f"   MAP-Elites QD score:       {evolution_result['archive_stats']['qd_score']:.2f}")
+    print(f"   Auto-oversight approved:   {evolution_result['oversight_summary']['approved']}")
+    print(f"   Auto-oversight rejected:     {evolution_result['oversight_summary']['rejected']}")
+    print(f"   Consecutive rejections:    {evolution_result['oversight_summary']['consecutive_rejections']}")
+    print("\n[6] Architecture Evolution Trajectory")
+    for entry in evolution_result["history"]:
+        print(f"   Gen {entry['generation']:02d} | hash={entry['hash']} | fitness={entry['fitness']:.4f} | "
+              f"agents={entry['config']['num_agents']} | macro={entry['config']['macro_policy_dim']} | "
+              f"mut_rate={entry['config']['mutation_rate']:.3f}")
+    # Self-reflection
+    print("\n[7] Self-Reflection")
+    reflection = core.self_reflect()
+    for rec in reflection["recommendations"]:
+        print(f"   → {rec}")
+    # Export checkpoint
+    print("\n[8] Exporting state checkpoint...")
+    state = core.export_state()
+    checkpoint_path = "/app/aether_checkpoint.json"
+    with open(checkpoint_path, "w") as f:
+        json.dump(state, f, indent=2, default=str)
+    print(f"   Checkpoint saved to: {checkpoint_path}")
+    print("\n" + "=" * 70)
+    print(" DEMO COMPLETE. AETHER is fully autonomous.")
+    print("=" * 70)
+    return core, evolution_result
+if __name__ == "__main__":
+    run_autonomous_demo()