swayam1111
/

riemann-vmix

ml-intern

Model card Files Files and versions

xet

Community

swayam1111 commited on 6 days ago

Commit

42bc813

verified ·

1 Parent(s): 7729174

Upload problem_solvers/cross_module_analysis.py with huggingface_hub

Browse files

Files changed (1) hide show

problem_solvers/cross_module_analysis.py +173 -0

problem_solvers/cross_module_analysis.py ADDED Viewed

	@@ -0,0 +1,173 @@

+"""
+CROSS-MODULE ANALYSES enabled by v_mix unification
+====================================================
+1. Spectral features (v2) → prime prediction accuracy (v3)
+2. Transfer learning: operator fitness predicts prime gap size
+3. Conjecture validation: use all 100k zeros to test generated conjectures
+"""
+import numpy as np
+from typing import Dict, List
+from sklearn.ensemble import GradientBoostingRegressor
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import mean_absolute_error
+class CrossModuleAnalyzer:
+    """
+    Cross-module pipeline: do spectral features from zero distribution
+    improve ML prime prediction accuracy beyond raw zero oscillations?
+    """
+    def __init__(self, zeros: List[float]):
+        self.zeros = np.array(zeros)
+        self.results = {}
+    def _sieve_primes(self, limit: int) -> np.ndarray:
+        sieve = np.ones(limit + 1, dtype=bool)
+        sieve[:2] = False
+        for i in range(2, int(limit ** 0.5) + 1):
+            if sieve[i]:
+                sieve[i * i::i] = False
+        return np.where(sieve)[0]
+    def _compute_spectral_features(self, x: float, n_zeros: int = 500) -> np.ndarray:
+        """Compute spectral features (spacings, pair correlations) at position x."""
+        gamma_subset = self.zeros[:n_zeros]
+        log_x = np.log(max(x, 2))
+        # Zero oscillation contributions (v3-style)
+        contributions = []
+        for gamma in gamma_subset:
+            denom = 0.25 + gamma * gamma
+            cos_term = np.cos(gamma * log_x) * 0.5
+            sin_term = np.sin(gamma * log_x) * gamma
+            contributions.append(-2 * np.sqrt(x) * (cos_term + sin_term) / denom)
+        # Spectral features from local zero distribution
+        # Use window of 100 zeros around where γ ≈ x (conceptually)
+        target_idx = min(len(self.zeros) - 100, int(np.searchsorted(self.zeros, x) + 50))
+        local_zeros = self.zeros[target_idx:target_idx + 100]
+        local_spacings = np.diff(local_zeros)
+        features = [
+            np.mean(contributions),
+            np.std(contributions),
+            np.min(contributions),
+            np.max(contributions),
+            np.mean(local_spacings),
+            np.std(local_spacings),
+            np.min(local_spacings),
+            np.max(local_spacings),
+            x % 2,
+            x % 3,
+            x % 6,
+            np.log(x),
+            1.0 / np.log(x + 1),
+        ]
+        return np.array(features)
+    def analyze_transfer_learning(self, train_limit: int = 50000) -> Dict:
+        """
+        Test: do spectral features improve prime gap prediction?
+        """
+        primes = self._sieve_primes(train_limit)
+        gaps = np.diff(primes)
+        # Build features at each prime
+        X = []
+        y = []
+        for i in range(0, min(len(gaps) - 1, 2000), 1):  # sample for speed
+            p = primes[i]
+            feat = self._compute_spectral_features(float(p), n_zeros=200)
+            X.append(feat)
+            y.append(gaps[i])
+        X = np.array(X)
+        y = np.array(y)
+        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
+        # Model with spectral features
+        model = GradientBoostingRegressor(n_estimators=100, max_depth=4, random_state=42)
+        model.fit(X_train, y_train)
+        y_pred = model.predict(X_test)
+        mae_spectral = mean_absolute_error(y_test, y_pred)
+        # Baseline: just mean
+        baseline_mae = np.mean(np.abs(np.mean(y_train) - y_test))
+        # Feature importance
+        importance = model.feature_importances_.tolist()
+        self.results['transfer_learning'] = {
+            'train_limit': train_limit,
+            'n_samples': len(y),
+            'mae_spectral': float(mae_spectral),
+            'baseline_mae': float(baseline_mae),
+            'improvement': float((baseline_mae - mae_spectral) / baseline_mae),
+            'feature_importance': importance,
+            'best_feature_idx': int(np.argmax(importance)),
+        }
+        return self.results
+    def analyze_conjecture_validation(self) -> Dict:
+        """
+        Validate a conjecture: 'larger spectral rigidity → smaller prime gaps'.
+        Compute Δ₃ statistic for windows of zeros, correlate with prime gaps
+        in corresponding regions.
+        """
+        # Simplified: sample a few windows
+        window_sizes = [1000, 5000, 10000]
+        rigidity_scores = []
+        avg_gaps = []
+        primes = self._sieve_primes(100000)
+        all_gaps = np.diff(primes)
+        for w in window_sizes:
+            if w > len(self.zeros):
+                continue
+            local_spacings = np.diff(self.zeros[:w])
+            normalized = local_spacings / np.mean(local_spacings)
+            # Simple rigidity: variance of spacings (lower = more rigid)
+            rigidity = 1.0 / (np.var(normalized) + 0.1)
+            rigidity_scores.append(rigidity)
+            # Corresponding prime region (very rough correspondence)
+            avg_gap = np.mean(all_gaps[:min(w, len(all_gaps))])
+            avg_gaps.append(avg_gap)
+        if len(rigidity_scores) >= 2:
+            corr = float(np.corrcoef(rigidity_scores, avg_gaps)[0, 1])
+        else:
+            corr = 0.0
+        self.results['conjecture_validation'] = {
+            'conjecture': 'Higher spectral rigidity → smaller prime gaps',
+            'correlation': corr,
+            'supported': abs(corr) > 0.5,
+            'rigidity_scores': rigidity_scores,
+            'avg_gaps': avg_gaps,
+        }
+        return self.results
+    def run_all(self) -> Dict:
+        print("\n[CROSS-MODULE] Transfer learning: spectral → prime gaps")
+        self.analyze_transfer_learning(train_limit=50000)
+        print("\n[CROSS-MODULE] Conjecture validation: rigidity ↔ gaps")
+        self.analyze_conjecture_validation()
+        return self.results
+    def summary(self) -> str:
+        r = self.results
+        s = f"Cross-Module Analysis\n{'='*50}\n"
+        if 'transfer_learning' in r:
+            tl = r['transfer_learning']
+            s += f"Transfer learning MAE: {tl['mae_spectral']:.2f} (baseline: {tl['baseline_mae']:.2f})\n"
+            s += f"Improvement: {tl['improvement']:.1%}\n"
+            s += f"Best feature index: {tl['best_feature_idx']}\n"
+        if 'conjecture_validation' in r:
+            cv = r['conjecture_validation']
+            s += f"Conjecture: {cv['conjecture']}\n"
+            s += f"Correlation: {cv['correlation']:.4f} → {'SUPPORTED' if cv['supported'] else 'NOT SUPPORTED'}\n"
+        return s