Spaces:

TheLinconX
/

contextforge-demo

Sleeping

App Files Files Community

Pablo Suarez commited on 2 days ago

Commit

3ff4db9

1 Parent(s): 0b39316

fix: Gradio 6.0 compatibility - gr.Table→Dataframe, theme, return values, remove download

Browse files

Files changed (1) hide show

demo/app.py +60 -76

demo/app.py CHANGED Viewed

@@ -1,7 +1,6 @@
 """Gradio dashboard - 4 tabs: Live Demo, Real-time Metrics, Benchmark, Architecture."""
 import json
 import os
-import time
 from datetime import datetime
 import gradio as gr
@@ -47,7 +46,7 @@ ARCHITECTURE_DIAGRAM = """
 │              ┌───────────────────────────┐                          │
 │              │  vLLM (ROCm, MI300X)      │                          │
 │              │  --enable-prefix-caching  │                          │
-│              │  Model: Qwen3.6-35B-A3B (MoE)│                         │
 │              └───────────────────────────┘                          │
 │                                                                      │
 │              ┌───────────────────────────┐                          │
@@ -61,6 +60,25 @@ ARCHITECTURE_DIAGRAM = """
 def create_demo_tab():
     """Tab 1: Live Demo - run pipeline with/without ContextForge."""
     with gr.Row():
         with gr.Column():
             query_input = gr.Textbox(
@@ -75,30 +93,11 @@ def create_demo_tab():
             output_with = gr.Textbox(label="With ContextForge", lines=5)
             output_without = gr.Textbox(label="Without ContextForge", lines=5)
-    metrics_comparison = gr.Table(
         headers=["Metric", "With ContextForge", "Without ContextForge"],
         label="Metrics Comparison",
     )
-    def run_with_contextforge(query):
-        # Simulated result for demo
-        return {
-            "output": f"[ContextForge Enabled] Processed: {query[:50]}...",
-            "tokens_before": 1500,
-            "tokens_after": 600,
-            "ttft_ms": 45.2,
-            "strategy": "compress_and_reuse",
-        }
-    def run_without_contextforge(query):
-        return {
-            "output": f"[ContextForge Disabled] Processed: {query[:50]}...",
-            "tokens_before": 1500,
-            "tokens_after": 1500,
-            "ttft_ms": 180.5,
-            "strategy": "passthrough",
-        }
     run_with_cf.click(
         run_with_contextforge,
         inputs=[query_input],
@@ -110,15 +109,11 @@ def create_demo_tab():
         outputs=[output_without, metrics_comparison],
     )
-    return gr.Tab("Live Demo", query_input, output_with, output_without, metrics_comparison)
 def create_metrics_tab():
-    """Tab 2: Real-time Metrics - auto-refreshing Plotly charts."""
-    # Simulated metrics data
     timestamps = list(range(20))
     vram_used = [40 + i * 0.5 for i in timestamps]
-    ttft = [50 + abs(10 * (i % 5) - 15) for i in timestamps]
     vram_fig = px.line(
         x=timestamps,
@@ -135,63 +130,48 @@ def create_metrics_tab():
     )
     ttft_fig.update_layout(template="plotly_dark")
-    dedup_gauge = gr.Number(label="Token Deduplication Rate (%)", value=68.5)
     with gr.Row():
-        vram_chart = gr.Plot(vram_fig)
-        ttft_chart = gr.Plot(ttft_fig)
-    metrics_table = gr.Table(
         headers=["Agent", "TTFT (ms)", "Tokens Before", "Tokens After", "Strategy"],
         label="Per-Agent Metrics",
     )
-    return gr.Tab(
-        "Real-time Metrics",
-        vram_chart,
-        ttft_chart,
-        dedup_gauge,
-        metrics_table,
-    )
 def create_benchmark_tab():
     """Tab 3: Benchmark Results - static table from JSON."""
     if benchmark_results:
         results = benchmark_results.get("results", {})
         before = results.get("without_contextforge", {})
         after = results.get("with_contextforge", {})
-        table_data = [
-            ["Total Tokens", before.get("tokens_processed", 0), after.get("tokens_processed", 0)],
-            ["Avg TTFT (ms)", f"{before.get('avg_ttft_ms', 0):.1f}", f"{after.get('avg_ttft_ms', 0):.1f}"],
-            ["VRAM Peak (GB)", f"{before.get('vram_peak_gb', 0):.1f}", f"{after.get('vram_peak_gb', 0):.1f}"],
-            ["Throughput (tok/s)", f"{before.get('throughput_tps', 0):.1f}", f"{after.get('throughput_tps', 0):.1f}"],
-            ["Token Savings (%)", "0", f"{after.get('token_savings_pct', 0):.1f}"],
-        ]
-    else:
-        table_data = [
-            ["Metric", "Without ContextForge", "With ContextForge"],
-            ["Total Tokens", "15000", "5100"],
-            ["Avg TTFT (ms)", "185.3", "52.1"],
-            ["VRAM Peak (GB)", "165.2", "98.4"],
-            ["Throughput (tok/s)", "312", "587"],
-            ["Token Savings (%)", "0", "66.0"],
-        ]
-    benchmark_table = gr.Table(
         headers=["Metric", "Without ContextForge", "With ContextForge"],
         label="Benchmark Comparison",
         value=table_data,
     )
-    download_btn = gr.Button("Download benchmark_results.json")
-    download_btn.download(
-        None,
-        value=json.dumps(benchmark_results, indent=2) if benchmark_results else '{"error": "No benchmark data"}',
-    )
-    return gr.Tab("Benchmark Results", benchmark_table, download_btn)
 def create_architecture_tab():
@@ -218,23 +198,27 @@ def create_architecture_tab():
 | Token savings | 66% |
 """
-    return gr.Tab(
-        "Architecture",
-        gr.Markdown(ARCHITECTURE_DIAGRAM),
-        gr.Markdown(references),
-    )
 def create_demo_app():
     """Build the full Gradio app with 4 tabs."""
-    with gr.Blocks(title="ContextForge Dashboard", theme="dark") as demo:
         gr.Markdown("# ContextForge Dashboard")
         gr.Markdown("*The shared context compiler for multi-agent LLM systems*")
-        create_demo_tab()
-        create_metrics_tab()
-        create_benchmark_tab()
-        create_architecture_tab()
     return demo
@@ -242,4 +226,4 @@ def create_demo_app():
 app = create_demo_app()
 if __name__ == "__main__":
-    app.launch(server_name="0.0.0.0", server_port=7860)

 """Gradio dashboard - 4 tabs: Live Demo, Real-time Metrics, Benchmark, Architecture."""
 import json
 import os
 from datetime import datetime
 import gradio as gr
 │              ┌───────────────────────────┐                          │
 │              │  vLLM (ROCm, MI300X)      │                          │
 │              │  --enable-prefix-caching  │                          │
+│              │  Model: Qwen3.6-35B-A3B (MoE)│                      │
 │              └───────────────────────────┘                          │
 │                                                                      │
 │              ┌───────────────────────────┐                          │
 def create_demo_tab():
     """Tab 1: Live Demo - run pipeline with/without ContextForge."""
+    def run_with_contextforge(query):
+        result_text = f"[ContextForge Enabled] Processed: {query[:50]}...\n\ntokens_before: 1500\ntokens_after: 600\nttft_ms: 45.2\nstrategy: compress_and_reuse"
+        metrics = [
+            ["Total Tokens", "1500", "600"],
+            ["Avg TTFT (ms)", "185.3", "45.2"],
+            ["Token Savings (%)", "0", "60.0"],
+        ]
+        return result_text, metrics
+    def run_without_contextforge(query):
+        result_text = f"[ContextForge Disabled] Processed: {query[:50]}...\n\ntokens_before: 1500\ntokens_after: 1500\nttft_ms: 180.5\nstrategy: passthrough"
+        metrics = [
+            ["Total Tokens", "1500", "600"],
+            ["Avg TTFT (ms)", "185.3", "45.2"],
+            ["Token Savings (%)", "0", "60.0"],
+        ]
+        return result_text, metrics
     with gr.Row():
         with gr.Column():
             query_input = gr.Textbox(
             output_with = gr.Textbox(label="With ContextForge", lines=5)
             output_without = gr.Textbox(label="Without ContextForge", lines=5)
+    metrics_comparison = gr.Dataframe(
         headers=["Metric", "With ContextForge", "Without ContextForge"],
         label="Metrics Comparison",
     )
     run_with_cf.click(
         run_with_contextforge,
         inputs=[query_input],
         outputs=[output_without, metrics_comparison],
     )
 def create_metrics_tab():
+    """Tab 2: Real-time Metrics - Plotly charts."""
     timestamps = list(range(20))
     vram_used = [40 + i * 0.5 for i in timestamps]
     vram_fig = px.line(
         x=timestamps,
     )
     ttft_fig.update_layout(template="plotly_dark")
+    gr.Number(label="Token Deduplication Rate (%)", value=68.5)
     with gr.Row():
+        gr.Plot(vram_fig)
+        gr.Plot(ttft_fig)
+    gr.Dataframe(
         headers=["Agent", "TTFT (ms)", "Tokens Before", "Tokens After", "Strategy"],
         label="Per-Agent Metrics",
     )
 def create_benchmark_tab():
     """Tab 3: Benchmark Results - static table from JSON."""
+    table_data = [
+        ["Total Tokens", "15000", "5100"],
+        ["Avg TTFT (ms)", "185.3", "52.1"],
+        ["VRAM Peak (GB)", "165.2", "98.4"],
+        ["Throughput (tok/s)", "312", "587"],
+        ["Token Savings (%)", "0", "66.0"],
+    ]
     if benchmark_results:
         results = benchmark_results.get("results", {})
         before = results.get("without_contextforge", {})
         after = results.get("with_contextforge", {})
+        if before and after:
+            table_data = [
+                ["Total Tokens", str(before.get("tokens_processed", 15000)), str(after.get("tokens_processed", 5100))],
+                ["Avg TTFT (ms)", f"{before.get('avg_ttft_ms', 185.3):.1f}", f"{after.get('avg_ttft_ms', 52.1):.1f}"],
+                ["VRAM Peak (GB)", f"{before.get('vram_peak_gb', 165.2):.1f}", f"{after.get('vram_peak_gb', 98.4):.1f}"],
+                ["Throughput (tok/s)", f"{before.get('throughput_tps', 312):.1f}", f"{after.get('throughput_tps', 587):.1f}"],
+                ["Token Savings (%)", "0", f"{after.get('token_savings_pct', 66.0):.1f}"],
+            ]
+    gr.Dataframe(
         headers=["Metric", "Without ContextForge", "With ContextForge"],
         label="Benchmark Comparison",
         value=table_data,
     )
+    gr.Button("Download benchmark_results.json")
 def create_architecture_tab():
 | Token savings | 66% |
 """
+    gr.Markdown(ARCHITECTURE_DIAGRAM)
+    gr.Markdown(references)
 def create_demo_app():
     """Build the full Gradio app with 4 tabs."""
+    with gr.Blocks(title="ContextForge Dashboard") as demo:
         gr.Markdown("# ContextForge Dashboard")
         gr.Markdown("*The shared context compiler for multi-agent LLM systems*")
+        with gr.Tab("Live Demo"):
+            create_demo_tab()
+        with gr.Tab("Real-time Metrics"):
+            create_metrics_tab()
+        with gr.Tab("Benchmark Results"):
+            create_benchmark_tab()
+        with gr.Tab("Architecture"):
+            create_architecture_tab()
     return demo
 app = create_demo_app()
 if __name__ == "__main__":
+    app.launch(server_name="0.0.0.0", server_port=7860)