Spaces:

TencentARC
/

Pixal3D

Running on Zero

App Files Files Community

Yang2001 commited on 2 days ago

Commit

bcbe6d1

1 Parent(s): f4d81f2

Add GPU/CUDA diagnostics at startup

Browse files

Files changed (2) hide show

app.py +34 -1
autotune_cache.json +12 -0

app.py CHANGED Viewed

@@ -4,8 +4,41 @@ import argparse
 import math
 import time
 import shutil
-import cv2
 import torch
 import numpy as np
 import base64
 import io

 import math
 import time
 import shutil
+# ============================================================================
+# GPU / CUDA Environment Diagnostics
+# ============================================================================
 import torch
+print("=" * 60)
+print("[Diagnostics] PyTorch version:", torch.__version__)
+print("[Diagnostics] CUDA available:", torch.cuda.is_available())
+if torch.cuda.is_available():
+    print("[Diagnostics] CUDA version:", torch.version.cuda)
+    print("[Diagnostics] cuDNN version:", torch.backends.cudnn.version())
+    for i in range(torch.cuda.device_count()):
+        name = torch.cuda.get_device_name(i)
+        cap = torch.cuda.get_device_capability(i)
+        mem = torch.cuda.get_device_properties(i).total_mem / 1024**3
+        print(f"[Diagnostics] GPU {i}: {name}, compute capability: sm_{cap[0]}{cap[1]}, memory: {mem:.1f} GB")
+else:
+    print("[Diagnostics] WARNING: No CUDA GPU detected!")
+try:
+    import flash_attn_3
+    print("[Diagnostics] flash_attn_3 imported OK")
+    from flash_attn_interface import flash_attn_func
+    print("[Diagnostics] flash_attn_func imported OK")
+except Exception as e:
+    print(f"[Diagnostics] flash_attn_3 import FAILED: {e}")
+try:
+    result = subprocess.run(["nvidia-smi"], capture_output=True, text=True, timeout=10)
+    print("[Diagnostics] nvidia-smi:\n" + result.stdout[:500])
+except Exception as e:
+    print(f"[Diagnostics] nvidia-smi failed: {e}")
+print("=" * 60)
+import cv2
 import numpy as np
 import base64
 import io

autotune_cache.json CHANGED Viewed

@@ -25039,6 +25039,18 @@
                 "maxnreg": null,
                 "pre_hook": null,
                 "ir_override": null
             }
         },
         "flex_gemm.kernels.triton.spconv.sparse_conv_implicit_gemm.sparse_conv_fwd_implicit_gemm_kernel": {},

                 "maxnreg": null,
                 "pre_hook": null,
                 "ir_override": null
+            },
+            "(23, 7739451, 6, 8, 'torch.float32', 'torch.uint32', 'torch.float32', 'torch.float32')": {
+                "kwargs": {
+                    "BM": 16,
+                    "BK": 8
+                },
+                "num_warps": 2,
+                "num_ctas": 1,
+                "num_stages": 3,
+                "maxnreg": null,
+                "pre_hook": null,
+                "ir_override": null
             }
         },
         "flex_gemm.kernels.triton.spconv.sparse_conv_implicit_gemm.sparse_conv_fwd_implicit_gemm_kernel": {},