Spaces:

wehe1pwe
/

math-under-llm

Running

App Files Files Community

Alex W. commited on 13 days ago

Commit

e1ce951

1 Parent(s): a2dfa0f

debug for gemma-4-31b-it

Browse files

Files changed (1) hide show

core/fetcher.py +32 -3

core/fetcher.py CHANGED Viewed

@@ -80,7 +80,6 @@ def load_tensor_remote(
     header_size: int,
     token: str = None
 ) -> torch.Tensor | None:
-    """远程加载单个 tensor，返回 float32"""
     if tensor_name not in header:
         return None
@@ -94,10 +93,27 @@ def load_tensor_remote(
     if dtype_str in UNSUPPORTED_SVD_DTYPES:
         raise ValueError(f"dtype={dtype_str} 为量化格式，无法 SVD")
-    torch_dtype, _ = DTYPE_MAP[dtype_str]
     abs_start = 8 + header_size + offsets[0]
     abs_end   = 8 + header_size + offsets[1] - 1
     req_headers = {"Range": f"bytes={abs_start}-{abs_end}"}
     if token:
         req_headers["Authorization"] = f"Bearer {token}"
@@ -105,6 +121,14 @@ def load_tensor_remote(
     r = requests.get(url, headers=req_headers, timeout=120)
     r.raise_for_status()
     if torch_dtype == torch.bfloat16:
         tensor = torch.frombuffer(
             bytearray(r.content), dtype=torch.int16
@@ -112,7 +136,12 @@ def load_tensor_remote(
     else:
         tensor = torch.frombuffer(bytearray(r.content), dtype=torch_dtype)
-    return tensor.reshape(shape).float()
 # ─────────────────────────────────────────────

     header_size: int,
     token: str = None
 ) -> torch.Tensor | None:
     if tensor_name not in header:
         return None
     if dtype_str in UNSUPPORTED_SVD_DTYPES:
         raise ValueError(f"dtype={dtype_str} 为量化格式，无法 SVD")
+    torch_dtype, bytes_per_elem = DTYPE_MAP[dtype_str]
     abs_start = 8 + header_size + offsets[0]
     abs_end   = 8 + header_size + offsets[1] - 1
+    # ── 调试：打印偏移信息 ────────────────────────
+    expected_bytes = offsets[1] - offsets[0]
+    expected_elems = 1
+    for d in shape:
+        expected_elems *= d
+    print(
+        f"[FETCH] {tensor_name}\n"
+        f"  shape={shape} dtype={dtype_str}\n"
+        f"  data_offsets={offsets}\n"
+        f"  abs_start={abs_start} abs_end={abs_end}\n"
+        f"  expected_bytes={expected_bytes} "
+        f"expected_elems={expected_elems} "
+        f"bytes_per_elem={bytes_per_elem}\n"
+        f"  check: {expected_elems * bytes_per_elem} == {expected_bytes} "
+        f"{'✅' if expected_elems * bytes_per_elem == expected_bytes else '❌ 不匹配!'}\n"
+    )
     req_headers = {"Range": f"bytes={abs_start}-{abs_end}"}
     if token:
         req_headers["Authorization"] = f"Bearer {token}"
     r = requests.get(url, headers=req_headers, timeout=120)
     r.raise_for_status()
+    # ── 调试：打印实际收到的字节数 ────────────────
+    actual_bytes = len(r.content)
+    print(
+        f"  actual_bytes={actual_bytes} "
+        f"{'✅' if actual_bytes == expected_bytes else '❌ 字节数不匹配!'}\n"
+        f"  前8字节(hex)={r.content[:8].hex()}\n"
+    )
     if torch_dtype == torch.bfloat16:
         tensor = torch.frombuffer(
             bytearray(r.content), dtype=torch.int16
     else:
         tensor = torch.frombuffer(bytearray(r.content), dtype=torch_dtype)
+    result = tensor.reshape(shape).float()
+    # ── 调试：打印结果首行 ────────────────────────
+    print(f"  result[0,:5]={result[0,:5].tolist()}\n")
+    return result
 # ─────────────────────────────────────────────