lorenzovaquero
/

UniSITH

Model card Files Files and versions

lorenzovaquero commited on about 1 month ago

Commit

96cd4af

·

verified ·

1 Parent(s): d7bf1a9

Add UniSITH source code

Files changed (1) hide show

unimodal_sith/__init__.py +32 -0

unimodal_sith/__init__.py ADDED Viewed

	@@ -0,0 +1,32 @@

+"""
+UniSITH: Unimodal Semantic Inspection of Transformer Heads
+A framework for interpreting unimodal vision transformer models by decomposing
+attention head weights and attributing visual concepts from a captioned image pool.
+Adapted from SITH (Vaquero et al., 2025): "From Weights to Concepts: Data-Free
+Interpretability of CLIP via Singular Vector Decomposition" (arXiv:2603.24653)
+Key difference from original SITH:
+  - Works with ANY ViT (not just CLIP)
+  - Uses captioned images as concept pool (not text from ConceptNet)
+  - Captions provide human interpretability
+  - No cross-modal alignment needed
+"""
+from .unisith import UniSITH, HeadInterpretation, SingularVectorInterpretation
+from .concept_pool import VisualConceptPool
+from .weight_extraction import WeightExtractor
+from .comp import comp, comp_batch, top_k_selection
+__version__ = "0.1.0"
+__all__ = [
+    "UniSITH",
+    "HeadInterpretation",
+    "SingularVectorInterpretation",
+    "VisualConceptPool",
+    "WeightExtractor",
+    "comp",
+    "comp_batch",
+    "top_k_selection",
+]