Spaces:

junaid17
/

DamageLens

Sleeping

App Files Files Community

DamageLens / scripts /prediction_helper.py

junaid17

Upload 3 files

1782395 verified 17 days ago

raw

history blame contribute delete

7.17 kB

	import os
	import torch
	import torch.nn as nn
	from torchvision import transforms, models
	from PIL import Image, UnidentifiedImageError
	from transformers import DeiTForImageClassification, DeiTImageProcessor

	# ================================ ResNet-18 Classifier ================================
	class Car_Classifier_Resnet(nn.Module):
	def __init__(self, num_classes):
	super().__init__()
	self.model = models.resnet18(weights="DEFAULT")

	for param in self.model.parameters():
	param.requires_grad = False
	for param in self.model.layer3.parameters():
	param.requires_grad = True
	for param in self.model.layer4.parameters():
	param.requires_grad = True

	# Replace FC head
	self.model.fc = nn.Sequential(
	nn.Dropout(0.5),
	nn.Linear(self.model.fc.in_features, 256),
	nn.ReLU(),
	nn.Dropout(0.3),
	nn.Linear(256, num_classes)
	)

	def forward(self, x):
	return self.model(x)


	class ResnetCarDamagePredictor:
	def __init__(self, checkpoint_path, class_map):
	self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	self.class_map = class_map

	self.test_transforms = transforms.Compose([
	transforms.Resize((128, 128)),
	transforms.ToTensor(),
	transforms.Normalize([0.485, 0.456, 0.406],
	[0.229, 0.224, 0.225])
	])

	try:
	self.model = Car_Classifier_Resnet(num_classes=len(class_map))
	checkpoint = torch.load(checkpoint_path, map_location=self.device)
	self.model.load_state_dict(checkpoint["model_state_dict"])
	self.model.to(self.device)
	self.model.eval()
	except Exception as e:
	raise RuntimeError(f"Failed to load ResNet model: {str(e)}")

	def resnet_predict(self, image_input):
	try:
	if isinstance(image_input, str):
	image = Image.open(image_input).convert("RGB")
	elif isinstance(image_input, Image.Image):
	image = image_input.convert("RGB")
	else:
	raise TypeError("image_input must be a file path or PIL.Image")

	image = self.test_transforms(image)
	image = image.unsqueeze(0).to(self.device)

	with torch.no_grad():
	outputs = self.model(image)

	probs = torch.nn.functional.softmax(outputs, dim=1)[0]
	class_probs = {
	self.class_map[i]: float(probs[i].item())
	for i in range(len(self.class_map))
	}
	return dict(sorted(class_probs.items(), key=lambda x: x[1], reverse=True))

	except UnidentifiedImageError:
	raise ValueError("Invalid image file provided")
	except Exception as e:
	raise RuntimeError(f"ResNet prediction failed: {str(e)}")

	# ================================ DeiT Classifier ================================
	class DeitCarDamagePredictor:
	def __init__(self, checkpoint_path, class_map):
	self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	self.class_map = class_map
	self.checkpoint_path = checkpoint_path

	self.transform = transforms.Compose([transforms.Resize((224, 224))])
	model_name = "facebook/deit-base-distilled-patch16-224"

	try:
	self.processor = DeiTImageProcessor.from_pretrained(model_name)
	self.model = DeiTForImageClassification.from_pretrained(
	model_name,
	num_labels=len(class_map),
	ignore_mismatched_sizes=True
	)
	checkpoint = torch.load(self.checkpoint_path, map_location=self.device)
	self.model.load_state_dict(checkpoint["model_state_dict"])
	self.model.to(self.device)
	self.model.eval()
	except Exception as e:
	raise RuntimeError(f"Failed to load DeiT model: {str(e)}")

	def deit_predict(self, image_input):
	try:
	if isinstance(image_input, str):
	image = Image.open(image_input).convert("RGB")
	elif isinstance(image_input, Image.Image):
	image = image_input.convert("RGB")
	else:
	raise TypeError("image_input must be a file path or PIL.Image")

	image = self.transform(image)
	inputs = self.processor(image, return_tensors="pt").to(self.device)

	with torch.no_grad():
	outputs = self.model(**inputs)

	probs = torch.nn.functional.softmax(outputs.logits, dim=1)[0]
	class_probs = {
	self.class_map[i]: float(probs[i].item())
	for i in range(len(self.class_map))
	}
	return dict(sorted(class_probs.items(), key=lambda x: x[1], reverse=True))

	except UnidentifiedImageError:
	raise ValueError("Invalid image file provided")
	except Exception as e:
	raise RuntimeError(f"DeiT prediction failed: {str(e)}")

	# ================================ Fusion Predictor ================================
	class FusionCarDamagePredictor:
	def __init__(self, resnet_predictor, deit_predictor, resnet_weight=0.5, deit_weight=0.5):
	if resnet_weight < 0 or deit_weight < 0:
	raise ValueError("Weights must be non-negative")
	total = resnet_weight + deit_weight
	if total == 0:
	raise ValueError("At least one weight must be greater than 0")

	self.resnet_predictor = resnet_predictor
	self.deit_predictor = deit_predictor
	self.resnet_weight = resnet_weight / total
	self.deit_weight = deit_weight / total

	def fuse_predict(self, image_input):
	try:
	resnet_output = self.resnet_predictor.resnet_predict(image_input)
	deit_output = self.deit_predictor.deit_predict(image_input)

	all_classes = set(resnet_output.keys()).union(set(deit_output.keys()))
	fused_output = {}
	for cls in all_classes:
	resnet_prob = resnet_output.get(cls, 0.0)
	deit_prob = deit_output.get(cls, 0.0)
	fused_prob = self.resnet_weight * resnet_prob + self.deit_weight * deit_prob
	fused_output[cls] = float(fused_prob)

	fused_output = dict(sorted(fused_output.items(), key=lambda x: x[1], reverse=True))
	final_class = next(iter(fused_output))
	final_confidence = fused_output[final_class]

	return {
	"resnet_output": resnet_output,
	"deit_output": deit_output,
	"fused_output": fused_output,
	"final_prediction": final_class,
	"final_confidence": round(final_confidence, 4)
	}
	except Exception as e:
	raise RuntimeError(f"Fusion prediction failed: {str(e)}")