SUMMIT / SARdatasets.py

Upload 26 files

2659b26 verified 6 months ago

8.07 kB

	import torch
	from torchvision.datasets import ImageFolder
	from PIL import Image
	from PIL import ImageFile
	ImageFile.LOAD_TRUNCATED_IMAGES = True

	import cv2
	import numpy as np
	import random
	from scipy.ndimage import convolve


	class SARImageFolder(ImageFolder):
	def __init__(self, root, transform=None):
	super().__init__(root, transform=transform)

	def __getitem__(self, index):
	path, target = self.samples[index]

	image = cv2.imread(path)
	image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
	image = np.float32(image)

	edges = cv2.Canny(image.astype(np.uint8), 200, 300)

	corners = cv2.cornerHarris(image, 5, 3, 0.04)
	corners = corners * 255

	multi_channel_image = np.dstack((image, edges, corners))
	multi_channel_image = multi_channel_image.astype(np.uint8)
	multi_channel_image = Image.fromarray(multi_channel_image)

	if self.transform is not None:
	multi_channel_image = self.transform(multi_channel_image)

	return multi_channel_image, target


	class build_coed_SARImageFolder(ImageFolder):
	def __init__(self, root, transform=None):
	super().__init__(root, transform=transform)

	def __getitem__(self, index):
	path, target = self.samples[index]

	image_3ch = Image.open(path).convert('RGB')
	image = Image.open(path).convert('L')
	image_np = np.array(image)

	edges = cv2.Canny(image_np, 200, 300)

	corners = cv2.cornerHarris(image_np, 5, 3, 0.04)
	corners = corners * 255

	multi_channel_image = np.dstack((image_np, edges, corners))
	multi_channel_image = multi_channel_image.astype(np.uint8)
	multi_channel_image = Image.fromarray(multi_channel_image)

	if self.transform is not None:
	multi_channel_image = self.transform(multi_channel_image)
	image_3ch = self.transform(image_3ch)

	target = multi_channel_image

	return image_3ch, target


	class Multi_task_SARImageFolder(ImageFolder):
	def __init__(self, root, transform=None):
	super().__init__(root, transform=transform)

	def add_gamma_noise(self, image_np, looks):
	"""
	向图像添加伽马分布的相干斑噪声
	:param image_np: 原始图像的numpy数组
	:param looks: SAR图像的等效视数(ENL,越大噪声越小)
	:return: 加噪后的图像
	"""
	image_np = image_np.astype(np.float32)

	image_np = image_np / np.max(image_np)

	gamma_noise = np.random.gamma(shape=looks, scale=1.0 / looks, size=image_np.shape)

	noisy_image = image_np * gamma_noise

	noisy_image = np.clip(noisy_image * 255, 0, 255).astype(np.uint8)

	return noisy_image

	def add_gaussian_noise(self, image_np, snr_db):
	"""
	向图像添加高斯白噪声
	:param image_np: 原始图像的numpy数组
	:param snr_db: 期望的信噪比（以分贝为单位）
	:return: 加噪后的图像
	"""
	signal_power = np.mean(image_np ** 2)

	snr = 10 ** (snr_db / 10)

	noise_power = signal_power / snr

	noise_sigma = np.sqrt(noise_power)

	current_state = torch.random.get_rng_state()
	current_cuda_state = torch.cuda.get_rng_state()

	torch.manual_seed(np.random.randint(0, 2 ** 31 - 1))
	torch.cuda.manual_seed_all(np.random.randint(0, 2 ** 31 - 1))

	noise = np.random.normal(0, noise_sigma, image_np.shape)

	torch.random.set_rng_state(current_state)
	torch.cuda.set_rng_state(current_cuda_state)

	noisy_image = image_np + noise

	return noisy_image.astype(np.uint8)

	def log_transform(self, image_np):
	image_np = image_np.astype(np.float32)

	c = 20.0
	transformed_image = c * np.log1p(image_np) # torch.log1p计算log(1 + x)

	return transformed_image

	def __getitem__(self, index):
	path, target = self.samples[index]

	image_3ch = Image.open(path).convert('RGB')
	image_3ch_np = np.array(image_3ch)

	image = Image.open(path).convert('L')
	image_np = np.array(image)

	edges = cv2.Canny(image_np, 200, 300)

	corners = cv2.cornerHarris(image_np, 5, 3, 0.04)
	corners = corners * 255

	first_channel = image_3ch_np[:, :, 0]
	noisy_first_channel = self.add_gamma_noise(first_channel, 30)
	image_3ch_np[:, :, 0] = noisy_first_channel
	image_3ch = Image.fromarray(image_3ch_np)

	multi_channel_image = np.dstack((image_np, edges, corners))
	multi_channel_image = multi_channel_image.astype(np.uint8)
	multi_channel_image = Image.fromarray(multi_channel_image)

	if self.transform is not None:
	multi_channel_image = self.transform(multi_channel_image)
	image_3ch = self.transform(image_3ch)

	target = multi_channel_image

	return image_3ch, target


	class Multi_task_angel_SARImageFolder(ImageFolder):
	def __init__(self, root, transform=None):
	super().__init__(root, transform=transform)

	def add_gaussian_noise(self, image_np, snr_db):

	signal_power = np.mean(image_np ** 2)

	snr = 10 ** (snr_db / 10)

	noise_power = signal_power / snr

	noise_sigma = np.sqrt(noise_power)

	noise = np.random.normal(0, noise_sigma, image_np.shape)

	noisy_image = image_np + noise

	return noisy_image.astype(np.uint8)

	def log_transform(self, image_np):

	image_np = image_np.astype(np.float32)


	c = 20.0
	transformed_image = c * np.log1p(image_np)

	return transformed_image

	def __getitem__(self, index):
	path, target = self.samples[index]

	image_3ch = Image.open(path).convert('RGB')
	image_3ch_np = np.array(image_3ch)

	image = Image.open(path).convert('L')
	image_np = np.array(image)

	edges = cv2.Canny(image_np, 200, 300)

	corners = cv2.cornerHarris(image_np, 5, 3, 0.04)
	corners = corners * 255

	kernel_size = 50
	kernel = np.ones((kernel_size, kernel_size))
	density = convolve(corners, kernel, mode='constant', cval=0.0)

	max_density_index = np.unravel_index(np.argmax(density), density.shape)
	center_y, center_x = max_density_index

	half_size = kernel_size // 2
	start_y = max(center_y - half_size, 0)
	end_y = min(center_y + half_size, corners.shape[0])
	start_x = max(center_x - half_size, 0)
	end_x = min(center_x + half_size, corners.shape[1])

	region = image_np[start_y:end_y, start_x:end_x]

	angle = random.choice([0, 90, 180, 270])
	M = cv2.getRotationMatrix2D((region.shape[1] // 2, region.shape[0] // 2), angle, 1)
	rotated_region = cv2.warpAffine(region, M, (region.shape[1], region.shape[0]))

	rotated_image = image_np.copy()
	rotated_image[start_y:end_y, start_x:end_x] = rotated_region

	image_4ch_np = np.insert(image_3ch_np, 1, rotated_image, axis=2)

	first_channel = image_3ch_np[:, :, 0]
	first_channel = self.log_transform(first_channel)
	noisy_first_channel = self.add_gaussian_noise(first_channel, 30)
	image_4ch_np[:, :, 0] = noisy_first_channel
	image_4ch = Image.fromarray(image_3ch_np)

	multi_channel_image = np.dstack((image_np, image_np, edges, corners))
	multi_channel_image = multi_channel_image.astype(np.uint8)
	multi_channel_image = Image.fromarray(multi_channel_image)

	if self.transform is not None:
	multi_channel_image = self.transform(multi_channel_image)
	image_4ch = self.transform(image_4ch)

	target = image_4ch

	return multi_channel_image, target