LigUnity / HGNN /screening.py

提交LigUnity初始代码

94391f2 3 months ago

6.01 kB

	import json
	import random

	import numpy as np
	import torch
	import torch.nn as nn
	from PL_Encoder import PLEncoder
	from PL_Aggregator import PLAggregator
	from PP_Encoder import PPEncoder
	from PP_Aggregator import PPAggregator
	import torch.nn.functional as F
	import torch.utils.data
	import argparse
	import os
	from util import cal_metrics
	from read_fasta import read_fasta_from_pocket, read_fasta_from_protein
	from align import get_neighbor_pocket


	class HGNN(nn.Module):

	def __init__(self, enc_u, enc_v=None, r2e=None):
	super(HGNN, self).__init__()
	self.enc_u = enc_u
	self.enc_v = enc_v
	self.embed_dim = enc_u.embed_dim

	self.w_ur1 = nn.Linear(self.embed_dim, self.embed_dim)
	self.w_ur2 = nn.Linear(self.embed_dim, self.embed_dim)
	self.w_vr1 = nn.Linear(self.embed_dim, self.embed_dim)
	self.w_vr2 = nn.Linear(self.embed_dim, self.embed_dim)

	self.r2e = r2e
	self.bn1 = nn.BatchNorm1d(self.embed_dim, momentum=0.5)
	self.bn2 = nn.BatchNorm1d(self.embed_dim, momentum=0.5)

	self.logit_scale = nn.Parameter(torch.ones([1], device="cuda") * np.log(14))

	def trainable_parameters(self):
	for name, param in self.named_parameters(recurse=True):
	if param.requires_grad:
	yield param

	def forward(self, nodes_u, nodes_v):
	embeds_u = self.enc_u(nodes_u, nodes_v)
	embeds_v = self.enc_v(nodes_v)
	return embeds_u, embeds_v

	def criterion(self, x_u, x_v, labels):

	netout = torch.matmul(x_u, torch.transpose(x_v, 0, 1))
	score = netout * self.logit_scale.exp().detach()
	score = (labels - torch.eye(len(labels)).to(labels.device)) * -1e6 + score

	lprobs_pocket = F.log_softmax(score.float(), dim=-1)
	lprobs_pocket = lprobs_pocket.view(-1, lprobs_pocket.size(-1))
	sample_size = lprobs_pocket.size(0)
	targets = torch.arange(sample_size, dtype=torch.long).view(-1).cuda()

	# pocket retrieve mol
	loss_pocket = F.nll_loss(
	lprobs_pocket,
	targets,
	reduction="mean"
	)

	lprobs_mol = F.log_softmax(torch.transpose(score.float(), 0, 1), dim=-1)
	lprobs_mol = lprobs_mol.view(-1, lprobs_mol.size(-1))
	lprobs_mol = lprobs_mol[:sample_size]

	# mol retrieve pocket
	loss_mol = F.nll_loss(
	lprobs_mol,
	targets,
	reduction="mean"
	)

	loss = 0.5 * loss_pocket + 0.5 * loss_mol

	ef_all = []
	for i in range(len(netout)):
	act_pocket = labels[i]
	affi_pocket = netout[i]
	top1_index = torch.argmax(affi_pocket)
	top1_act = act_pocket[top1_index]
	ef_all.append(cal_metrics(affi_pocket.detach().cpu().numpy(), act_pocket.detach().cpu().numpy()))
	ef_mean = {k: np.mean([x[k] for x in ef_all]) for k in ef_all[0].keys()}

	return loss, ef_mean, netout

	def loss(self, nodes_u, nodes_v, labels):
	x_u, x_v = self.forward(nodes_u, nodes_v)
	loss, ef_mean, netout = self.criterion(x_u, x_v, labels)
	return loss, ef_mean

	def refine_pocket(self, pocket_embed, neighbor_pocket_list):
	embeds_u = self.enc_u.refine_pocket(pocket_embed, neighbor_pocket_list)
	return embeds_u



	def main():
	# Training settings
	parser = argparse.ArgumentParser(description='HGNN model inference')
	parser.add_argument('--embed_dim', type=int, default=128, metavar='N', help='embedding size')
	parser.add_argument("--test_ckpt", type=str, default=None)
	parser.add_argument("--data_root", type=str, default="../data")
	parser.add_argument("--result_root", type=str, default="../result/pocket_ranking")
	parser.add_argument("--pocket_embed", type=str, default="../example/pocket_embed.npy")
	parser.add_argument("--save_file", type=str, default="../example/refined_pocket.npy")
	parser.add_argument("--pocket_pdb", type=str, default=None)
	parser.add_argument("--protein_pdb", type=str, default="../example/protein.pdb")
	parser.add_argument("--ligand_pdb", type=str, default="../example/ligand.pdb")

	args = parser.parse_args()

	seed = 42
	torch.manual_seed(seed)
	torch.cuda.manual_seed(seed)
	np.random.seed(seed)
	random.seed(seed)

	use_cuda = False
	if torch.cuda.is_available():
	use_cuda = True
	device = torch.device("cuda" if use_cuda else "cpu")

	embed_dim = args.embed_dim
	type2e = nn.Embedding(10, embed_dim).to(device)

	# load model
	agg_pocket = PLAggregator(r2e=type2e, embed_dim=embed_dim, cuda=device, uv=True)
	enc_pocket = PLEncoder(embed_dim=embed_dim, aggregator=agg_pocket, cuda=device, uv=True)
	agg_pocket_sim = PPAggregator(embed_dim=embed_dim, cuda=device)
	enc_pocket = PPEncoder(enc_pocket, embed_dim=embed_dim, aggregator=agg_pocket_sim, cuda=device)

	model = HGNN(enc_pocket).to(device)
	model.load_state_dict(torch.load(args.test_ckpt, weights_only=True), strict=False)
	model.eval()

	# load pocket embedding and fasta
	pocket_embed = torch.tensor(np.load(args.pocket_embed)).to(device)

	if args.pocket_pdb is not None:
	pocket_fasta = read_fasta_from_pocket(args.pocket_pdb)
	else:
	pocket_fasta = read_fasta_from_protein(args.protein_pdb, args.ligand_pdb)

	# get neighbor pocket
	neighbor_pocket_list = get_neighbor_pocket(pocket_fasta, args.data_root, args.result_root, device) # [(pocket_embed, ligand_embed, similarity)]

	# get refined pocket
	if len(neighbor_pocket_list) > 0:
	with torch.no_grad():
	refined_pocket = model.refine_pocket(pocket_embed, neighbor_pocket_list)
	refined_pocket = refined_pocket.cpu().numpy()
	else:
	refined_pocket = pocket_embed.cpu().numpy()

	print("finished, saving refined pocket embedding into:", args.save_file)
	np.save(args.save_file, refined_pocket)


	if __name__ == "__main__":
	main()