Spaces:

Awlly
/

NLP_app

Sleeping

App Files Files Community

NLP_app / models /lstm_MODEL.py

Awlly

adjusted visuals of the app

2f2be53 about 2 years ago

raw

history blame contribute delete

3.41 kB

	import json
	import torch
	import torch.nn as nn
	from dataclasses import dataclass
	from preprocessing import preprocess_single_string

	with open('model_data/vocab_kinopoisk_lstm.json', 'r') as file:
	vocab_to_int = json.load(file)

	@dataclass
	class ConfigRNN:
	vocab_size: int
	device : str
	n_layers : int
	embedding_dim : int
	hidden_size : int
	seq_len : int
	bidirectional : bool or int

	net_config = ConfigRNN(
	vocab_size = len(vocab_to_int)+1,
	device='cpu',
	n_layers=3,
	embedding_dim=64,
	hidden_size=64,
	seq_len = 100,
	bidirectional=False
	)


	class LSTMClassifier(nn.Module):
	def __init__(self, rnn_conf = net_config) -> None:
	super().__init__()

	self.embedding_dim = rnn_conf.embedding_dim
	self.hidden_size = rnn_conf.hidden_size
	self.bidirectional = rnn_conf.bidirectional
	self.n_layers = rnn_conf.n_layers

	self.embedding = nn.Embedding(rnn_conf.vocab_size, self.embedding_dim)
	self.lstm = nn.LSTM(
	input_size = self.embedding_dim,
	hidden_size = self.hidden_size,
	bidirectional = self.bidirectional,
	batch_first = True,
	num_layers = self.n_layers
	)
	self.bidirect_factor = 2 if self.bidirectional else 1
	self.clf = nn.Sequential(
	nn.Linear(self.hidden_size * self.bidirect_factor, 32),
	nn.Tanh(),
	nn.Dropout(),
	nn.Linear(32, 3)
	)

	def model_description(self):
	direction = 'bidirect' if self.bidirectional else 'onedirect'
	return f'lstm_{direction}_{self.n_layers}'


	def forward(self, x: torch.Tensor):
	embeddings = self.embedding(x)
	out, _ = self.lstm(embeddings)
	out = out[:, -1, :] # [все элементы батча, последний h_n, все элементы последнего h_n]
	out = self.clf(out.squeeze())
	return out


	def load_lstm_model():
	model = LSTMClassifier()
	model.load_state_dict(torch.load('model_data/lstm_model.pth'))
	model.eval()
	return model
	model = load_lstm_model()


	def predict_review(review_text, model=model, net_config=net_config, vocab_to_int=vocab_to_int):
	sample = preprocess_single_string(review_text, net_config.seq_len, vocab_to_int)
	model.eval()
	with torch.no_grad():
	output = model(sample.unsqueeze(0)).to(net_config.device)
	if output.dim() == 1:
	output = output.unsqueeze(0) # Adjust if necessary
	_, predicted_class = torch.max(output, dim=1)
	if predicted_class.item() == 0:
	return "Это положительный комментарий! Хорошо, что тебе понравился этот фильм! Можешь перейти в раздел с моделью GPT2 и обсудить с ней фильм!"
	elif predicted_class.item() == 1:
	return "Скорее всего... это комментарий нейтрального характера.. какой-то ты скучный..."
	else:
	return "Ты что такой токсик? Будь сдержанее, не понравился фильм - пройди мимо и не порьт авторам настроение, они же старались!"