SentenceTransformer / examples /evaluation /evaluation_stsbenchmark_sbert-wk.py

pushNe

2359bda almost 3 years ago

1.82 kB

	"""
	Performs the pooling described in the paper:
	SBERT-WK: A Sentence Embedding Method by Dissecting BERT-based Word Models, 2020, https://arxiv.org/abs/2002.06652

	Note: WKPooling improves the performance only for certain models. Further, WKPooling requires QR-decomposition,
	for which there is so far not efficient implementation in pytorch for GPUs (see https://github.com/pytorch/pytorch/issues/22573).
	Hence, WKPooling runs on the GPU, which makes it rather in-efficient.
	"""
	from torch.utils.data import DataLoader
	from sentence_transformers import SentenceTransformer, LoggingHandler, models
	from sentence_transformers.evaluation import EmbeddingSimilarityEvaluator
	from sentence_transformers.readers import STSBenchmarkDataReader
	import logging
	import torch

	#Limit torch to 4 threads, as this example runs on the CPU
	torch.set_num_threads(4)

	#### Just some code to print debug information to stdout
	logging.basicConfig(format='%(asctime)s - %(message)s',
	datefmt='%Y-%m-%d %H:%M:%S',
	level=logging.INFO,
	handlers=[LoggingHandler()])
	#### /print debug information to stdout


	#1) Point the transformer model to the BERT / RoBERTa etc. model you would like to use. Ensure that output_hidden_states is true
	word_embedding_model = models.Transformer('bert-base-uncased', model_args={'output_hidden_states': True})

	#2) Add WKPooling
	pooling_model = models.WKPooling(word_embedding_model.get_word_embedding_dimension())

	#3) Create a sentence transformer model to glue both models together
	model = SentenceTransformer(modules=[word_embedding_model, pooling_model])

	sts_reader = STSBenchmarkDataReader('../datasets/stsbenchmark')
	evaluator = EmbeddingSimilarityEvaluator.from_input_examples(sts_reader.get_examples("sts-test.csv"))

	model.evaluate(evaluator)