Duplicate from myyycroft/XCOMET-lite

Browse files

Co-authored-by: Mikhail Seleznev <myyycroft@users.noreply.huggingface.co>

Files changed (3) hide show

.gitattributes +35 -0
README.md +48 -0
pytorch_model.bin +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,48 @@

+---
+language:
+- en
+- de
+- es
+- ru
+- zh
+base_model:
+- microsoft/mdeberta-v3-base
+- Unbabel/XCOMET-XXL
+---
+# XCOMET-lite
+**Links:** [EMNLP 2024](https://aclanthology.org/2024.emnlp-main.1223/) | [Arxiv](https://arxiv.org/abs/2406.14553) | [Github repository](https://github.com/NL2G/xCOMET-lite)
+`XCOMET-lite` is a distilled version of [`Unbabel/XCOMET-XXL`](https://huggingface.co/Unbabel/XCOMET-XXL) — a machine translation evaluation model trained to provide an overall quality score between 0 and 1, where 1 represents a perfect translation.
+This model uses [`microsoft/mdeberta-v3-base`](https://huggingface.co/microsoft/deberta-v3-base) as its backbone and has 278 million parameters, making it approximately 38 times smaller than the 10.7 billion-parameter `XCOMET-XXL`.
+## Quick Start
+1. Clone the [GitHub repository](https://github.com/NL2G/xCOMET-lite).
+2. Create a conda environment as instructed in the README.
+Then, run the following code:
+```
+from xcomet.deberta_encoder import XCOMETLite
+model = XCOMETLite().from_pretrained("myyycroft/XCOMET-lite")
+data = [
+    {
+        "src": "Elon Musk has acquired Twitter and plans significant changes.",
+        "mt": "Илон Маск приобрел Twitter и планировал значительные искажения.",
+        "ref": "Илон Маск приобрел Twitter и планирует значительные изменения."
+    },
+    {
+        "src": "Elon Musk has acquired Twitter and plans significant changes.",
+        "mt": "Илон Маск приобрел Twitter.",
+        "ref": "Илон Маск приобрел Twitter и планирует значительные изменения."
+    }
+]
+model_output = model.predict(data, batch_size=2, gpus=1)
+print("Segment-level scores:", model_output.scores)
+```

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e6ce23ae75fe858b4c041aa205ca523ba9c0d28688a6b7eefa6fe85b17ed3f4
+size 1135020550