Sentence Similarity
sentence-transformers
Safetensors
bert
feature-extraction
dense
Generated from Trainer
dataset_size:4485
loss:MultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2 with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2") sentences = [ "Hồ sơ đăng ký cấp xét học bổng tài trợ bao gồm những gì ?", "Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội\nĐiều 4. Nguyên tắc xét cấp học bổng\n3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:\na) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;\nb) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại\nhọc kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;\nc) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại\nhọc kỳ cấp học bổng;\nd) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;\nđ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt\nnghiệp duy nhất;\nĐiều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng\n1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng\nloại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông tin\nsinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.\n", "Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội\nChương III NỘI DUNG CÔNG TÁC SINH VIÊN\nĐiều 19. Tư vấn tâm lý, chăm sóc sức khỏe sinh viên\n1. Tổ chức các hoạt động tư vấn tâm lý, chăm sóc sức khỏe để phòng ngừa và hỗ\ntrợ kịp thời khi sinh viên gặp phải các vấn đề ảnh hưởng đến thể chất và tinh thần.\n2. Tư vấn và hỗ trợ sinh viên mới nhập học hòa nhập với môi trường học tập\nmới.\n3. Tổ chức khám sức khỏe cho sinh viên mới nhập học và khám sức khỏe định kỳ\ncho sinh viên; tư vấn, tổ chức cho sinh viên thực hiện Luật bảo hiểm y tế; tổ chức sơ,\ncấp cứu, khám chữa bệnh ban đầu cho sinh viên.\nĐiều 20. Tổ chức các dịch vụ thiết yếu cho sinh viên\nTổ chức và hướng dẫn sinh viên sử dụng các dịch vụ thiết yếu phục vụ đời sống,\nhọc tập và rèn luyện trong quá trình học tập như: internet, nhà ăn, căng tin, trông giữ\nxe, sân chơi, bãi tập, thiết chế văn hóa…\nĐiều 21. Hỗ trợ tài chính cho sinh viên\n1. Hướng dẫn và hỗ trợ sinh viên có hoàn cảnh khó khăn làm thủ tục vay vốn\nngân hàng chính sách xã hội.\n2. Tăng cường khai thác, quản lý và sử dụng hiệu quả các nguồn tài trợ nhằm\nkhuyến khích sinh viên có kết quả học tập tốt, động viên, hỗ trợ sinh viên có hoàn\ncảnh khó khăn.\n3. Quan tâm, hỗ trợ kịp thời những sinh viên có hoàn cảnh đặc biệt khó khăn về\nkinh tế, sinh viên mồ côi không nơi nương tựa, sinh viên là người khuyết tật, sinh viên\ngặp khó khăn rủi ro đột xuất.\n4. Hỗ trợ kinh phí cho sinh viên tham gia các hoạt động nghiên cứu sáng tạo và\nkhởi nghiệp, hoạt động trao đổi sinh viên quốc tế, hoạt động học tập nâng cao trình độ\nngoại ngữ.\n", "Quy định về Học bổng Trần Đại Nghĩa\nChương I NHỮNG QUY ĐỊNH CHUNG\nĐiều 3. Nguồn Học bổng Trần Đại Nghĩa\nHọc bổng Trần Đại Nghĩa được hình thành từ các nguồn sau:\n1. Trích từ nguồn kinh phí hợp pháp của ĐHBK Hà Nội do Giám đốc Đại học\nquyết định.\n2. Sự đóng góp của các cán bộ, viên chức, người lao động của ĐHBK Hà Nội.\n3. Sự đóng góp của các thế hệ sinh viên và cựu sinh viên ĐHBK Hà Nội.\n4. Tài trợ từ các tổ chức, doanh nghiệp và các nhà hảo tâm khác.\nĐiều 4. Nguyên tắc hoạt động của Học bổng Trần Đại Nghĩa\nHọc bổng Trần Đại Nghĩa hoạt động trên các nguyên tắc sau:\n1. Các kho ản đóng góp cho Học b ổng Tr ần Đại Nghĩa là tự nguyện, không vì\nmục đích lợi nhuận.\n2. Hoạt động xét, cấp học bổng được thực hiện công khai, minh mạch và tuân thủ\ntheo các quy định hiện hành về quản lý tài chính của Nhà nước và của ĐHBK Hà Nội.\n" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Add new SentenceTransformer model
Browse files- .gitattributes +2 -0
- 1_Pooling/config.json +10 -0
- README.md +1203 -0
- config.json +25 -0
- config_sentence_transformers.json +14 -0
- model.safetensors +3 -0
- modules.json +14 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +65 -0
- unigram.json +3 -0
.gitattributes
CHANGED
|
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
|
|
|
|
|
| 33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
| 34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
| 35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
| 36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
| 37 |
+
unigram.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
|
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"word_embedding_dimension": 384,
|
| 3 |
+
"pooling_mode_cls_token": false,
|
| 4 |
+
"pooling_mode_mean_tokens": true,
|
| 5 |
+
"pooling_mode_max_tokens": false,
|
| 6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
| 7 |
+
"pooling_mode_weightedmean_tokens": false,
|
| 8 |
+
"pooling_mode_lasttoken": false,
|
| 9 |
+
"include_prompt": true
|
| 10 |
+
}
|
README.md
ADDED
|
@@ -0,0 +1,1203 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
tags:
|
| 3 |
+
- sentence-transformers
|
| 4 |
+
- sentence-similarity
|
| 5 |
+
- feature-extraction
|
| 6 |
+
- dense
|
| 7 |
+
- generated_from_trainer
|
| 8 |
+
- dataset_size:4485
|
| 9 |
+
- loss:MultipleNegativesRankingLoss
|
| 10 |
+
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
|
| 11 |
+
widget:
|
| 12 |
+
- source_sentence: Hồ sơ đăng ký cấp xét học bổng tài trợ bao gồm những gì ?
|
| 13 |
+
sentences:
|
| 14 |
+
- 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
|
| 15 |
+
|
| 16 |
+
Điều 4. Nguyên tắc xét cấp học bổng
|
| 17 |
+
|
| 18 |
+
3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
|
| 19 |
+
|
| 20 |
+
a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
|
| 21 |
+
|
| 22 |
+
b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 23 |
+
|
| 24 |
+
học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
|
| 25 |
+
|
| 26 |
+
c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 27 |
+
|
| 28 |
+
học kỳ cấp học bổng;
|
| 29 |
+
|
| 30 |
+
d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
|
| 31 |
+
|
| 32 |
+
đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
|
| 33 |
+
|
| 34 |
+
nghiệp duy nhất;
|
| 35 |
+
|
| 36 |
+
Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
|
| 37 |
+
|
| 38 |
+
1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
|
| 39 |
+
|
| 40 |
+
loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
|
| 41 |
+
tin
|
| 42 |
+
|
| 43 |
+
sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
|
| 44 |
+
|
| 45 |
+
'
|
| 46 |
+
- 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
|
| 47 |
+
|
| 48 |
+
Chương III NỘI DUNG CÔNG TÁC SINH VIÊN
|
| 49 |
+
|
| 50 |
+
Điều 19. Tư vấn tâm lý, chăm sóc sức khỏe sinh viên
|
| 51 |
+
|
| 52 |
+
1. Tổ chức các hoạt động tư vấn tâm lý, chăm sóc sức khỏe để phòng ngừa và hỗ
|
| 53 |
+
|
| 54 |
+
trợ kịp thời khi sinh viên gặp phải các vấn đề ảnh hưởng đến thể chất và tinh
|
| 55 |
+
thần.
|
| 56 |
+
|
| 57 |
+
2. Tư vấn và hỗ trợ sinh viên mới nhập học hòa nhập với môi trường học tập
|
| 58 |
+
|
| 59 |
+
mới.
|
| 60 |
+
|
| 61 |
+
3. Tổ chức khám sức khỏe cho sinh viên mới nhập học và khám sức khỏe định kỳ
|
| 62 |
+
|
| 63 |
+
cho sinh viên; tư vấn, tổ chức cho sinh viên thực hiện Luật bảo hiểm y tế; tổ
|
| 64 |
+
chức sơ,
|
| 65 |
+
|
| 66 |
+
cấp cứu, khám chữa bệnh ban đầu cho sinh viên.
|
| 67 |
+
|
| 68 |
+
Điều 20. Tổ chức các dịch vụ thiết yếu cho sinh viên
|
| 69 |
+
|
| 70 |
+
Tổ chức và hướng dẫn sinh viên sử dụng các dịch vụ thiết yếu phục vụ đời sống,
|
| 71 |
+
|
| 72 |
+
học tập và rèn luyện trong quá trình học tập như: internet, nhà ăn, căng tin,
|
| 73 |
+
trông giữ
|
| 74 |
+
|
| 75 |
+
xe, sân chơi, bãi tập, thiết chế văn hóa…
|
| 76 |
+
|
| 77 |
+
Điều 21. Hỗ trợ tài chính cho sinh viên
|
| 78 |
+
|
| 79 |
+
1. Hướng dẫn và hỗ trợ sinh viên có hoàn cảnh khó khăn làm thủ tục vay vốn
|
| 80 |
+
|
| 81 |
+
ngân hàng chính sách xã hội.
|
| 82 |
+
|
| 83 |
+
2. Tăng cường khai thác, quản lý và sử dụng hiệu quả các nguồn tài trợ nhằm
|
| 84 |
+
|
| 85 |
+
khuyến khích sinh viên có kết quả học tập tốt, động viên, hỗ trợ sinh viên có
|
| 86 |
+
hoàn
|
| 87 |
+
|
| 88 |
+
cảnh khó khăn.
|
| 89 |
+
|
| 90 |
+
3. Quan tâm, hỗ trợ kịp thời những sinh viên có hoàn cảnh đặc biệt khó khăn về
|
| 91 |
+
|
| 92 |
+
kinh tế, sinh viên mồ côi không nơi nương tựa, sinh viên là người khuyết tật,
|
| 93 |
+
sinh viên
|
| 94 |
+
|
| 95 |
+
gặp khó khăn rủi ro đột xuất.
|
| 96 |
+
|
| 97 |
+
4. Hỗ trợ kinh phí cho sinh viên tham gia các hoạt động nghiên cứu sáng tạo và
|
| 98 |
+
|
| 99 |
+
khởi nghiệp, hoạt động trao đổi sinh viên quốc tế, hoạt động học tập nâng cao
|
| 100 |
+
trình độ
|
| 101 |
+
|
| 102 |
+
ngoại ngữ.
|
| 103 |
+
|
| 104 |
+
'
|
| 105 |
+
- 'Quy định về Học bổng Trần Đại Nghĩa
|
| 106 |
+
|
| 107 |
+
Chương I NHỮNG QUY ĐỊNH CHUNG
|
| 108 |
+
|
| 109 |
+
Điều 3. Nguồn Học bổng Trần Đại Nghĩa
|
| 110 |
+
|
| 111 |
+
Học bổng Trần Đại Nghĩa được hình thành từ các nguồn sau:
|
| 112 |
+
|
| 113 |
+
1. Trích từ nguồn kinh phí hợp pháp của ĐHBK Hà Nội do Giám đốc Đại học
|
| 114 |
+
|
| 115 |
+
quyết định.
|
| 116 |
+
|
| 117 |
+
2. Sự đóng góp của các cán bộ, viên chức, người lao động của ĐHBK Hà Nội.
|
| 118 |
+
|
| 119 |
+
3. Sự đóng góp của các thế hệ sinh viên và cựu sinh viên ĐHBK Hà Nội.
|
| 120 |
+
|
| 121 |
+
4. Tài trợ từ các tổ chức, doanh nghiệp và các nhà hảo tâm khác.
|
| 122 |
+
|
| 123 |
+
Điều 4. Nguyên tắc hoạt động của Học bổng Trần Đại Nghĩa
|
| 124 |
+
|
| 125 |
+
Học bổng Trần Đại Nghĩa hoạt động trên các nguyên tắc sau:
|
| 126 |
+
|
| 127 |
+
1. Các kho ản đóng góp cho Học b ổng Tr ần Đại Nghĩa là tự nguyện, không vì
|
| 128 |
+
|
| 129 |
+
mục đích lợi nhuận.
|
| 130 |
+
|
| 131 |
+
2. Hoạt động xét, cấp học bổng được thực hiện công khai, minh mạch và tuân thủ
|
| 132 |
+
|
| 133 |
+
theo các quy định hiện hành về quản lý tài chính của Nhà nước và của ĐHBK Hà Nội.
|
| 134 |
+
|
| 135 |
+
'
|
| 136 |
+
- source_sentence: Sinh viên có cần phải đăng ký để xét duyệt học bổng KKHT (khuyến
|
| 137 |
+
khích học tập) không ?
|
| 138 |
+
sentences:
|
| 139 |
+
- 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
|
| 140 |
+
|
| 141 |
+
Chương VII TỔ CHỨC THỰC HIỆN
|
| 142 |
+
|
| 143 |
+
Điều 51. Trách nhiệm của Trung tâm Dịch vụ và Hỗ trợ Bách khoa
|
| 144 |
+
|
| 145 |
+
1. Tiếp nhận, quản lý và phục vụ sinh viên nội trú trong ký túc xá theo quy định.
|
| 146 |
+
|
| 147 |
+
2. Cung cấp các dịch vụ nâng cao đời sống, chăm sóc sức khỏe, hỗ trợ học tập
|
| 148 |
+
|
| 149 |
+
cho sinh viên.
|
| 150 |
+
|
| 151 |
+
3. Cung cấp các dịch vụ trông, giữ xe đạp, xe máy cho sinh viên được thuận tiện,
|
| 152 |
+
|
| 153 |
+
an toàn.
|
| 154 |
+
|
| 155 |
+
4. Chủ trì phối hợp với các đơn vị liên quan trong và ngoài Đại học đảm bảo an
|
| 156 |
+
|
| 157 |
+
ninh, trật tự học đường và an ninh, trật tự cho sinh viên nội trú trong ký túc
|
| 158 |
+
xá.
|
| 159 |
+
|
| 160 |
+
5. Phối hợp với công an địa phương làm thủ tục đăng ký tạm trú trong ký túc xá
|
| 161 |
+
|
| 162 |
+
cho sinh viên.
|
| 163 |
+
|
| 164 |
+
Điều 52. Trách nhiệm của Trung tâm Y tế Bách khoa
|
| 165 |
+
|
| 166 |
+
1. Chịu trách nhiệm về công tác y tế và chăm sóc sức khoẻ ban đầu cho sinh viên.
|
| 167 |
+
|
| 168 |
+
2. Tổ chức hoặc phối hợp tổ chức các hoạt động tư vấn, chăm sóc sức khỏe,
|
| 169 |
+
|
| 170 |
+
khám chữa bệnh cho sinh viên.
|
| 171 |
+
|
| 172 |
+
3. Lập kế hoạch và tổ chức khám sức khỏe ban đầu và khám sức khỏe định kỳ
|
| 173 |
+
|
| 174 |
+
cho sinh viên.
|
| 175 |
+
|
| 176 |
+
'
|
| 177 |
+
- 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
|
| 178 |
+
|
| 179 |
+
Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng
|
| 180 |
+
|
| 181 |
+
1. Văn bản này quy định về nguyên tắc, tiêu chuẩn xét duyệt và cấp học bổng cho
|
| 182 |
+
|
| 183 |
+
sinh viên đại học hình thức đào tạo chính quy tại Đại học Bách khoa Hà Nội (sau
|
| 184 |
+
đây
|
| 185 |
+
|
| 186 |
+
viết tắt là ĐHBK Hà N ội), căn cứ các quy định liên quan tại Nghị định số
|
| 187 |
+
|
| 188 |
+
84/2020/NĐ-CP ngày 17/7/2020 của Chính phủ và Quy chế Quản lý tài chính của Đại
|
| 189 |
+
|
| 190 |
+
học Bách khoa Hà Nội được ban hành theo Nghị quyết số 20/NQ-ĐHBK ngày
|
| 191 |
+
|
| 192 |
+
16/3/2023 của Hội đồng Đại học, Đại học Bách khoa Hà Nội.
|
| 193 |
+
|
| 194 |
+
2. Quy định này áp dụng đối với sinh viên đại học hình thức đào tạo chính quy
|
| 195 |
+
|
| 196 |
+
văn bằng thứ nhất của ĐHBK Hà Nội.
|
| 197 |
+
|
| 198 |
+
Điều 2. Các quy định chung
|
| 199 |
+
|
| 200 |
+
1. Học bổng khuyến khích học tập (KKHT) cấp cho các sinh viên được lựa chọn
|
| 201 |
+
|
| 202 |
+
bởi Hội đồng xét cấp học bổng ĐHBK Hà Nội theo từng học kỳ chính của năm học
|
| 203 |
+
,
|
| 204 |
+
|
| 205 |
+
căn cứ vào thành tích học tập và rèn luyện của sinh viên trong học kỳ chính liền
|
| 206 |
+
trước
|
| 207 |
+
|
| 208 |
+
đó.
|
| 209 |
+
|
| 210 |
+
'
|
| 211 |
+
- 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2020-2021
|
| 212 |
+
|
| 213 |
+
Tiêu chí điểm cộng (Tối đa 100 điểm)
|
| 214 |
+
|
| 215 |
+
Điểm ý thức công dân trong quan hệ cộng đồng (tối đa 20 điểm)
|
| 216 |
+
|
| 217 |
+
Các hoạt động liên quan đến trách nhiệm công dân (tối đa 16 điểm):
|
| 218 |
+
|
| 219 |
+
Hiểu biết và chấp hành pháp luật của Nhà nước, quy định của nhà trường và nơi
|
| 220 |
+
cư trú; minh chứng: được cấp khi tham gia hoạt động; điểm: 8
|
| 221 |
+
|
| 222 |
+
Khai báo thông tin liên lạc và nơi cư trú theo yêu cầu của Nhà trường; minh chứng:
|
| 223 |
+
dựa trên hệ thống quản lý; điểm: 4
|
| 224 |
+
|
| 225 |
+
Tham gia tuyên truyền chủ trương của Đảng, chính sách pháp luật của Nhà nước,
|
| 226 |
+
quy định của nơi cư trú,
|
| 227 |
+
|
| 228 |
+
quy định và quy chế của Nhà trường được địa phương, Nhà trường công nhận; minh
|
| 229 |
+
chứng: được cấp khi tham gia hoạt động; điểm: 4
|
| 230 |
+
|
| 231 |
+
Tham gia giữ gìn an ninh – trật tự, bảo vệ sinh cảnh quan - môi trường, nếp sống
|
| 232 |
+
văn minh nơi công cộng,
|
| 233 |
+
|
| 234 |
+
quảng bá hình ảnh đẹp của Nhà trường được địa phương, Nhà trường công nhận; minh
|
| 235 |
+
chứng: được cấp khi tham gia hoạt động; điểm: 4
|
| 236 |
+
|
| 237 |
+
Có các thành tích trong học tập, NCKH và rèn luyện (tối đa 4 điểm):
|
| 238 |
+
|
| 239 |
+
Đạt giải trong các cuộc thi SV NCKH, Olympic, thi khoa học kỹ thuật; minh chứng:
|
| 240 |
+
được cấp khi tham gia hoạt động; điểm: 4
|
| 241 |
+
|
| 242 |
+
Nhận bằng khen, huy chương tương đương cấp Bộ trở lên; minh chứng: được cấp khi
|
| 243 |
+
tham gia hoạt động; điểm: 4
|
| 244 |
+
|
| 245 |
+
Có chứng nhận tham gia lớp bồi dưỡng nhận thức về Đảng từ mức Khá trở lên; minh
|
| 246 |
+
chứng: được cấp khi tham gia hoạt động; điểm: 4
|
| 247 |
+
|
| 248 |
+
Được kết nạp Đảng Cộng sản Việt Nam; minh chứng: được cấp khi tham gia hoạt động;
|
| 249 |
+
điểm: 4
|
| 250 |
+
|
| 251 |
+
Đạt danh hiệu Sinh viên năm tốt cấp Trường trở lên, Giấy khen Cán bộ đoàn học
|
| 252 |
+
tốt, Giấy khen Sinh viên
|
| 253 |
+
|
| 254 |
+
tích cực đóng cho hoạt động của Nhà trường; minh chứng: được cấp khi tham gia
|
| 255 |
+
hoạt động; điểm: 4
|
| 256 |
+
|
| 257 |
+
Được khen thưởng khi tham gia tuyên truyền chủ trương của Đảng, chính sách pháp
|
| 258 |
+
luật của Nhà nước,
|
| 259 |
+
|
| 260 |
+
quy định của nơi cư trú, giữ gìn an ninh – trật tự, bảo vệ sinh cảnh quan - môi
|
| 261 |
+
trường, nếp sống văn minh
|
| 262 |
+
|
| 263 |
+
nơi công cộng, hoạt động xã hội.; minh chứng: được cấp khi tham gia hoạt động;
|
| 264 |
+
điểm: 4'
|
| 265 |
+
- source_sentence: Về vấn đề giám sát thực hiện các quy chế, quy định về người học
|
| 266 |
+
của trường sẽ do phòng ban nào phụ trách?
|
| 267 |
+
sentences:
|
| 268 |
+
- 'Quy định về Học bổng Trần Đại Nghĩa
|
| 269 |
+
|
| 270 |
+
Chương II TIÊU CHUẨN, NGUYÊN TẮC VÀ HỒ SƠ ĐĂNG KÝ, XÉT CẤP HỌC BỔNG TRẦN ĐẠI NGHĨA
|
| 271 |
+
|
| 272 |
+
Điều 5. Tiêu chuẩn được đăng ký xét Học bổng Trần Đại Nghĩa
|
| 273 |
+
|
| 274 |
+
Sinh viên có hoàn cảnh kinh tế gia đình đặc biệt khó khăn (hộ nghèo, hộ cận
|
| 275 |
+
|
| 276 |
+
nghèo hoặc hộ có hoàn cảnh kinh tế đặc biệt khó khăn khác), sinh viên gặp các
|
| 277 |
+
tai nạn,
|
| 278 |
+
|
| 279 |
+
rủi ro đột xuất thuộc các đối tượng sau được đăng ký xét Học bổng Trần Đại Nghĩa:
|
| 280 |
+
|
| 281 |
+
1. Sinh viên mới trúng tuy ển vào ĐHBK Hà Nội (đang trong th ời gian học kỳ
|
| 282 |
+
|
| 283 |
+
một năm thứ nhất) đạt một trong các điều kiện sau:
|
| 284 |
+
|
| 285 |
+
a) Là thành viên đ ội tuyển dự thi Olympic qu ốc tế hoặc đạt giải kỳ thi học sinh
|
| 286 |
+
|
| 287 |
+
giỏi quốc gia các môn học thuộc tổ hợp xét tuyển vào ĐHBK Hà Nội đúng ngành học;
|
| 288 |
+
|
| 289 |
+
b) Đạt điểm cao trong kỳ thi tuyển, xét tuyển vào ĐHBK Hà Nội (căn cứ vào
|
| 290 |
+
|
| 291 |
+
điểm chuẩn trúng tuyển hàng năm, Đại học sẽ công bố mức điểm đạt điều kiện xét
|
| 292 |
+
học
|
| 293 |
+
|
| 294 |
+
bổng).
|
| 295 |
+
|
| 296 |
+
2. Sinh viên khác (từ học kỳ 2 trở đi) đạt đủ các điều kiện sau:
|
| 297 |
+
|
| 298 |
+
a) Sinh viên đang trong thời gian học tập theo chương trình đào tạo chuẩn;
|
| 299 |
+
|
| 300 |
+
b) Điểm học tập trung bình tích lũy (CPA) ≥ 2,0;
|
| 301 |
+
|
| 302 |
+
c) Tích lũy đủ số tín chỉ theo qui định xếp hạng trình độ năm học;
|
| 303 |
+
|
| 304 |
+
d) Điểm rèn luyện trung bình tích lũy ≥ 65.
|
| 305 |
+
|
| 306 |
+
3. Sinh viên có hoàn cảnh kinh tế gia đình khó khăn do gặp các tai nạn, rủi ro
|
| 307 |
+
đột
|
| 308 |
+
|
| 309 |
+
xuất, gồm:
|
| 310 |
+
|
| 311 |
+
a) Sinh viên mắc bệnh hiểm nghèo;
|
| 312 |
+
|
| 313 |
+
b) Sinh viên gặp tai nạn ở mức độ nặng và phải điều trị dài ngày trong bệnh viện;
|
| 314 |
+
|
| 315 |
+
c) Gia đình sinh viên gặp thiên tai, dịch bệnh hoặc hỏa hoạn.
|
| 316 |
+
|
| 317 |
+
4. Các trường hợp đặc biệt khác do Giám đốc Đại học quyết định.
|
| 318 |
+
|
| 319 |
+
'
|
| 320 |
+
- 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
|
| 321 |
+
|
| 322 |
+
Điều 4. Nguyên tắc xét cấp học bổng
|
| 323 |
+
|
| 324 |
+
3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
|
| 325 |
+
|
| 326 |
+
a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
|
| 327 |
+
|
| 328 |
+
b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 329 |
+
|
| 330 |
+
học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
|
| 331 |
+
|
| 332 |
+
c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 333 |
+
|
| 334 |
+
học kỳ cấp học bổng;
|
| 335 |
+
|
| 336 |
+
d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
|
| 337 |
+
|
| 338 |
+
đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
|
| 339 |
+
|
| 340 |
+
nghiệp duy nhất;
|
| 341 |
+
|
| 342 |
+
Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
|
| 343 |
+
|
| 344 |
+
1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
|
| 345 |
+
|
| 346 |
+
loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
|
| 347 |
+
tin
|
| 348 |
+
|
| 349 |
+
sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
|
| 350 |
+
|
| 351 |
+
'
|
| 352 |
+
- 'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà
|
| 353 |
+
Nội
|
| 354 |
+
|
| 355 |
+
Chương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN
|
| 356 |
+
|
| 357 |
+
Điều 13. Phòng/Ban chức năng Công tác sinh viên
|
| 358 |
+
|
| 359 |
+
1. Tiếp nhận và quản lý hồ sơ LHS học tập tại ĐHBK Hà Nội từ Phòng/Ban chức
|
| 360 |
+
|
| 361 |
+
năng Tuyển sinh, Hợp tác đối ngoại như quy định t���i Điều 2.
|
| 362 |
+
|
| 363 |
+
2. Chủ trì tổ chức phổ biến các quy định, quy chế, nội quy của ĐHBK Hà Nội
|
| 364 |
+
|
| 365 |
+
cho LHS.
|
| 366 |
+
|
| 367 |
+
3. Hỗ trợ LHS các thủ tục hành chính, chế độ bảo hiểm theo quy định.
|
| 368 |
+
|
| 369 |
+
4. Hỗ trợ LHS các thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh theo quy định
|
| 370 |
+
|
| 371 |
+
của pháp luật.
|
| 372 |
+
|
| 373 |
+
5. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội tổ chức các sự
|
| 374 |
+
|
| 375 |
+
kiện, hoạt động giao lưu văn hóa, thể thao nhằm tăng cường tình đoàn kết hữu
|
| 376 |
+
nghị
|
| 377 |
+
|
| 378 |
+
giữa LHS các nước và sinh viên Việt Nam.
|
| 379 |
+
|
| 380 |
+
6. Phối hợp với các đơn vị liên quan hỗ trợ LHS theo nhiệm vụ được giao.
|
| 381 |
+
|
| 382 |
+
7. Cập nhật vào hệ thống cơ sở dữ liệu điện tử quản lý LHS của Bộ Giáo dục và
|
| 383 |
+
|
| 384 |
+
Đào tạo.
|
| 385 |
+
|
| 386 |
+
8. Là đầu mối, p hối hợp với Phòng /Ban chức năng thực hiện công tác thống kê,
|
| 387 |
+
|
| 388 |
+
tổng hợp, báo cáo lãnh đạo ĐHBK Hà Nội và Bộ Giáo dục và Đào tạo định kỳ và đột
|
| 389 |
+
|
| 390 |
+
xuất theo yêu cầu.
|
| 391 |
+
|
| 392 |
+
9. Chủ trì phối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội
|
| 393 |
+
|
| 394 |
+
cung cấp thông tin và giải quyết các vấn đề liên quan tới LHS Hiệp định và LHS
|
| 395 |
+
|
| 396 |
+
ngoài Hiệp định .
|
| 397 |
+
|
| 398 |
+
'
|
| 399 |
+
- source_sentence: Đạt danh hiệu Sinh viên 5 tốt thì đạt bao nhiêu điểm rèn luyện?
|
| 400 |
+
sentences:
|
| 401 |
+
- 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
|
| 402 |
+
|
| 403 |
+
CHƯƠNG II
|
| 404 |
+
|
| 405 |
+
ĐÀO TẠO ĐẠI HỌC
|
| 406 |
+
|
| 407 |
+
Điều 12. Ý kiến phản hồi của người học, đánh giá kết quả học tập
|
| 408 |
+
|
| 409 |
+
6. Sinh viên được xếp loại học lực theo học kỳ căn cứ điểm trung bình học kỳ và
|
| 410 |
+
xếp
|
| 411 |
+
|
| 412 |
+
loại học lực từ đầu khóa căn cứ điểm trung bình tích lũy như sau:
|
| 413 |
+
|
| 414 |
+
GPA hoặc CPA: < 1,0, Xếp loại: Kém
|
| 415 |
+
|
| 416 |
+
GPA hoặc CPA: 1,0-1,99, Xếp loại: Yếu
|
| 417 |
+
|
| 418 |
+
GPA hoặc CPA: 2,0-2,49, Xếp loại: Trung bình
|
| 419 |
+
|
| 420 |
+
GPA hoặc CPA: 2,5-3,19, Xếp loại: Khá
|
| 421 |
+
|
| 422 |
+
GPA hoặc CPA: 3,2-3,59, Xếp loại: Giỏi
|
| 423 |
+
|
| 424 |
+
GPA hoặc CPA: 3,6-4,0, Xếp loại: Xuất sắc
|
| 425 |
+
|
| 426 |
+
7. Trong trường hợp cần thiết, điểm trung bình học kỳ và điểm trung bình tích
|
| 427 |
+
lũy đạt
|
| 428 |
+
|
| 429 |
+
từ loại trung bình trở lên có thể được quy đổi tương đương sang thang điểm 10
|
| 430 |
+
theo quy
|
| 431 |
+
|
| 432 |
+
tắc như sau:
|
| 433 |
+
|
| 434 |
+
Dải điểm thang 4: 2,0 đến cận 2,5, Dải điểm thang 10 tương đương: 5,5 đến cận
|
| 435 |
+
7,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 3,00; b = −0,5
|
| 436 |
+
|
| 437 |
+
Dải điểm thang 4: 2,5 đến cận 3,2, Dải điểm thang 10 tương đương: 7,0 đến cận
|
| 438 |
+
8,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 1,42; b = 3,45
|
| 439 |
+
|
| 440 |
+
Dải điểm thang 4: 3,2 đến cận 3,6, Dải điểm thang 10 tương đương: 8,0 đến cận
|
| 441 |
+
9,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 2,50; b = 0.00
|
| 442 |
+
|
| 443 |
+
Dải điểm thang 4: 3,6 đến tròn 4,0, Dải điểm thang 10 tương đương: 9,0 đến tròn
|
| 444 |
+
10, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 2,50; b = 0.00
|
| 445 |
+
|
| 446 |
+
|
| 447 |
+
'
|
| 448 |
+
- 'QUY ĐỊNH Đánh giá kết quả rèn luyện của sinh viên Đại học Bách khoa Hà Nội 2023
|
| 449 |
+
|
| 450 |
+
Điều 5. Thời gian đánh giá
|
| 451 |
+
|
| 452 |
+
1. Việc đánh giá kết quả rèn luyện của sinh viên được tiến hành định kỳ theo học
|
| 453 |
+
kỳ,
|
| 454 |
+
|
| 455 |
+
năm học và toàn khóa học.
|
| 456 |
+
|
| 457 |
+
2. Điểm rèn luyện của học kỳ là tổng điểm đạt được của các nội dung đánh giá chi
|
| 458 |
+
|
| 459 |
+
tiết.
|
| 460 |
+
|
| 461 |
+
3. Điểm rèn luyện của năm học là trung bình cộng của điểm rèn luyện các học kỳ
|
| 462 |
+
của
|
| 463 |
+
|
| 464 |
+
năm học đó.
|
| 465 |
+
|
| 466 |
+
4. Điểm rèn luyện toàn khóa là trung bình c ộng của điểm rèn luyện của tối thiểu
|
| 467 |
+
07
|
| 468 |
+
|
| 469 |
+
học kỳ. Trong trường hợp đặc biệt, điểm rèn luyện toàn khóa do Ban Giám đốc quyết
|
| 470 |
+
định.
|
| 471 |
+
|
| 472 |
+
|
| 473 |
+
Điều 6. Sử dụng kết quả đánh giá
|
| 474 |
+
|
| 475 |
+
1. Kết quả đánh giá rèn luy ện của sinh viên được sử dụng trong việc xét duyệt
|
| 476 |
+
học
|
| 477 |
+
|
| 478 |
+
bổng, xét khen thưởng - kỷ luật, xét thôi học, ngừng học, xét lưu trú ký túc xá.
|
| 479 |
+
|
| 480 |
+
2. Kết quả đánh giá rèn luyện toàn khóa học được ghi chung vào bảng điểm kết quả
|
| 481 |
+
|
| 482 |
+
học tập và lưu trong hồ sơ của người học khi tốt nghiệp.
|
| 483 |
+
|
| 484 |
+
3. Sinh viên có kết quả rèn luyện xuất sắc được Trường/Đại học xem xét biểu dương,
|
| 485 |
+
|
| 486 |
+
khen thưởng.
|
| 487 |
+
|
| 488 |
+
4. Sinh viên bị xếp loại rèn luyện Yếu/Kém trong hai học kỳ liên tiếp bị hạn chế
|
| 489 |
+
đăng
|
| 490 |
+
|
| 491 |
+
ký học tập tương đương cảnh báo học tập mức 2.
|
| 492 |
+
|
| 493 |
+
'
|
| 494 |
+
- 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
|
| 495 |
+
|
| 496 |
+
Điều 4. Nguyên tắc xét cấp học bổng
|
| 497 |
+
|
| 498 |
+
3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
|
| 499 |
+
|
| 500 |
+
a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
|
| 501 |
+
|
| 502 |
+
b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 503 |
+
|
| 504 |
+
học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
|
| 505 |
+
|
| 506 |
+
c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
|
| 507 |
+
|
| 508 |
+
học kỳ cấp học bổng;
|
| 509 |
+
|
| 510 |
+
d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
|
| 511 |
+
|
| 512 |
+
đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
|
| 513 |
+
|
| 514 |
+
nghiệp duy nhất;
|
| 515 |
+
|
| 516 |
+
Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
|
| 517 |
+
|
| 518 |
+
1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
|
| 519 |
+
|
| 520 |
+
loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
|
| 521 |
+
tin
|
| 522 |
+
|
| 523 |
+
sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
|
| 524 |
+
|
| 525 |
+
'
|
| 526 |
+
- source_sentence: Khi tham gia chương trình sinh hoạt công dân do trường ,viện tổ
|
| 527 |
+
chức thì đạt bao nhiêu điểm rèn luyện?
|
| 528 |
+
sentences:
|
| 529 |
+
- 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
|
| 530 |
+
|
| 531 |
+
CHƯƠNG I
|
| 532 |
+
|
| 533 |
+
NHỮNG QUY ĐỊNH CHUNG
|
| 534 |
+
|
| 535 |
+
Điều 2. Ngành đào tạo, chương trình đào tạo
|
| 536 |
+
|
| 537 |
+
6. Thời gian và khối lượng học tập chuẩn đối với các CTĐT theo hình thức chính
|
| 538 |
+
quy
|
| 539 |
+
|
| 540 |
+
không kể các học phần bổ sung kiến thức được quy định như sau:
|
| 541 |
+
|
| 542 |
+
Chương trình: Người học, Cử nhân: Tốt nghiệp THPT, Kỹ sư: Tốt nghiệp cử nhân theo
|
| 543 |
+
chương trình tích hợp, Thạc sĩ: Tốt nghiệp cử nhân, Tiến sĩ: Tốt nghiệp thạc sĩ
|
| 544 |
+
|
| 545 |
+
Chương trình: Thời gian, Cử nhân: 4 năm, Kỹ sư: 1,5 năm, Thạc sĩ: 2 năm, Tiến
|
| 546 |
+
sĩ: 3 năm
|
| 547 |
+
|
| 548 |
+
Chương trình: Khối lượng tối thiểu, Cử nhân: 132 tín chỉ, Kỹ sư: 48 tín chỉ, Thạc
|
| 549 |
+
sĩ: 60 tín chỉ, Tiến sĩ: 106 tín chỉ
|
| 550 |
+
|
| 551 |
+
7. Thời gian theo kế hoạch học tập chuẩn toàn khoá đối với hình thức đào tạo vừa
|
| 552 |
+
|
| 553 |
+
làm vừa học dài hơn tối thiểu 20% so với hình thức đào tạo chính quy của cùng
|
| 554 |
+
CTĐT.
|
| 555 |
+
|
| 556 |
+
'
|
| 557 |
+
- 'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà
|
| 558 |
+
Nội
|
| 559 |
+
|
| 560 |
+
Chương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN
|
| 561 |
+
|
| 562 |
+
Điều 11. Phòng/Ban chức năng Hợp tác đối ngoại
|
| 563 |
+
|
| 564 |
+
1. Hoàn thành hồ sơ quản lý LHS học tích lũy tín chỉ như quy định tại khoản
|
| 565 |
+
1,
|
| 566 |
+
|
| 567 |
+
Điều 2 và bàn giao cho Phòng/ Ban chức năng Công tác sinh viên quản lý.
|
| 568 |
+
|
| 569 |
+
2. Lập và quản lý hồ sơ LHS trao đổi như quy định tại khoản 2, Điều 2.
|
| 570 |
+
|
| 571 |
+
3. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội cung cấp
|
| 572 |
+
|
| 573 |
+
thông tin, giải quyết các vấn đề liên quan trong và sau quá trình thực hiện các
|
| 574 |
+
hoạt
|
| 575 |
+
|
| 576 |
+
động trao đổi tới LHS .
|
| 577 |
+
|
| 578 |
+
4. Tổ chức và hỗ trợ các đơn vị liên quan tổ chức các chương trình giao lưu, trao
|
| 579 |
+
|
| 580 |
+
đổi văn hóa cho LHS ; thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh phục vụ
|
| 581 |
+
cho
|
| 582 |
+
|
| 583 |
+
việc học tập của LHS.
|
| 584 |
+
|
| 585 |
+
5. Tổng hợp báo cáo lãnh đạo ĐHBK Hà Nội và các cơ quan chức năng định kỳ
|
| 586 |
+
|
| 587 |
+
và đột xuất theo yêu cầu.
|
| 588 |
+
|
| 589 |
+
Điều 12. Đơn vị chức năng Hỗ trợ trao đổi học thuật
|
| 590 |
+
|
| 591 |
+
Phối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội tổ chức các
|
| 592 |
+
|
| 593 |
+
chương trình giao lưu, trao đổi văn hóa cho LHS.
|
| 594 |
+
|
| 595 |
+
'
|
| 596 |
+
- 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2022-2023
|
| 597 |
+
|
| 598 |
+
Tiêu chí điểm cộng (Tối đa 100 điểm)
|
| 599 |
+
|
| 600 |
+
Điểm học tập (Tối đa 30 điểm)
|
| 601 |
+
|
| 602 |
+
Kết quả học tập có điểm trung bình học kỳ (tối đa 24 điểm):
|
| 603 |
+
|
| 604 |
+
Có kết quả học tập ở mức GPA ≥ 3.6; minh chứng: dựa trên hệ thống quản lý; điểm:
|
| 605 |
+
20
|
| 606 |
+
|
| 607 |
+
Có kết quả học tập ở mức: 3.2 ≤ GPA < 3.6; minh chứng: dựa trên hệ thống quản
|
| 608 |
+
lý; điểm: 18
|
| 609 |
+
|
| 610 |
+
Có kết quả học tập ở mức: 2.5 ≤ GPA < 3.2; minh chứng: dựa trên hệ thống quản
|
| 611 |
+
lý; điểm: 16
|
| 612 |
+
|
| 613 |
+
Có kết quả học tập ở mức: 2.0 ≤ GPA < 2.5;; minh chứng: dựa trên hệ thống quản
|
| 614 |
+
lý; điểm: 14
|
| 615 |
+
|
| 616 |
+
Có kết quả học tập ở mức: 1.5 ≤ GPA < 2.0;; minh chứng: dựa trên hệ thống quản
|
| 617 |
+
lý; điểm: 12
|
| 618 |
+
|
| 619 |
+
Có nỗ lực trong học tập (GPA kỳ đánh giá cao hơn kỳ trước, giảm mức cảnh
|
| 620 |
+
|
| 621 |
+
cáo học tập, hoặc duy trì điểm GPA trên 3.6 ); minh chứng: dựa trên hệ thống quản
|
| 622 |
+
lý; điểm: 8
|
| 623 |
+
|
| 624 |
+
Trình độ ngoại ngữ (tối đa 6 điểm):
|
| 625 |
+
|
| 626 |
+
Đạt trình độ ngoại ngữ theo tiến độ của chương trình đào tạo; minh chứng: dựa
|
| 627 |
+
trên hệ thống quản lý; điểm: 4
|
| 628 |
+
|
| 629 |
+
Đạt chứng chỉ ngoại ngữ tương đương TOEIC 600 điểm trở lên; minh chứng: được cấp
|
| 630 |
+
khi tham gia hoạt động; điểm: 2
|
| 631 |
+
|
| 632 |
+
Tham gia các hoạt động học thuật (tối đa 9 điểm):
|
| 633 |
+
|
| 634 |
+
Tham gia hoạt động, sự kiệnliên quan đến NCKH, học thuật, chuyên môn; minh chứng:
|
| 635 |
+
được cấp khi tham gia hoạt động; điểm: 3
|
| 636 |
+
|
| 637 |
+
Tham gia khóa đào tạo kỹ năng nghề nghiệp, kỹ năng bổ trợ chuyên môn; minh chứng:
|
| 638 |
+
được cấp khi tham gia hoạt động; điểm: 6
|
| 639 |
+
|
| 640 |
+
Thành viên CLB học thuật, Lab nghiên cứu, Nhóm nghiên cứu, nhóm Khởi
|
| 641 |
+
|
| 642 |
+
nghiệp; minh chứng: được cấp khi tham gia hoạt động; điểm: 6
|
| 643 |
+
|
| 644 |
+
Tham gia công bố khoa học tại Hội nghị hoặc tạp chí khoa học chuyên
|
| 645 |
+
|
| 646 |
+
ngành; minh chứng: được cấp khi tham gia hoạt động; điểm: 6
|
| 647 |
+
|
| 648 |
+
Tham gia các cuộc thi Olympic cấp trường, cấp quốc gia, quốc tế; minh chứng: được
|
| 649 |
+
cấp khi tham gia hoạt động; điểm: 6'
|
| 650 |
+
pipeline_tag: sentence-similarity
|
| 651 |
+
library_name: sentence-transformers
|
| 652 |
+
metrics:
|
| 653 |
+
- cosine_accuracy@1
|
| 654 |
+
- cosine_accuracy@3
|
| 655 |
+
- cosine_accuracy@5
|
| 656 |
+
- cosine_accuracy@10
|
| 657 |
+
- cosine_precision@1
|
| 658 |
+
- cosine_precision@3
|
| 659 |
+
- cosine_precision@5
|
| 660 |
+
- cosine_precision@10
|
| 661 |
+
- cosine_recall@1
|
| 662 |
+
- cosine_recall@3
|
| 663 |
+
- cosine_recall@5
|
| 664 |
+
- cosine_recall@10
|
| 665 |
+
- cosine_ndcg@10
|
| 666 |
+
- cosine_mrr@10
|
| 667 |
+
- cosine_map@100
|
| 668 |
+
model-index:
|
| 669 |
+
- name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
|
| 670 |
+
results:
|
| 671 |
+
- task:
|
| 672 |
+
type: information-retrieval
|
| 673 |
+
name: Information Retrieval
|
| 674 |
+
dataset:
|
| 675 |
+
name: paraphrase multilingual MiniLM L12 v2 251218
|
| 676 |
+
type: paraphrase-multilingual-MiniLM-L12-v2-251218
|
| 677 |
+
metrics:
|
| 678 |
+
- type: cosine_accuracy@1
|
| 679 |
+
value: 0.8243243243243243
|
| 680 |
+
name: Cosine Accuracy@1
|
| 681 |
+
- type: cosine_accuracy@3
|
| 682 |
+
value: 0.918918918918919
|
| 683 |
+
name: Cosine Accuracy@3
|
| 684 |
+
- type: cosine_accuracy@5
|
| 685 |
+
value: 0.972972972972973
|
| 686 |
+
name: Cosine Accuracy@5
|
| 687 |
+
- type: cosine_accuracy@10
|
| 688 |
+
value: 0.9864864864864865
|
| 689 |
+
name: Cosine Accuracy@10
|
| 690 |
+
- type: cosine_precision@1
|
| 691 |
+
value: 0.8243243243243243
|
| 692 |
+
name: Cosine Precision@1
|
| 693 |
+
- type: cosine_precision@3
|
| 694 |
+
value: 0.6936936936936936
|
| 695 |
+
name: Cosine Precision@3
|
| 696 |
+
- type: cosine_precision@5
|
| 697 |
+
value: 0.6216216216216216
|
| 698 |
+
name: Cosine Precision@5
|
| 699 |
+
- type: cosine_precision@10
|
| 700 |
+
value: 0.4864864864864865
|
| 701 |
+
name: Cosine Precision@10
|
| 702 |
+
- type: cosine_recall@1
|
| 703 |
+
value: 0.2535975660975661
|
| 704 |
+
name: Cosine Recall@1
|
| 705 |
+
- type: cosine_recall@3
|
| 706 |
+
value: 0.4425328800328801
|
| 707 |
+
name: Cosine Recall@3
|
| 708 |
+
- type: cosine_recall@5
|
| 709 |
+
value: 0.5839746777246777
|
| 710 |
+
name: Cosine Recall@5
|
| 711 |
+
- type: cosine_recall@10
|
| 712 |
+
value: 0.762303406053406
|
| 713 |
+
name: Cosine Recall@10
|
| 714 |
+
- type: cosine_ndcg@10
|
| 715 |
+
value: 0.8174578592944561
|
| 716 |
+
name: Cosine Ndcg@10
|
| 717 |
+
- type: cosine_mrr@10
|
| 718 |
+
value: 0.8800675675675675
|
| 719 |
+
name: Cosine Mrr@10
|
| 720 |
+
- type: cosine_map@100
|
| 721 |
+
value: 0.7600296418090827
|
| 722 |
+
name: Cosine Map@100
|
| 723 |
+
- type: cosine_accuracy@1
|
| 724 |
+
value: 0.8899082568807339
|
| 725 |
+
name: Cosine Accuracy@1
|
| 726 |
+
- type: cosine_accuracy@3
|
| 727 |
+
value: 0.9357798165137615
|
| 728 |
+
name: Cosine Accuracy@3
|
| 729 |
+
- type: cosine_accuracy@5
|
| 730 |
+
value: 0.9541284403669725
|
| 731 |
+
name: Cosine Accuracy@5
|
| 732 |
+
- type: cosine_accuracy@10
|
| 733 |
+
value: 0.9724770642201835
|
| 734 |
+
name: Cosine Accuracy@10
|
| 735 |
+
- type: cosine_precision@1
|
| 736 |
+
value: 0.8899082568807339
|
| 737 |
+
name: Cosine Precision@1
|
| 738 |
+
- type: cosine_precision@3
|
| 739 |
+
value: 0.7431192660550459
|
| 740 |
+
name: Cosine Precision@3
|
| 741 |
+
- type: cosine_precision@5
|
| 742 |
+
value: 0.6458715596330274
|
| 743 |
+
name: Cosine Precision@5
|
| 744 |
+
- type: cosine_precision@10
|
| 745 |
+
value: 0.49449541284403675
|
| 746 |
+
name: Cosine Precision@10
|
| 747 |
+
- type: cosine_recall@1
|
| 748 |
+
value: 0.22506810922608916
|
| 749 |
+
name: Cosine Recall@1
|
| 750 |
+
- type: cosine_recall@3
|
| 751 |
+
value: 0.42528260057764133
|
| 752 |
+
name: Cosine Recall@3
|
| 753 |
+
- type: cosine_recall@5
|
| 754 |
+
value: 0.5414471931261917
|
| 755 |
+
name: Cosine Recall@5
|
| 756 |
+
- type: cosine_recall@10
|
| 757 |
+
value: 0.7115573861714545
|
| 758 |
+
name: Cosine Recall@10
|
| 759 |
+
- type: cosine_ndcg@10
|
| 760 |
+
value: 0.8042578105472734
|
| 761 |
+
name: Cosine Ndcg@10
|
| 762 |
+
- type: cosine_mrr@10
|
| 763 |
+
value: 0.9163608562691131
|
| 764 |
+
name: Cosine Mrr@10
|
| 765 |
+
- type: cosine_map@100
|
| 766 |
+
value: 0.7564244075096153
|
| 767 |
+
name: Cosine Map@100
|
| 768 |
+
---
|
| 769 |
+
|
| 770 |
+
# SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
|
| 771 |
+
|
| 772 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
| 773 |
+
|
| 774 |
+
## Model Details
|
| 775 |
+
|
| 776 |
+
### Model Description
|
| 777 |
+
- **Model Type:** Sentence Transformer
|
| 778 |
+
- **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
|
| 779 |
+
- **Maximum Sequence Length:** 128 tokens
|
| 780 |
+
- **Output Dimensionality:** 384 dimensions
|
| 781 |
+
- **Similarity Function:** Cosine Similarity
|
| 782 |
+
<!-- - **Training Dataset:** Unknown -->
|
| 783 |
+
<!-- - **Language:** Unknown -->
|
| 784 |
+
<!-- - **License:** Unknown -->
|
| 785 |
+
|
| 786 |
+
### Model Sources
|
| 787 |
+
|
| 788 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
| 789 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
|
| 790 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
| 791 |
+
|
| 792 |
+
### Full Model Architecture
|
| 793 |
+
|
| 794 |
+
```
|
| 795 |
+
SentenceTransformer(
|
| 796 |
+
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
|
| 797 |
+
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
| 798 |
+
)
|
| 799 |
+
```
|
| 800 |
+
|
| 801 |
+
## Usage
|
| 802 |
+
|
| 803 |
+
### Direct Usage (Sentence Transformers)
|
| 804 |
+
|
| 805 |
+
First install the Sentence Transformers library:
|
| 806 |
+
|
| 807 |
+
```bash
|
| 808 |
+
pip install -U sentence-transformers
|
| 809 |
+
```
|
| 810 |
+
|
| 811 |
+
Then you can load this model and run inference.
|
| 812 |
+
```python
|
| 813 |
+
from sentence_transformers import SentenceTransformer
|
| 814 |
+
|
| 815 |
+
# Download from the 🤗 Hub
|
| 816 |
+
model = SentenceTransformer("ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2")
|
| 817 |
+
# Run inference
|
| 818 |
+
sentences = [
|
| 819 |
+
'Khi tham gia chương trình sinh hoạt công dân do trường ,viện tổ chức thì đạt bao nhiêu điểm rèn luyện?',
|
| 820 |
+
'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2022-2023\nTiêu chí điểm cộng (Tối đa 100 điểm)\nĐiểm học tập (Tối đa 30 điểm)\nKết quả học tập có điểm trung bình học kỳ (tối đa 24 điểm):\nCó kết quả học tập ở mức GPA ≥ 3.6; minh chứng: dựa trên hệ thống quản lý; điểm: 20\nCó kết quả học tập ở mức: 3.2 ≤ GPA < 3.6; minh chứng: dựa trên hệ thống quản lý; điểm: 18\nCó kết quả học tập ở mức: 2.5 ≤ GPA < 3.2; minh chứng: dựa trên hệ thống quản lý; điểm: 16\nCó kết quả học tập ở mức: 2.0 ≤ GPA < 2.5;; minh chứng: dựa trên hệ thống quản lý; điểm: 14\nCó kết quả học tập ở mức: 1.5 ≤ GPA < 2.0;; minh chứng: dựa trên hệ thống quản lý; điểm: 12\nCó nỗ lực trong học tập (GPA kỳ đánh giá cao hơn kỳ trước, giảm mức cảnh\ncáo học tập, hoặc duy trì điểm GPA trên 3.6 ); minh chứng: dựa trên hệ thống quản lý; điểm: 8\nTrình độ ngoại ngữ (tối đa 6 điểm):\nĐạt trình độ ngoại ngữ theo tiến độ của chương trình đào tạo; minh chứng: dựa trên hệ thống quản lý; điểm: 4\nĐạt chứng chỉ ngoại ngữ tương đương TOEIC 600 điểm trở lên; minh chứng: được cấp khi tham gia hoạt động; điểm: 2\nTham gia các hoạt động học thuật (tối đa 9 điểm):\nTham gia hoạt động, sự kiệnliên quan đến NCKH, học thuật, chuyên môn; minh chứng: được cấp khi tham gia hoạt động; điểm: 3\nTham gia khóa đào tạo kỹ năng nghề nghiệp, kỹ năng bổ trợ chuyên môn; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nThành viên CLB học thuật, Lab nghiên cứu, Nhóm nghiên cứu, nhóm Khởi\nnghiệp; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nTham gia công bố khoa học tại Hội nghị hoặc tạp chí khoa học chuyên\nngành; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nTham gia các cuộc thi Olympic cấp trường, cấp quốc gia, quốc tế; minh chứng: được cấp khi tham gia hoạt động; điểm: 6',
|
| 821 |
+
'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà Nội\nChương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN\nĐiều 11. Phòng/Ban chức năng Hợp tác đối ngoại\n1. Hoàn thành hồ sơ quản lý LHS học tích lũy tín chỉ như quy định tại khoản 1,\nĐiều 2 và bàn giao cho Phòng/ Ban chức năng Công tác sinh viên quản lý.\n2. Lập và quản lý hồ sơ LHS trao đổi như quy định tại khoản 2, Điều 2.\n3. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội cung cấp\nthông tin, giải quyết các vấn đề liên quan trong và sau quá trình thực hiện các hoạt\nđộng trao đổi tới LHS .\n4. Tổ chức và hỗ trợ các đơn vị liên quan tổ chức các chương trình giao lưu, trao\nđổi văn hóa cho LHS ; thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh phục vụ cho\nviệc học tập của LHS.\n5. Tổng hợp báo cáo lãnh đạo ĐHBK Hà Nội và các cơ quan chức năng định kỳ\nvà đột xuất theo yêu cầu.\nĐiều 12. Đơn vị chức năng Hỗ trợ trao đổi học thuật\nPhối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội tổ chức các\nchương trình giao lưu, trao đổi văn hóa cho LHS.\n',
|
| 822 |
+
]
|
| 823 |
+
embeddings = model.encode(sentences)
|
| 824 |
+
print(embeddings.shape)
|
| 825 |
+
# [3, 384]
|
| 826 |
+
|
| 827 |
+
# Get the similarity scores for the embeddings
|
| 828 |
+
similarities = model.similarity(embeddings, embeddings)
|
| 829 |
+
print(similarities)
|
| 830 |
+
# tensor([[1.0000, 0.7406, 0.2134],
|
| 831 |
+
# [0.7406, 1.0000, 0.0214],
|
| 832 |
+
# [0.2134, 0.0214, 1.0000]])
|
| 833 |
+
```
|
| 834 |
+
|
| 835 |
+
<!--
|
| 836 |
+
### Direct Usage (Transformers)
|
| 837 |
+
|
| 838 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
| 839 |
+
|
| 840 |
+
</details>
|
| 841 |
+
-->
|
| 842 |
+
|
| 843 |
+
<!--
|
| 844 |
+
### Downstream Usage (Sentence Transformers)
|
| 845 |
+
|
| 846 |
+
You can finetune this model on your own dataset.
|
| 847 |
+
|
| 848 |
+
<details><summary>Click to expand</summary>
|
| 849 |
+
|
| 850 |
+
</details>
|
| 851 |
+
-->
|
| 852 |
+
|
| 853 |
+
<!--
|
| 854 |
+
### Out-of-Scope Use
|
| 855 |
+
|
| 856 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
| 857 |
+
-->
|
| 858 |
+
|
| 859 |
+
## Evaluation
|
| 860 |
+
|
| 861 |
+
### Metrics
|
| 862 |
+
|
| 863 |
+
#### Information Retrieval
|
| 864 |
+
|
| 865 |
+
* Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
|
| 866 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
| 867 |
+
|
| 868 |
+
| Metric | Value |
|
| 869 |
+
|:--------------------|:-----------|
|
| 870 |
+
| cosine_accuracy@1 | 0.8243 |
|
| 871 |
+
| cosine_accuracy@3 | 0.9189 |
|
| 872 |
+
| cosine_accuracy@5 | 0.973 |
|
| 873 |
+
| cosine_accuracy@10 | 0.9865 |
|
| 874 |
+
| cosine_precision@1 | 0.8243 |
|
| 875 |
+
| cosine_precision@3 | 0.6937 |
|
| 876 |
+
| cosine_precision@5 | 0.6216 |
|
| 877 |
+
| cosine_precision@10 | 0.4865 |
|
| 878 |
+
| cosine_recall@1 | 0.2536 |
|
| 879 |
+
| cosine_recall@3 | 0.4425 |
|
| 880 |
+
| cosine_recall@5 | 0.584 |
|
| 881 |
+
| cosine_recall@10 | 0.7623 |
|
| 882 |
+
| **cosine_ndcg@10** | **0.8175** |
|
| 883 |
+
| cosine_mrr@10 | 0.8801 |
|
| 884 |
+
| cosine_map@100 | 0.76 |
|
| 885 |
+
|
| 886 |
+
#### Information Retrieval
|
| 887 |
+
|
| 888 |
+
* Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
|
| 889 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
| 890 |
+
|
| 891 |
+
| Metric | Value |
|
| 892 |
+
|:--------------------|:-----------|
|
| 893 |
+
| cosine_accuracy@1 | 0.8899 |
|
| 894 |
+
| cosine_accuracy@3 | 0.9358 |
|
| 895 |
+
| cosine_accuracy@5 | 0.9541 |
|
| 896 |
+
| cosine_accuracy@10 | 0.9725 |
|
| 897 |
+
| cosine_precision@1 | 0.8899 |
|
| 898 |
+
| cosine_precision@3 | 0.7431 |
|
| 899 |
+
| cosine_precision@5 | 0.6459 |
|
| 900 |
+
| cosine_precision@10 | 0.4945 |
|
| 901 |
+
| cosine_recall@1 | 0.2251 |
|
| 902 |
+
| cosine_recall@3 | 0.4253 |
|
| 903 |
+
| cosine_recall@5 | 0.5414 |
|
| 904 |
+
| cosine_recall@10 | 0.7116 |
|
| 905 |
+
| **cosine_ndcg@10** | **0.8043** |
|
| 906 |
+
| cosine_mrr@10 | 0.9164 |
|
| 907 |
+
| cosine_map@100 | 0.7564 |
|
| 908 |
+
|
| 909 |
+
<!--
|
| 910 |
+
## Bias, Risks and Limitations
|
| 911 |
+
|
| 912 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
| 913 |
+
-->
|
| 914 |
+
|
| 915 |
+
<!--
|
| 916 |
+
### Recommendations
|
| 917 |
+
|
| 918 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
| 919 |
+
-->
|
| 920 |
+
|
| 921 |
+
## Training Details
|
| 922 |
+
|
| 923 |
+
### Training Dataset
|
| 924 |
+
|
| 925 |
+
#### Unnamed Dataset
|
| 926 |
+
|
| 927 |
+
* Size: 4,485 training samples
|
| 928 |
+
* Columns: <code>anchor</code> and <code>positive</code>
|
| 929 |
+
* Approximate statistics based on the first 1000 samples:
|
| 930 |
+
| | anchor | positive |
|
| 931 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
| 932 |
+
| type | string | string |
|
| 933 |
+
| details | <ul><li>min: 11 tokens</li><li>mean: 22.66 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 128 tokens</li><li>mean: 128.0 tokens</li><li>max: 128 tokens</li></ul> |
|
| 934 |
+
* Samples:
|
| 935 |
+
| anchor | positive |
|
| 936 |
+
|:-------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 937 |
+
| <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 2. Các quy định chung<br>2. Học bổng KKHT nhằm khuyến khích sinh viên nâng cao thành tích học tập và<br>rèn luyện tại ĐHBK Hà Nội.<br>3. Quỹ học bổng KKHT hình thành từ nguồn học phí và bằng 8% (tám phần<br>trăm) học phí của học kỳ lấy điểm xét cấp học bổng.<br>4. Học bổng KKHT có 3 mức:<br>a) Học bổng loại khá (loại C): Bằng tổng học phí của tất cả các học phần tính<br>điểm trung bình học kỳ (GPA).<br>b) Học bổng loại giỏi (loại B): Bằng 1,2 lần mức học bổng loại khá.<br>c) Học bổng loại xuất sắc (loại A): Bằng 1,5 lần mức học bổng loại khá.<br>Điều 3. Tiêu chuẩn xét cấp học bổng<br>1. Học bổng loại C: GPA ≥ 2,5 và điểm rèn luyện học kỳ ≥ 65 điểm.<br>2. Học bổng loại B: GPA ≥ 3,2 và điểm rèn luyện học kỳ ≥ 80 điểm.<br>3. Học bổng loại A: GPA ≥ 3,6 và điểm rèn luyện học kỳ ≥ 90 điểm.<br>Điều 4. Nguyên tắc xét cấp học bổng<br>1. Sử dụng kết quả học tập và rèn luyện của học kỳ liền trước để xét cấp học<br>bổng cho học kỳ sau.<br>2. Học bổng được xét theo ...</code> |
|
| 938 |
+
| <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng<br>1. Văn bản này quy định về nguyên tắc, tiêu chuẩn xét duyệt và cấp học bổng cho<br>sinh viên đại học hình thức đào tạo chính quy tại Đại học Bách khoa Hà Nội (sau đây<br>viết tắt là ĐHBK Hà N ội), căn cứ các quy định liên quan tại Nghị định số<br>84/2020/NĐ-CP ngày 17/7/2020 của Chính phủ và Quy chế Quản lý tài chính của Đại<br>học Bách khoa Hà Nội được ban hành theo Nghị quyết số 20/NQ-ĐHBK ngày<br>16/3/2023 của Hội đồng Đại học, Đại học Bách khoa Hà Nội.<br>2. Quy định này áp dụng đối với sinh viên đại học hình thức đào tạo chính quy<br>văn bằng thứ nhất của ĐHBK Hà Nội.<br>Điều 2. Các quy định chung<br>1. Học bổng khuyến khích học tập (KKHT) cấp cho các sinh viên được lựa chọn<br>bởi Hội đồng xét cấp học bổng ĐHBK Hà Nội theo từng học kỳ chính của năm học ,<br>căn cứ vào thành tích học tập và rèn luyện của sinh viên trong học kỳ chính liền trước<br>đó.<br></code> |
|
| 939 |
+
| <code>trường gồm mấy loại học bổng khuyến khích học tập ?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 4. Nguyên tắc xét cấp học bổng<br>3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:<br>a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;<br>b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;<br>c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ cấp học bổng;<br>d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;<br>đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt<br>nghiệp duy nhất;<br>Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng<br>1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng<br>loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông tin<br>sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.<br></code> |
|
| 940 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
| 941 |
+
```json
|
| 942 |
+
{
|
| 943 |
+
"scale": 20.0,
|
| 944 |
+
"similarity_fct": "cos_sim",
|
| 945 |
+
"gather_across_devices": false
|
| 946 |
+
}
|
| 947 |
+
```
|
| 948 |
+
|
| 949 |
+
### Training Hyperparameters
|
| 950 |
+
#### Non-Default Hyperparameters
|
| 951 |
+
|
| 952 |
+
- `eval_strategy`: steps
|
| 953 |
+
- `per_device_train_batch_size`: 16
|
| 954 |
+
- `per_device_eval_batch_size`: 16
|
| 955 |
+
- `learning_rate`: 2e-05
|
| 956 |
+
- `num_train_epochs`: 20
|
| 957 |
+
- `warmup_ratio`: 0.1
|
| 958 |
+
- `fp16`: True
|
| 959 |
+
- `batch_sampler`: no_duplicates
|
| 960 |
+
|
| 961 |
+
#### All Hyperparameters
|
| 962 |
+
<details><summary>Click to expand</summary>
|
| 963 |
+
|
| 964 |
+
- `overwrite_output_dir`: False
|
| 965 |
+
- `do_predict`: False
|
| 966 |
+
- `eval_strategy`: steps
|
| 967 |
+
- `prediction_loss_only`: True
|
| 968 |
+
- `per_device_train_batch_size`: 16
|
| 969 |
+
- `per_device_eval_batch_size`: 16
|
| 970 |
+
- `per_gpu_train_batch_size`: None
|
| 971 |
+
- `per_gpu_eval_batch_size`: None
|
| 972 |
+
- `gradient_accumulation_steps`: 1
|
| 973 |
+
- `eval_accumulation_steps`: None
|
| 974 |
+
- `torch_empty_cache_steps`: None
|
| 975 |
+
- `learning_rate`: 2e-05
|
| 976 |
+
- `weight_decay`: 0.0
|
| 977 |
+
- `adam_beta1`: 0.9
|
| 978 |
+
- `adam_beta2`: 0.999
|
| 979 |
+
- `adam_epsilon`: 1e-08
|
| 980 |
+
- `max_grad_norm`: 1.0
|
| 981 |
+
- `num_train_epochs`: 20
|
| 982 |
+
- `max_steps`: -1
|
| 983 |
+
- `lr_scheduler_type`: linear
|
| 984 |
+
- `lr_scheduler_kwargs`: {}
|
| 985 |
+
- `warmup_ratio`: 0.1
|
| 986 |
+
- `warmup_steps`: 0
|
| 987 |
+
- `log_level`: passive
|
| 988 |
+
- `log_level_replica`: warning
|
| 989 |
+
- `log_on_each_node`: True
|
| 990 |
+
- `logging_nan_inf_filter`: True
|
| 991 |
+
- `save_safetensors`: True
|
| 992 |
+
- `save_on_each_node`: False
|
| 993 |
+
- `save_only_model`: False
|
| 994 |
+
- `restore_callback_states_from_checkpoint`: False
|
| 995 |
+
- `no_cuda`: False
|
| 996 |
+
- `use_cpu`: False
|
| 997 |
+
- `use_mps_device`: False
|
| 998 |
+
- `seed`: 42
|
| 999 |
+
- `data_seed`: None
|
| 1000 |
+
- `jit_mode_eval`: False
|
| 1001 |
+
- `bf16`: False
|
| 1002 |
+
- `fp16`: True
|
| 1003 |
+
- `fp16_opt_level`: O1
|
| 1004 |
+
- `half_precision_backend`: auto
|
| 1005 |
+
- `bf16_full_eval`: False
|
| 1006 |
+
- `fp16_full_eval`: False
|
| 1007 |
+
- `tf32`: None
|
| 1008 |
+
- `local_rank`: 0
|
| 1009 |
+
- `ddp_backend`: None
|
| 1010 |
+
- `tpu_num_cores`: None
|
| 1011 |
+
- `tpu_metrics_debug`: False
|
| 1012 |
+
- `debug`: []
|
| 1013 |
+
- `dataloader_drop_last`: False
|
| 1014 |
+
- `dataloader_num_workers`: 0
|
| 1015 |
+
- `dataloader_prefetch_factor`: None
|
| 1016 |
+
- `past_index`: -1
|
| 1017 |
+
- `disable_tqdm`: False
|
| 1018 |
+
- `remove_unused_columns`: True
|
| 1019 |
+
- `label_names`: None
|
| 1020 |
+
- `load_best_model_at_end`: False
|
| 1021 |
+
- `ignore_data_skip`: False
|
| 1022 |
+
- `fsdp`: []
|
| 1023 |
+
- `fsdp_min_num_params`: 0
|
| 1024 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
| 1025 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
| 1026 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
| 1027 |
+
- `parallelism_config`: None
|
| 1028 |
+
- `deepspeed`: None
|
| 1029 |
+
- `label_smoothing_factor`: 0.0
|
| 1030 |
+
- `optim`: adamw_torch_fused
|
| 1031 |
+
- `optim_args`: None
|
| 1032 |
+
- `adafactor`: False
|
| 1033 |
+
- `group_by_length`: False
|
| 1034 |
+
- `length_column_name`: length
|
| 1035 |
+
- `project`: huggingface
|
| 1036 |
+
- `trackio_space_id`: trackio
|
| 1037 |
+
- `ddp_find_unused_parameters`: None
|
| 1038 |
+
- `ddp_bucket_cap_mb`: None
|
| 1039 |
+
- `ddp_broadcast_buffers`: False
|
| 1040 |
+
- `dataloader_pin_memory`: True
|
| 1041 |
+
- `dataloader_persistent_workers`: False
|
| 1042 |
+
- `skip_memory_metrics`: True
|
| 1043 |
+
- `use_legacy_prediction_loop`: False
|
| 1044 |
+
- `push_to_hub`: False
|
| 1045 |
+
- `resume_from_checkpoint`: None
|
| 1046 |
+
- `hub_model_id`: None
|
| 1047 |
+
- `hub_strategy`: every_save
|
| 1048 |
+
- `hub_private_repo`: None
|
| 1049 |
+
- `hub_always_push`: False
|
| 1050 |
+
- `hub_revision`: None
|
| 1051 |
+
- `gradient_checkpointing`: False
|
| 1052 |
+
- `gradient_checkpointing_kwargs`: None
|
| 1053 |
+
- `include_inputs_for_metrics`: False
|
| 1054 |
+
- `include_for_metrics`: []
|
| 1055 |
+
- `eval_do_concat_batches`: True
|
| 1056 |
+
- `fp16_backend`: auto
|
| 1057 |
+
- `push_to_hub_model_id`: None
|
| 1058 |
+
- `push_to_hub_organization`: None
|
| 1059 |
+
- `mp_parameters`:
|
| 1060 |
+
- `auto_find_batch_size`: False
|
| 1061 |
+
- `full_determinism`: False
|
| 1062 |
+
- `torchdynamo`: None
|
| 1063 |
+
- `ray_scope`: last
|
| 1064 |
+
- `ddp_timeout`: 1800
|
| 1065 |
+
- `torch_compile`: False
|
| 1066 |
+
- `torch_compile_backend`: None
|
| 1067 |
+
- `torch_compile_mode`: None
|
| 1068 |
+
- `include_tokens_per_second`: False
|
| 1069 |
+
- `include_num_input_tokens_seen`: no
|
| 1070 |
+
- `neftune_noise_alpha`: None
|
| 1071 |
+
- `optim_target_modules`: None
|
| 1072 |
+
- `batch_eval_metrics`: False
|
| 1073 |
+
- `eval_on_start`: False
|
| 1074 |
+
- `use_liger_kernel`: False
|
| 1075 |
+
- `liger_kernel_config`: None
|
| 1076 |
+
- `eval_use_gather_object`: False
|
| 1077 |
+
- `average_tokens_across_devices`: True
|
| 1078 |
+
- `prompts`: None
|
| 1079 |
+
- `batch_sampler`: no_duplicates
|
| 1080 |
+
- `multi_dataset_batch_sampler`: proportional
|
| 1081 |
+
- `router_mapping`: {}
|
| 1082 |
+
- `learning_rate_mapping`: {}
|
| 1083 |
+
|
| 1084 |
+
</details>
|
| 1085 |
+
|
| 1086 |
+
### Training Logs
|
| 1087 |
+
| Epoch | Step | Training Loss | paraphrase-multilingual-MiniLM-L12-v2-251218_cosine_ndcg@10 |
|
| 1088 |
+
|:-------:|:----:|:-------------:|:-----------------------------------------------------------:|
|
| 1089 |
+
| -1 | -1 | - | 0.5888 |
|
| 1090 |
+
| 0.3559 | 100 | 1.925 | 0.6625 |
|
| 1091 |
+
| 0.7117 | 200 | 1.4605 | 0.7110 |
|
| 1092 |
+
| 1.0676 | 300 | 1.2876 | 0.7686 |
|
| 1093 |
+
| 1.4235 | 400 | 1.1927 | 0.7686 |
|
| 1094 |
+
| 1.7794 | 500 | 1.1368 | 0.7893 |
|
| 1095 |
+
| 2.1352 | 600 | 1.071 | 0.7679 |
|
| 1096 |
+
| 2.4911 | 700 | 1.0243 | 0.7707 |
|
| 1097 |
+
| 2.8470 | 800 | 1.0508 | 0.8115 |
|
| 1098 |
+
| 3.2028 | 900 | 0.9448 | 0.7878 |
|
| 1099 |
+
| 3.5587 | 1000 | 0.94 | 0.8023 |
|
| 1100 |
+
| 3.9146 | 1100 | 0.9675 | 0.7720 |
|
| 1101 |
+
| 4.2705 | 1200 | 0.9115 | 0.7966 |
|
| 1102 |
+
| 4.6263 | 1300 | 0.9163 | 0.7736 |
|
| 1103 |
+
| 4.9822 | 1400 | 0.9329 | 0.8026 |
|
| 1104 |
+
| 5.3381 | 1500 | 0.8309 | 0.8353 |
|
| 1105 |
+
| 5.6940 | 1600 | 0.881 | 0.7829 |
|
| 1106 |
+
| 6.0498 | 1700 | 0.8884 | 0.7911 |
|
| 1107 |
+
| 6.4057 | 1800 | 0.8497 | 0.7651 |
|
| 1108 |
+
| 6.7616 | 1900 | 0.8296 | 0.7948 |
|
| 1109 |
+
| 7.1174 | 2000 | 0.861 | 0.8055 |
|
| 1110 |
+
| 7.4733 | 2100 | 0.7921 | 0.7637 |
|
| 1111 |
+
| 7.8292 | 2200 | 0.8836 | 0.7924 |
|
| 1112 |
+
| 8.1851 | 2300 | 0.8131 | 0.7708 |
|
| 1113 |
+
| 8.5409 | 2400 | 0.787 | 0.7963 |
|
| 1114 |
+
| 8.8968 | 2500 | 0.8267 | 0.7975 |
|
| 1115 |
+
| 9.2527 | 2600 | 0.7634 | 0.8076 |
|
| 1116 |
+
| 9.6085 | 2700 | 0.7568 | 0.8160 |
|
| 1117 |
+
| 9.9644 | 2800 | 0.8086 | 0.8168 |
|
| 1118 |
+
| 10.3203 | 2900 | 0.7768 | 0.8118 |
|
| 1119 |
+
| 10.6762 | 3000 | 0.7877 | 0.7986 |
|
| 1120 |
+
| 11.0320 | 3100 | 0.7883 | 0.8038 |
|
| 1121 |
+
| 11.3879 | 3200 | 0.7316 | 0.8206 |
|
| 1122 |
+
| 11.7438 | 3300 | 0.7812 | 0.8090 |
|
| 1123 |
+
| 12.0996 | 3400 | 0.7441 | 0.8181 |
|
| 1124 |
+
| 12.4555 | 3500 | 0.8073 | 0.8135 |
|
| 1125 |
+
| 12.8114 | 3600 | 0.7424 | 0.8177 |
|
| 1126 |
+
| 13.1673 | 3700 | 0.7188 | 0.8132 |
|
| 1127 |
+
| 13.5231 | 3800 | 0.7206 | 0.8207 |
|
| 1128 |
+
| 13.8790 | 3900 | 0.7316 | 0.8050 |
|
| 1129 |
+
| 14.2349 | 4000 | 0.7378 | 0.8158 |
|
| 1130 |
+
| 14.5907 | 4100 | 0.7391 | 0.8098 |
|
| 1131 |
+
| 14.9466 | 4200 | 0.6781 | 0.7936 |
|
| 1132 |
+
| 15.3025 | 4300 | 0.6939 | 0.8076 |
|
| 1133 |
+
| 15.6584 | 4400 | 0.6879 | 0.8137 |
|
| 1134 |
+
| 16.0142 | 4500 | 0.7265 | 0.8146 |
|
| 1135 |
+
| 16.3701 | 4600 | 0.6854 | 0.8184 |
|
| 1136 |
+
| 16.7260 | 4700 | 0.7273 | 0.8145 |
|
| 1137 |
+
| 17.0819 | 4800 | 0.6828 | 0.8179 |
|
| 1138 |
+
| 17.4377 | 4900 | 0.6444 | 0.8204 |
|
| 1139 |
+
| 17.7936 | 5000 | 0.6865 | 0.8180 |
|
| 1140 |
+
| 18.1495 | 5100 | 0.6517 | 0.8039 |
|
| 1141 |
+
| 18.5053 | 5200 | 0.6502 | 0.8220 |
|
| 1142 |
+
| 18.8612 | 5300 | 0.6719 | 0.8114 |
|
| 1143 |
+
| 19.2171 | 5400 | 0.6409 | 0.8127 |
|
| 1144 |
+
| 19.5730 | 5500 | 0.6966 | 0.8119 |
|
| 1145 |
+
| 19.9288 | 5600 | 0.6707 | 0.8175 |
|
| 1146 |
+
| -1 | -1 | - | 0.8043 |
|
| 1147 |
+
|
| 1148 |
+
|
| 1149 |
+
### Framework Versions
|
| 1150 |
+
- Python: 3.12.12
|
| 1151 |
+
- Sentence Transformers: 5.1.2
|
| 1152 |
+
- Transformers: 4.57.3
|
| 1153 |
+
- PyTorch: 2.9.0+cu126
|
| 1154 |
+
- Accelerate: 1.12.0
|
| 1155 |
+
- Datasets: 4.0.0
|
| 1156 |
+
- Tokenizers: 0.22.1
|
| 1157 |
+
|
| 1158 |
+
## Citation
|
| 1159 |
+
|
| 1160 |
+
### BibTeX
|
| 1161 |
+
|
| 1162 |
+
#### Sentence Transformers
|
| 1163 |
+
```bibtex
|
| 1164 |
+
@inproceedings{reimers-2019-sentence-bert,
|
| 1165 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
| 1166 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
| 1167 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
| 1168 |
+
month = "11",
|
| 1169 |
+
year = "2019",
|
| 1170 |
+
publisher = "Association for Computational Linguistics",
|
| 1171 |
+
url = "https://arxiv.org/abs/1908.10084",
|
| 1172 |
+
}
|
| 1173 |
+
```
|
| 1174 |
+
|
| 1175 |
+
#### MultipleNegativesRankingLoss
|
| 1176 |
+
```bibtex
|
| 1177 |
+
@misc{henderson2017efficient,
|
| 1178 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
| 1179 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
| 1180 |
+
year={2017},
|
| 1181 |
+
eprint={1705.00652},
|
| 1182 |
+
archivePrefix={arXiv},
|
| 1183 |
+
primaryClass={cs.CL}
|
| 1184 |
+
}
|
| 1185 |
+
```
|
| 1186 |
+
|
| 1187 |
+
<!--
|
| 1188 |
+
## Glossary
|
| 1189 |
+
|
| 1190 |
+
*Clearly define terms in order to be accessible across audiences.*
|
| 1191 |
+
-->
|
| 1192 |
+
|
| 1193 |
+
<!--
|
| 1194 |
+
## Model Card Authors
|
| 1195 |
+
|
| 1196 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
| 1197 |
+
-->
|
| 1198 |
+
|
| 1199 |
+
<!--
|
| 1200 |
+
## Model Card Contact
|
| 1201 |
+
|
| 1202 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
| 1203 |
+
-->
|
config.json
ADDED
|
@@ -0,0 +1,25 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"architectures": [
|
| 3 |
+
"BertModel"
|
| 4 |
+
],
|
| 5 |
+
"attention_probs_dropout_prob": 0.1,
|
| 6 |
+
"classifier_dropout": null,
|
| 7 |
+
"dtype": "float32",
|
| 8 |
+
"gradient_checkpointing": false,
|
| 9 |
+
"hidden_act": "gelu",
|
| 10 |
+
"hidden_dropout_prob": 0.1,
|
| 11 |
+
"hidden_size": 384,
|
| 12 |
+
"initializer_range": 0.02,
|
| 13 |
+
"intermediate_size": 1536,
|
| 14 |
+
"layer_norm_eps": 1e-12,
|
| 15 |
+
"max_position_embeddings": 512,
|
| 16 |
+
"model_type": "bert",
|
| 17 |
+
"num_attention_heads": 12,
|
| 18 |
+
"num_hidden_layers": 12,
|
| 19 |
+
"pad_token_id": 0,
|
| 20 |
+
"position_embedding_type": "absolute",
|
| 21 |
+
"transformers_version": "4.57.3",
|
| 22 |
+
"type_vocab_size": 2,
|
| 23 |
+
"use_cache": true,
|
| 24 |
+
"vocab_size": 250037
|
| 25 |
+
}
|
config_sentence_transformers.json
ADDED
|
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"__version__": {
|
| 3 |
+
"sentence_transformers": "5.2.0",
|
| 4 |
+
"transformers": "4.57.3",
|
| 5 |
+
"pytorch": "2.9.0+cu126"
|
| 6 |
+
},
|
| 7 |
+
"model_type": "SentenceTransformer",
|
| 8 |
+
"prompts": {
|
| 9 |
+
"query": "",
|
| 10 |
+
"document": ""
|
| 11 |
+
},
|
| 12 |
+
"default_prompt_name": null,
|
| 13 |
+
"similarity_fn_name": "cosine"
|
| 14 |
+
}
|
model.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:6eb7048f16db0159a33417f3062762a999d9c90b54f677dc38882d6aecca9ffb
|
| 3 |
+
size 470637416
|
modules.json
ADDED
|
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
[
|
| 2 |
+
{
|
| 3 |
+
"idx": 0,
|
| 4 |
+
"name": "0",
|
| 5 |
+
"path": "",
|
| 6 |
+
"type": "sentence_transformers.models.Transformer"
|
| 7 |
+
},
|
| 8 |
+
{
|
| 9 |
+
"idx": 1,
|
| 10 |
+
"name": "1",
|
| 11 |
+
"path": "1_Pooling",
|
| 12 |
+
"type": "sentence_transformers.models.Pooling"
|
| 13 |
+
}
|
| 14 |
+
]
|
sentence_bert_config.json
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"max_seq_length": 128,
|
| 3 |
+
"do_lower_case": false
|
| 4 |
+
}
|
special_tokens_map.json
ADDED
|
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"bos_token": {
|
| 3 |
+
"content": "<s>",
|
| 4 |
+
"lstrip": false,
|
| 5 |
+
"normalized": false,
|
| 6 |
+
"rstrip": false,
|
| 7 |
+
"single_word": false
|
| 8 |
+
},
|
| 9 |
+
"cls_token": {
|
| 10 |
+
"content": "<s>",
|
| 11 |
+
"lstrip": false,
|
| 12 |
+
"normalized": false,
|
| 13 |
+
"rstrip": false,
|
| 14 |
+
"single_word": false
|
| 15 |
+
},
|
| 16 |
+
"eos_token": {
|
| 17 |
+
"content": "</s>",
|
| 18 |
+
"lstrip": false,
|
| 19 |
+
"normalized": false,
|
| 20 |
+
"rstrip": false,
|
| 21 |
+
"single_word": false
|
| 22 |
+
},
|
| 23 |
+
"mask_token": {
|
| 24 |
+
"content": "<mask>",
|
| 25 |
+
"lstrip": true,
|
| 26 |
+
"normalized": false,
|
| 27 |
+
"rstrip": false,
|
| 28 |
+
"single_word": false
|
| 29 |
+
},
|
| 30 |
+
"pad_token": {
|
| 31 |
+
"content": "<pad>",
|
| 32 |
+
"lstrip": false,
|
| 33 |
+
"normalized": false,
|
| 34 |
+
"rstrip": false,
|
| 35 |
+
"single_word": false
|
| 36 |
+
},
|
| 37 |
+
"sep_token": {
|
| 38 |
+
"content": "</s>",
|
| 39 |
+
"lstrip": false,
|
| 40 |
+
"normalized": false,
|
| 41 |
+
"rstrip": false,
|
| 42 |
+
"single_word": false
|
| 43 |
+
},
|
| 44 |
+
"unk_token": {
|
| 45 |
+
"content": "<unk>",
|
| 46 |
+
"lstrip": false,
|
| 47 |
+
"normalized": false,
|
| 48 |
+
"rstrip": false,
|
| 49 |
+
"single_word": false
|
| 50 |
+
}
|
| 51 |
+
}
|
tokenizer.json
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
|
| 3 |
+
size 17082987
|
tokenizer_config.json
ADDED
|
@@ -0,0 +1,65 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"added_tokens_decoder": {
|
| 3 |
+
"0": {
|
| 4 |
+
"content": "<s>",
|
| 5 |
+
"lstrip": false,
|
| 6 |
+
"normalized": false,
|
| 7 |
+
"rstrip": false,
|
| 8 |
+
"single_word": false,
|
| 9 |
+
"special": true
|
| 10 |
+
},
|
| 11 |
+
"1": {
|
| 12 |
+
"content": "<pad>",
|
| 13 |
+
"lstrip": false,
|
| 14 |
+
"normalized": false,
|
| 15 |
+
"rstrip": false,
|
| 16 |
+
"single_word": false,
|
| 17 |
+
"special": true
|
| 18 |
+
},
|
| 19 |
+
"2": {
|
| 20 |
+
"content": "</s>",
|
| 21 |
+
"lstrip": false,
|
| 22 |
+
"normalized": false,
|
| 23 |
+
"rstrip": false,
|
| 24 |
+
"single_word": false,
|
| 25 |
+
"special": true
|
| 26 |
+
},
|
| 27 |
+
"3": {
|
| 28 |
+
"content": "<unk>",
|
| 29 |
+
"lstrip": false,
|
| 30 |
+
"normalized": false,
|
| 31 |
+
"rstrip": false,
|
| 32 |
+
"single_word": false,
|
| 33 |
+
"special": true
|
| 34 |
+
},
|
| 35 |
+
"250001": {
|
| 36 |
+
"content": "<mask>",
|
| 37 |
+
"lstrip": true,
|
| 38 |
+
"normalized": false,
|
| 39 |
+
"rstrip": false,
|
| 40 |
+
"single_word": false,
|
| 41 |
+
"special": true
|
| 42 |
+
}
|
| 43 |
+
},
|
| 44 |
+
"bos_token": "<s>",
|
| 45 |
+
"clean_up_tokenization_spaces": false,
|
| 46 |
+
"cls_token": "<s>",
|
| 47 |
+
"do_lower_case": true,
|
| 48 |
+
"eos_token": "</s>",
|
| 49 |
+
"extra_special_tokens": {},
|
| 50 |
+
"mask_token": "<mask>",
|
| 51 |
+
"max_length": 128,
|
| 52 |
+
"model_max_length": 128,
|
| 53 |
+
"pad_to_multiple_of": null,
|
| 54 |
+
"pad_token": "<pad>",
|
| 55 |
+
"pad_token_type_id": 0,
|
| 56 |
+
"padding_side": "right",
|
| 57 |
+
"sep_token": "</s>",
|
| 58 |
+
"stride": 0,
|
| 59 |
+
"strip_accents": null,
|
| 60 |
+
"tokenize_chinese_chars": true,
|
| 61 |
+
"tokenizer_class": "BertTokenizer",
|
| 62 |
+
"truncation_side": "right",
|
| 63 |
+
"truncation_strategy": "longest_first",
|
| 64 |
+
"unk_token": "<unk>"
|
| 65 |
+
}
|
unigram.json
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
|
| 3 |
+
size 14763260
|