ntAnh-dev commited on
Commit
c649e1b
·
verified ·
1 Parent(s): e17df94

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1203 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:4485
9
+ - loss:MultipleNegativesRankingLoss
10
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
11
+ widget:
12
+ - source_sentence: Hồ sơ đăng ký cấp xét học bổng tài trợ bao gồm những gì ?
13
+ sentences:
14
+ - 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
15
+
16
+ Điều 4. Nguyên tắc xét cấp học bổng
17
+
18
+ 3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
19
+
20
+ a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
21
+
22
+ b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
23
+
24
+ học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
25
+
26
+ c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
27
+
28
+ học kỳ cấp học bổng;
29
+
30
+ d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
31
+
32
+ đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
33
+
34
+ nghiệp duy nhất;
35
+
36
+ Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
37
+
38
+ 1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
39
+
40
+ loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
41
+ tin
42
+
43
+ sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
44
+
45
+ '
46
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
47
+
48
+ Chương III NỘI DUNG CÔNG TÁC SINH VIÊN
49
+
50
+ Điều 19. Tư vấn tâm lý, chăm sóc sức khỏe sinh viên
51
+
52
+ 1. Tổ chức các hoạt động tư vấn tâm lý, chăm sóc sức khỏe để phòng ngừa và hỗ
53
+
54
+ trợ kịp thời khi sinh viên gặp phải các vấn đề ảnh hưởng đến thể chất và tinh
55
+ thần.
56
+
57
+ 2. Tư vấn và hỗ trợ sinh viên mới nhập học hòa nhập với môi trường học tập
58
+
59
+ mới.
60
+
61
+ 3. Tổ chức khám sức khỏe cho sinh viên mới nhập học và khám sức khỏe định kỳ
62
+
63
+ cho sinh viên; tư vấn, tổ chức cho sinh viên thực hiện Luật bảo hiểm y tế; tổ
64
+ chức sơ,
65
+
66
+ cấp cứu, khám chữa bệnh ban đầu cho sinh viên.
67
+
68
+ Điều 20. Tổ chức các dịch vụ thiết yếu cho sinh viên
69
+
70
+ Tổ chức và hướng dẫn sinh viên sử dụng các dịch vụ thiết yếu phục vụ đời sống,
71
+
72
+ học tập và rèn luyện trong quá trình học tập như: internet, nhà ăn, căng tin,
73
+ trông giữ
74
+
75
+ xe, sân chơi, bãi tập, thiết chế văn hóa…
76
+
77
+ Điều 21. Hỗ trợ tài chính cho sinh viên
78
+
79
+ 1. Hướng dẫn và hỗ trợ sinh viên có hoàn cảnh khó khăn làm thủ tục vay vốn
80
+
81
+ ngân hàng chính sách xã hội.
82
+
83
+ 2. Tăng cường khai thác, quản lý và sử dụng hiệu quả các nguồn tài trợ nhằm
84
+
85
+ khuyến khích sinh viên có kết quả học tập tốt, động viên, hỗ trợ sinh viên có
86
+ hoàn
87
+
88
+ cảnh khó khăn.
89
+
90
+ 3. Quan tâm, hỗ trợ kịp thời những sinh viên có hoàn cảnh đặc biệt khó khăn về
91
+
92
+ kinh tế, sinh viên mồ côi không nơi nương tựa, sinh viên là người khuyết tật,
93
+ sinh viên
94
+
95
+ gặp khó khăn rủi ro đột xuất.
96
+
97
+ 4. Hỗ trợ kinh phí cho sinh viên tham gia các hoạt động nghiên cứu sáng tạo và
98
+
99
+ khởi nghiệp, hoạt động trao đổi sinh viên quốc tế, hoạt động học tập nâng cao
100
+ trình độ
101
+
102
+ ngoại ngữ.
103
+
104
+ '
105
+ - 'Quy định về Học bổng Trần Đại Nghĩa
106
+
107
+ Chương I NHỮNG QUY ĐỊNH CHUNG
108
+
109
+ Điều 3. Nguồn Học bổng Trần Đại Nghĩa
110
+
111
+ Học bổng Trần Đại Nghĩa được hình thành từ các nguồn sau:
112
+
113
+ 1. Trích từ nguồn kinh phí hợp pháp của ĐHBK Hà Nội do Giám đốc Đại học
114
+
115
+ quyết định.
116
+
117
+ 2. Sự đóng góp của các cán bộ, viên chức, người lao động của ĐHBK Hà Nội.
118
+
119
+ 3. Sự đóng góp của các thế hệ sinh viên và cựu sinh viên ĐHBK Hà Nội.
120
+
121
+ 4. Tài trợ từ các tổ chức, doanh nghiệp và các nhà hảo tâm khác.
122
+
123
+ Điều 4. Nguyên tắc hoạt động của Học bổng Trần Đại Nghĩa
124
+
125
+ Học bổng Trần Đại Nghĩa hoạt động trên các nguyên tắc sau:
126
+
127
+ 1. Các kho ản đóng góp cho Học b ổng Tr ần Đại Nghĩa là tự nguyện, không vì
128
+
129
+ mục đích lợi nhuận.
130
+
131
+ 2. Hoạt động xét, cấp học bổng được thực hiện công khai, minh mạch và tuân thủ
132
+
133
+ theo các quy định hiện hành về quản lý tài chính của Nhà nước và của ĐHBK Hà Nội.
134
+
135
+ '
136
+ - source_sentence: Sinh viên có cần phải đăng ký để xét duyệt học bổng KKHT (khuyến
137
+ khích học tập) không ?
138
+ sentences:
139
+ - 'Quy chế Công tác sinh viên Đại học Bách Khoa Hà Nội
140
+
141
+ Chương VII TỔ CHỨC THỰC HIỆN
142
+
143
+ Điều 51. Trách nhiệm của Trung tâm Dịch vụ và Hỗ trợ Bách khoa
144
+
145
+ 1. Tiếp nhận, quản lý và phục vụ sinh viên nội trú trong ký túc xá theo quy định.
146
+
147
+ 2. Cung cấp các dịch vụ nâng cao đời sống, chăm sóc sức khỏe, hỗ trợ học tập
148
+
149
+ cho sinh viên.
150
+
151
+ 3. Cung cấp các dịch vụ trông, giữ xe đạp, xe máy cho sinh viên được thuận tiện,
152
+
153
+ an toàn.
154
+
155
+ 4. Chủ trì phối hợp với các đơn vị liên quan trong và ngoài Đại học đảm bảo an
156
+
157
+ ninh, trật tự học đường và an ninh, trật tự cho sinh viên nội trú trong ký túc
158
+ xá.
159
+
160
+ 5. Phối hợp với công an địa phương làm thủ tục đăng ký tạm trú trong ký túc xá
161
+
162
+ cho sinh viên.
163
+
164
+ Điều 52. Trách nhiệm của Trung tâm Y tế Bách khoa
165
+
166
+ 1. Chịu trách nhiệm về công tác y tế và chăm sóc sức khoẻ ban đầu cho sinh viên.
167
+
168
+ 2. Tổ chức hoặc phối hợp tổ chức các hoạt động tư vấn, chăm sóc sức khỏe,
169
+
170
+ khám chữa bệnh cho sinh viên.
171
+
172
+ 3. Lập kế hoạch và tổ chức khám sức khỏe ban đầu và khám sức khỏe định kỳ
173
+
174
+ cho sinh viên.
175
+
176
+ '
177
+ - 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
178
+
179
+ Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng
180
+
181
+ 1. Văn bản này quy định về nguyên tắc, tiêu chuẩn xét duyệt và cấp học bổng cho
182
+
183
+ sinh viên đại học hình thức đào tạo chính quy tại Đại học Bách khoa Hà Nội (sau
184
+ đây
185
+
186
+ viết tắt là ĐHBK Hà N ội), căn cứ các quy định liên quan tại Nghị định số
187
+
188
+ 84/2020/NĐ-CP ngày 17/7/2020 của Chính phủ và Quy chế Quản lý tài chính của Đại
189
+
190
+ học Bách khoa Hà Nội được ban hành theo Nghị quyết số 20/NQ-ĐHBK ngày
191
+
192
+ 16/3/2023 của Hội đồng Đại học, Đại học Bách khoa Hà Nội.
193
+
194
+ 2. Quy định này áp dụng đối với sinh viên đại học hình thức đào tạo chính quy
195
+
196
+ văn bằng thứ nhất của ĐHBK Hà Nội.
197
+
198
+ Điều 2. Các quy định chung
199
+
200
+ 1. Học bổng khuyến khích học tập (KKHT) cấp cho các sinh viên được lựa chọn
201
+
202
+ bởi Hội đồng xét cấp học bổng ĐHBK Hà Nội theo từng học kỳ chính của năm học
203
+ ,
204
+
205
+ căn cứ vào thành tích học tập và rèn luyện của sinh viên trong học kỳ chính liền
206
+ trước
207
+
208
+ đó.
209
+
210
+ '
211
+ - 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2020-2021
212
+
213
+ Tiêu chí điểm cộng (Tối đa 100 điểm)
214
+
215
+ Điểm ý thức công dân trong quan hệ cộng đồng (tối đa 20 điểm)
216
+
217
+ Các hoạt động liên quan đến trách nhiệm công dân (tối đa 16 điểm):
218
+
219
+ Hiểu biết và chấp hành pháp luật của Nhà nước, quy định của nhà trường và nơi
220
+ cư trú; minh chứng: được cấp khi tham gia hoạt động; điểm: 8
221
+
222
+ Khai báo thông tin liên lạc và nơi cư trú theo yêu cầu của Nhà trường; minh chứng:
223
+ dựa trên hệ thống quản lý; điểm: 4
224
+
225
+ Tham gia tuyên truyền chủ trương của Đảng, chính sách pháp luật của Nhà nước,
226
+ quy định của nơi cư trú,
227
+
228
+ quy định và quy chế của Nhà trường được địa phương, Nhà trường công nhận; minh
229
+ chứng: được cấp khi tham gia hoạt động; điểm: 4
230
+
231
+ Tham gia giữ gìn an ninh – trật tự, bảo vệ sinh cảnh quan - môi trường, nếp sống
232
+ văn minh nơi công cộng,
233
+
234
+ quảng bá hình ảnh đẹp của Nhà trường được địa phương, Nhà trường công nhận; minh
235
+ chứng: được cấp khi tham gia hoạt động; điểm: 4
236
+
237
+ Có các thành tích trong học tập, NCKH và rèn luyện (tối đa 4 điểm):
238
+
239
+ Đạt giải trong các cuộc thi SV NCKH, Olympic, thi khoa học kỹ thuật; minh chứng:
240
+ được cấp khi tham gia hoạt động; điểm: 4
241
+
242
+ Nhận bằng khen, huy chương tương đương cấp Bộ trở lên; minh chứng: được cấp khi
243
+ tham gia hoạt động; điểm: 4
244
+
245
+ Có chứng nhận tham gia lớp bồi dưỡng nhận thức về Đảng từ mức Khá trở lên; minh
246
+ chứng: được cấp khi tham gia hoạt động; điểm: 4
247
+
248
+ Được kết nạp Đảng Cộng sản Việt Nam; minh chứng: được cấp khi tham gia hoạt động;
249
+ điểm: 4
250
+
251
+ Đạt danh hiệu Sinh viên năm tốt cấp Trường trở lên, Giấy khen Cán bộ đoàn học
252
+ tốt, Giấy khen Sinh viên
253
+
254
+ tích cực đóng cho hoạt động của Nhà trường; minh chứng: được cấp khi tham gia
255
+ hoạt động; điểm: 4
256
+
257
+ Được khen thưởng khi tham gia tuyên truyền chủ trương của Đảng, chính sách pháp
258
+ luật của Nhà nước,
259
+
260
+ quy định của nơi cư trú, giữ gìn an ninh – trật tự, bảo vệ sinh cảnh quan - môi
261
+ trường, nếp sống văn minh
262
+
263
+ nơi công cộng, hoạt động xã hội.; minh chứng: được cấp khi tham gia hoạt động;
264
+ điểm: 4'
265
+ - source_sentence: Về vấn đề giám sát thực hiện các quy chế, quy định về người học
266
+ của trường sẽ do phòng ban nào phụ trách?
267
+ sentences:
268
+ - 'Quy định về Học bổng Trần Đại Nghĩa
269
+
270
+ Chương II TIÊU CHUẨN, NGUYÊN TẮC VÀ HỒ SƠ ĐĂNG KÝ, XÉT CẤP HỌC BỔNG TRẦN ĐẠI NGHĨA
271
+
272
+ Điều 5. Tiêu chuẩn được đăng ký xét Học bổng Trần Đại Nghĩa
273
+
274
+ Sinh viên có hoàn cảnh kinh tế gia đình đặc biệt khó khăn (hộ nghèo, hộ cận
275
+
276
+ nghèo hoặc hộ có hoàn cảnh kinh tế đặc biệt khó khăn khác), sinh viên gặp các
277
+ tai nạn,
278
+
279
+ rủi ro đột xuất thuộc các đối tượng sau được đăng ký xét Học bổng Trần Đại Nghĩa:
280
+
281
+ 1. Sinh viên mới trúng tuy ển vào ĐHBK Hà Nội (đang trong th ời gian học kỳ
282
+
283
+ một năm thứ nhất) đạt một trong các điều kiện sau:
284
+
285
+ a) Là thành viên đ ội tuyển dự thi Olympic qu ốc tế hoặc đạt giải kỳ thi học sinh
286
+
287
+ giỏi quốc gia các môn học thuộc tổ hợp xét tuyển vào ĐHBK Hà Nội đúng ngành học;
288
+
289
+ b) Đạt điểm cao trong kỳ thi tuyển, xét tuyển vào ĐHBK Hà Nội (căn cứ vào
290
+
291
+ điểm chuẩn trúng tuyển hàng năm, Đại học sẽ công bố mức điểm đạt điều kiện xét
292
+ học
293
+
294
+ bổng).
295
+
296
+ 2. Sinh viên khác (từ học kỳ 2 trở đi) đạt đủ các điều kiện sau:
297
+
298
+ a) Sinh viên đang trong thời gian học tập theo chương trình đào tạo chuẩn;
299
+
300
+ b) Điểm học tập trung bình tích lũy (CPA) ≥ 2,0;
301
+
302
+ c) Tích lũy đủ số tín chỉ theo qui định xếp hạng trình độ năm học;
303
+
304
+ d) Điểm rèn luyện trung bình tích lũy ≥ 65.
305
+
306
+ 3. Sinh viên có hoàn cảnh kinh tế gia đình khó khăn do gặp các tai nạn, rủi ro
307
+ đột
308
+
309
+ xuất, gồm:
310
+
311
+ a) Sinh viên mắc bệnh hiểm nghèo;
312
+
313
+ b) Sinh viên gặp tai nạn ở mức độ nặng và phải điều trị dài ngày trong bệnh viện;
314
+
315
+ c) Gia đình sinh viên gặp thiên tai, dịch bệnh hoặc hỏa hoạn.
316
+
317
+ 4. Các trường hợp đặc biệt khác do Giám đốc Đại học quyết định.
318
+
319
+ '
320
+ - 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
321
+
322
+ Điều 4. Nguyên tắc xét cấp học bổng
323
+
324
+ 3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
325
+
326
+ a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
327
+
328
+ b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
329
+
330
+ học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
331
+
332
+ c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
333
+
334
+ học kỳ cấp học bổng;
335
+
336
+ d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
337
+
338
+ đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
339
+
340
+ nghiệp duy nhất;
341
+
342
+ Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
343
+
344
+ 1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
345
+
346
+ loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
347
+ tin
348
+
349
+ sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
350
+
351
+ '
352
+ - 'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà
353
+ Nội
354
+
355
+ Chương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN
356
+
357
+ Điều 13. Phòng/Ban chức năng Công tác sinh viên
358
+
359
+ 1. Tiếp nhận và quản lý hồ sơ LHS học tập tại ĐHBK Hà Nội từ Phòng/Ban chức
360
+
361
+ năng Tuyển sinh, Hợp tác đối ngoại như quy định t���i Điều 2.
362
+
363
+ 2. Chủ trì tổ chức phổ biến các quy định, quy chế, nội quy của ĐHBK Hà Nội
364
+
365
+ cho LHS.
366
+
367
+ 3. Hỗ trợ LHS các thủ tục hành chính, chế độ bảo hiểm theo quy định.
368
+
369
+ 4. Hỗ trợ LHS các thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh theo quy định
370
+
371
+ của pháp luật.
372
+
373
+ 5. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội tổ chức các sự
374
+
375
+ kiện, hoạt động giao lưu văn hóa, thể thao nhằm tăng cường tình đoàn kết hữu
376
+ nghị
377
+
378
+ giữa LHS các nước và sinh viên Việt Nam.
379
+
380
+ 6. Phối hợp với các đơn vị liên quan hỗ trợ LHS theo nhiệm vụ được giao.
381
+
382
+ 7. Cập nhật vào hệ thống cơ sở dữ liệu điện tử quản lý LHS của Bộ Giáo dục và
383
+
384
+ Đào tạo.
385
+
386
+ 8. Là đầu mối, p hối hợp với Phòng /Ban chức năng thực hiện công tác thống kê,
387
+
388
+ tổng hợp, báo cáo lãnh đạo ĐHBK Hà Nội và Bộ Giáo dục và Đào tạo định kỳ và đột
389
+
390
+ xuất theo yêu cầu.
391
+
392
+ 9. Chủ trì phối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội
393
+
394
+ cung cấp thông tin và giải quyết các vấn đề liên quan tới LHS Hiệp định và LHS
395
+
396
+ ngoài Hiệp định .
397
+
398
+ '
399
+ - source_sentence: Đạt danh hiệu Sinh viên 5 tốt thì đạt bao nhiêu điểm rèn luyện?
400
+ sentences:
401
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
402
+
403
+ CHƯƠNG II
404
+
405
+ ĐÀO TẠO ĐẠI HỌC
406
+
407
+ Điều 12. Ý kiến phản hồi của người học, đánh giá kết quả học tập
408
+
409
+ 6. Sinh viên được xếp loại học lực theo học kỳ căn cứ điểm trung bình học kỳ và
410
+ xếp
411
+
412
+ loại học lực từ đầu khóa căn cứ điểm trung bình tích lũy như sau:
413
+
414
+ GPA hoặc CPA: < 1,0, Xếp loại: Kém
415
+
416
+ GPA hoặc CPA: 1,0-1,99, Xếp loại: Yếu
417
+
418
+ GPA hoặc CPA: 2,0-2,49, Xếp loại: Trung bình
419
+
420
+ GPA hoặc CPA: 2,5-3,19, Xếp loại: Khá
421
+
422
+ GPA hoặc CPA: 3,2-3,59, Xếp loại: Giỏi
423
+
424
+ GPA hoặc CPA: 3,6-4,0, Xếp loại: Xuất sắc
425
+
426
+ 7. Trong trường hợp cần thiết, điểm trung bình học kỳ và điểm trung bình tích
427
+ lũy đạt
428
+
429
+ từ loại trung bình trở lên có thể được quy đổi tương đương sang thang điểm 10
430
+ theo quy
431
+
432
+ tắc như sau:
433
+
434
+ Dải điểm thang 4: 2,0 đến cận 2,5, Dải điểm thang 10 tương đương: 5,5 đến cận
435
+ 7,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 3,00; b = −0,5
436
+
437
+ Dải điểm thang 4: 2,5 đến cận 3,2, Dải điểm thang 10 tương đương: 7,0 đến cận
438
+ 8,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 1,42; b = 3,45
439
+
440
+ Dải điểm thang 4: 3,2 đến cận 3,6, Dải điểm thang 10 tương đương: 8,0 đến cận
441
+ 9,0, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 2,50; b = 0.00
442
+
443
+ Dải điểm thang 4: 3,6 đến tròn 4,0, Dải điểm thang 10 tương đương: 9,0 đến tròn
444
+ 10, Công thức quy đổi Điểm thang 10 = Điểm thang 4 × a + b: a = 2,50; b = 0.00
445
+
446
+
447
+ '
448
+ - 'QUY ĐỊNH Đánh giá kết quả rèn luyện của sinh viên Đại học Bách khoa Hà Nội 2023
449
+
450
+ Điều 5. Thời gian đánh giá
451
+
452
+ 1. Việc đánh giá kết quả rèn luyện của sinh viên được tiến hành định kỳ theo học
453
+ kỳ,
454
+
455
+ năm học và toàn khóa học.
456
+
457
+ 2. Điểm rèn luyện của học kỳ là tổng điểm đạt được của các nội dung đánh giá chi
458
+
459
+ tiết.
460
+
461
+ 3. Điểm rèn luyện của năm học là trung bình cộng của điểm rèn luyện các học kỳ
462
+ của
463
+
464
+ năm học đó.
465
+
466
+ 4. Điểm rèn luyện toàn khóa là trung bình c ộng của điểm rèn luyện của tối thiểu
467
+ 07
468
+
469
+ học kỳ. Trong trường hợp đặc biệt, điểm rèn luyện toàn khóa do Ban Giám đốc quyết
470
+ định.
471
+
472
+
473
+ Điều 6. Sử dụng kết quả đánh giá
474
+
475
+ 1. Kết quả đánh giá rèn luy ện của sinh viên được sử dụng trong việc xét duyệt
476
+ học
477
+
478
+ bổng, xét khen thưởng - kỷ luật, xét thôi học, ngừng học, xét lưu trú ký túc xá.
479
+
480
+ 2. Kết quả đánh giá rèn luyện toàn khóa học được ghi chung vào bảng điểm kết quả
481
+
482
+ học tập và lưu trong hồ sơ của người học khi tốt nghiệp.
483
+
484
+ 3. Sinh viên có kết quả rèn luyện xuất sắc được Trường/Đại học xem xét biểu dương,
485
+
486
+ khen thưởng.
487
+
488
+ 4. Sinh viên bị xếp loại rèn luyện Yếu/Kém trong hai học kỳ liên tiếp bị hạn chế
489
+ đăng
490
+
491
+ ký học tập tương đương cảnh báo học tập mức 2.
492
+
493
+ '
494
+ - 'Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội
495
+
496
+ Điều 4. Nguyên tắc xét cấp học bổng
497
+
498
+ 3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:
499
+
500
+ a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;
501
+
502
+ b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại
503
+
504
+ học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;
505
+
506
+ c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại
507
+
508
+ học kỳ cấp học bổng;
509
+
510
+ d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;
511
+
512
+ đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt
513
+
514
+ nghiệp duy nhất;
515
+
516
+ Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng
517
+
518
+ 1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng
519
+
520
+ loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông
521
+ tin
522
+
523
+ sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.
524
+
525
+ '
526
+ - source_sentence: Khi tham gia chương trình sinh hoạt công dân do trường ,viện tổ
527
+ chức thì đạt bao nhiêu điểm rèn luyện?
528
+ sentences:
529
+ - 'Quy chế đào tạo đại học bách khoa Hà Nội 2025
530
+
531
+ CHƯƠNG I
532
+
533
+ NHỮNG QUY ĐỊNH CHUNG
534
+
535
+ Điều 2. Ngành đào tạo, chương trình đào tạo
536
+
537
+ 6. Thời gian và khối lượng học tập chuẩn đối với các CTĐT theo hình thức chính
538
+ quy
539
+
540
+ không kể các học phần bổ sung kiến thức được quy định như sau:
541
+
542
+ Chương trình: Người học, Cử nhân: Tốt nghiệp THPT, Kỹ sư: Tốt nghiệp cử nhân theo
543
+ chương trình tích hợp, Thạc sĩ: Tốt nghiệp cử nhân, Tiến sĩ: Tốt nghiệp thạc sĩ
544
+
545
+ Chương trình: Thời gian, Cử nhân: 4 năm, Kỹ sư: 1,5 năm, Thạc sĩ: 2 năm, Tiến
546
+ sĩ: 3 năm
547
+
548
+ Chương trình: Khối lượng tối thiểu, Cử nhân: 132 tín chỉ, Kỹ sư: 48 tín chỉ, Thạc
549
+ sĩ: 60 tín chỉ, Tiến sĩ: 106 tín chỉ
550
+
551
+ 7. Thời gian theo kế hoạch học tập chuẩn toàn khoá đối với hình thức đào tạo vừa
552
+
553
+ làm vừa học dài hơn tối thiểu 20% so với hình thức đào tạo chính quy của cùng
554
+ CTĐT.
555
+
556
+ '
557
+ - 'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà
558
+ Nội
559
+
560
+ Chương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN
561
+
562
+ Điều 11. Phòng/Ban chức năng Hợp tác đối ngoại
563
+
564
+ 1. Hoàn thành hồ sơ quản lý LHS học tích lũy tín chỉ như quy định tại khoản
565
+ 1,
566
+
567
+ Điều 2 và bàn giao cho Phòng/ Ban chức năng Công tác sinh viên quản lý.
568
+
569
+ 2. Lập và quản lý hồ sơ LHS trao đổi như quy định tại khoản 2, Điều 2.
570
+
571
+ 3. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội cung cấp
572
+
573
+ thông tin, giải quyết các vấn đề liên quan trong và sau quá trình thực hiện các
574
+ hoạt
575
+
576
+ động trao đổi tới LHS .
577
+
578
+ 4. Tổ chức và hỗ trợ các đơn vị liên quan tổ chức các chương trình giao lưu, trao
579
+
580
+ đổi văn hóa cho LHS ; thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh phục vụ
581
+ cho
582
+
583
+ việc học tập của LHS.
584
+
585
+ 5. Tổng hợp báo cáo lãnh đạo ĐHBK Hà Nội và các cơ quan chức năng định kỳ
586
+
587
+ và đột xuất theo yêu cầu.
588
+
589
+ Điều 12. Đơn vị chức năng Hỗ trợ trao đổi học thuật
590
+
591
+ Phối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội tổ chức các
592
+
593
+ chương trình giao lưu, trao đổi văn hóa cho LHS.
594
+
595
+ '
596
+ - 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2022-2023
597
+
598
+ Tiêu chí điểm cộng (Tối đa 100 điểm)
599
+
600
+ Điểm học tập (Tối đa 30 điểm)
601
+
602
+ Kết quả học tập có điểm trung bình học kỳ (tối đa 24 điểm):
603
+
604
+ Có kết quả học tập ở mức GPA ≥ 3.6; minh chứng: dựa trên hệ thống quản lý; điểm:
605
+ 20
606
+
607
+ Có kết quả học tập ở mức: 3.2 ≤ GPA < 3.6; minh chứng: dựa trên hệ thống quản
608
+ lý; điểm: 18
609
+
610
+ Có kết quả học tập ở mức: 2.5 ≤ GPA < 3.2; minh chứng: dựa trên hệ thống quản
611
+ lý; điểm: 16
612
+
613
+ Có kết quả học tập ở mức: 2.0 ≤ GPA < 2.5;; minh chứng: dựa trên hệ thống quản
614
+ lý; điểm: 14
615
+
616
+ Có kết quả học tập ở mức: 1.5 ≤ GPA < 2.0;; minh chứng: dựa trên hệ thống quản
617
+ lý; điểm: 12
618
+
619
+ Có nỗ lực trong học tập (GPA kỳ đánh giá cao hơn kỳ trước, giảm mức cảnh
620
+
621
+ cáo học tập, hoặc duy trì điểm GPA trên 3.6 ); minh chứng: dựa trên hệ thống quản
622
+ lý; điểm: 8
623
+
624
+ Trình độ ngoại ngữ (tối đa 6 điểm):
625
+
626
+ Đạt trình độ ngoại ngữ theo tiến độ của chương trình đào tạo; minh chứng: dựa
627
+ trên hệ thống quản lý; điểm: 4
628
+
629
+ Đạt chứng chỉ ngoại ngữ tương đương TOEIC 600 điểm trở lên; minh chứng: được cấp
630
+ khi tham gia hoạt động; điểm: 2
631
+
632
+ Tham gia các hoạt động học thuật (tối đa 9 điểm):
633
+
634
+ Tham gia hoạt động, sự kiệnliên quan đến NCKH, học thuật, chuyên môn; minh chứng:
635
+ được cấp khi tham gia hoạt động; điểm: 3
636
+
637
+ Tham gia khóa đào tạo kỹ năng nghề nghiệp, kỹ năng bổ trợ chuyên môn; minh chứng:
638
+ được cấp khi tham gia hoạt động; điểm: 6
639
+
640
+ Thành viên CLB học thuật, Lab nghiên cứu, Nhóm nghiên cứu, nhóm Khởi
641
+
642
+ nghiệp; minh chứng: được cấp khi tham gia hoạt động; điểm: 6
643
+
644
+ Tham gia công bố khoa học tại Hội nghị hoặc tạp chí khoa học chuyên
645
+
646
+ ngành; minh chứng: được cấp khi tham gia hoạt động; điểm: 6
647
+
648
+ Tham gia các cuộc thi Olympic cấp trường, cấp quốc gia, quốc tế; minh chứng: được
649
+ cấp khi tham gia hoạt động; điểm: 6'
650
+ pipeline_tag: sentence-similarity
651
+ library_name: sentence-transformers
652
+ metrics:
653
+ - cosine_accuracy@1
654
+ - cosine_accuracy@3
655
+ - cosine_accuracy@5
656
+ - cosine_accuracy@10
657
+ - cosine_precision@1
658
+ - cosine_precision@3
659
+ - cosine_precision@5
660
+ - cosine_precision@10
661
+ - cosine_recall@1
662
+ - cosine_recall@3
663
+ - cosine_recall@5
664
+ - cosine_recall@10
665
+ - cosine_ndcg@10
666
+ - cosine_mrr@10
667
+ - cosine_map@100
668
+ model-index:
669
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
670
+ results:
671
+ - task:
672
+ type: information-retrieval
673
+ name: Information Retrieval
674
+ dataset:
675
+ name: paraphrase multilingual MiniLM L12 v2 251218
676
+ type: paraphrase-multilingual-MiniLM-L12-v2-251218
677
+ metrics:
678
+ - type: cosine_accuracy@1
679
+ value: 0.8243243243243243
680
+ name: Cosine Accuracy@1
681
+ - type: cosine_accuracy@3
682
+ value: 0.918918918918919
683
+ name: Cosine Accuracy@3
684
+ - type: cosine_accuracy@5
685
+ value: 0.972972972972973
686
+ name: Cosine Accuracy@5
687
+ - type: cosine_accuracy@10
688
+ value: 0.9864864864864865
689
+ name: Cosine Accuracy@10
690
+ - type: cosine_precision@1
691
+ value: 0.8243243243243243
692
+ name: Cosine Precision@1
693
+ - type: cosine_precision@3
694
+ value: 0.6936936936936936
695
+ name: Cosine Precision@3
696
+ - type: cosine_precision@5
697
+ value: 0.6216216216216216
698
+ name: Cosine Precision@5
699
+ - type: cosine_precision@10
700
+ value: 0.4864864864864865
701
+ name: Cosine Precision@10
702
+ - type: cosine_recall@1
703
+ value: 0.2535975660975661
704
+ name: Cosine Recall@1
705
+ - type: cosine_recall@3
706
+ value: 0.4425328800328801
707
+ name: Cosine Recall@3
708
+ - type: cosine_recall@5
709
+ value: 0.5839746777246777
710
+ name: Cosine Recall@5
711
+ - type: cosine_recall@10
712
+ value: 0.762303406053406
713
+ name: Cosine Recall@10
714
+ - type: cosine_ndcg@10
715
+ value: 0.8174578592944561
716
+ name: Cosine Ndcg@10
717
+ - type: cosine_mrr@10
718
+ value: 0.8800675675675675
719
+ name: Cosine Mrr@10
720
+ - type: cosine_map@100
721
+ value: 0.7600296418090827
722
+ name: Cosine Map@100
723
+ - type: cosine_accuracy@1
724
+ value: 0.8899082568807339
725
+ name: Cosine Accuracy@1
726
+ - type: cosine_accuracy@3
727
+ value: 0.9357798165137615
728
+ name: Cosine Accuracy@3
729
+ - type: cosine_accuracy@5
730
+ value: 0.9541284403669725
731
+ name: Cosine Accuracy@5
732
+ - type: cosine_accuracy@10
733
+ value: 0.9724770642201835
734
+ name: Cosine Accuracy@10
735
+ - type: cosine_precision@1
736
+ value: 0.8899082568807339
737
+ name: Cosine Precision@1
738
+ - type: cosine_precision@3
739
+ value: 0.7431192660550459
740
+ name: Cosine Precision@3
741
+ - type: cosine_precision@5
742
+ value: 0.6458715596330274
743
+ name: Cosine Precision@5
744
+ - type: cosine_precision@10
745
+ value: 0.49449541284403675
746
+ name: Cosine Precision@10
747
+ - type: cosine_recall@1
748
+ value: 0.22506810922608916
749
+ name: Cosine Recall@1
750
+ - type: cosine_recall@3
751
+ value: 0.42528260057764133
752
+ name: Cosine Recall@3
753
+ - type: cosine_recall@5
754
+ value: 0.5414471931261917
755
+ name: Cosine Recall@5
756
+ - type: cosine_recall@10
757
+ value: 0.7115573861714545
758
+ name: Cosine Recall@10
759
+ - type: cosine_ndcg@10
760
+ value: 0.8042578105472734
761
+ name: Cosine Ndcg@10
762
+ - type: cosine_mrr@10
763
+ value: 0.9163608562691131
764
+ name: Cosine Mrr@10
765
+ - type: cosine_map@100
766
+ value: 0.7564244075096153
767
+ name: Cosine Map@100
768
+ ---
769
+
770
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
771
+
772
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
773
+
774
+ ## Model Details
775
+
776
+ ### Model Description
777
+ - **Model Type:** Sentence Transformer
778
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
779
+ - **Maximum Sequence Length:** 128 tokens
780
+ - **Output Dimensionality:** 384 dimensions
781
+ - **Similarity Function:** Cosine Similarity
782
+ <!-- - **Training Dataset:** Unknown -->
783
+ <!-- - **Language:** Unknown -->
784
+ <!-- - **License:** Unknown -->
785
+
786
+ ### Model Sources
787
+
788
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
789
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
790
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
791
+
792
+ ### Full Model Architecture
793
+
794
+ ```
795
+ SentenceTransformer(
796
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'BertModel'})
797
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
798
+ )
799
+ ```
800
+
801
+ ## Usage
802
+
803
+ ### Direct Usage (Sentence Transformers)
804
+
805
+ First install the Sentence Transformers library:
806
+
807
+ ```bash
808
+ pip install -U sentence-transformers
809
+ ```
810
+
811
+ Then you can load this model and run inference.
812
+ ```python
813
+ from sentence_transformers import SentenceTransformer
814
+
815
+ # Download from the 🤗 Hub
816
+ model = SentenceTransformer("ntAnh-dev/paraphrase-multilingual-MiniLM-L12-v2")
817
+ # Run inference
818
+ sentences = [
819
+ 'Khi tham gia chương trình sinh hoạt công dân do trường ,viện tổ chức thì đạt bao nhiêu điểm rèn luyện?',
820
+ 'KHUNG ĐÁNH GIÁ KẾT QUẢ RÈN LUYỆN SINH VIÊN 2022-2023\nTiêu chí điểm cộng (Tối đa 100 điểm)\nĐiểm học tập (Tối đa 30 điểm)\nKết quả học tập có điểm trung bình học kỳ (tối đa 24 điểm):\nCó kết quả học tập ở mức GPA ≥ 3.6; minh chứng: dựa trên hệ thống quản lý; điểm: 20\nCó kết quả học tập ở mức: 3.2 ≤ GPA < 3.6; minh chứng: dựa trên hệ thống quản lý; điểm: 18\nCó kết quả học tập ở mức: 2.5 ≤ GPA < 3.2; minh chứng: dựa trên hệ thống quản lý; điểm: 16\nCó kết quả học tập ở mức: 2.0 ≤ GPA < 2.5;; minh chứng: dựa trên hệ thống quản lý; điểm: 14\nCó kết quả học tập ở mức: 1.5 ≤ GPA < 2.0;; minh chứng: dựa trên hệ thống quản lý; điểm: 12\nCó nỗ lực trong học tập (GPA kỳ đánh giá cao hơn kỳ trước, giảm mức cảnh\ncáo học tập, hoặc duy trì điểm GPA trên 3.6 ); minh chứng: dựa trên hệ thống quản lý; điểm: 8\nTrình độ ngoại ngữ (tối đa 6 điểm):\nĐạt trình độ ngoại ngữ theo tiến độ của chương trình đào tạo; minh chứng: dựa trên hệ thống quản lý; điểm: 4\nĐạt chứng chỉ ngoại ngữ tương đương TOEIC 600 điểm trở lên; minh chứng: được cấp khi tham gia hoạt động; điểm: 2\nTham gia các hoạt động học thuật (tối đa 9 điểm):\nTham gia hoạt động, sự kiệnliên quan đến NCKH, học thuật, chuyên môn; minh chứng: được cấp khi tham gia hoạt động; điểm: 3\nTham gia khóa đào tạo kỹ năng nghề nghiệp, kỹ năng bổ trợ chuyên môn; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nThành viên CLB học thuật, Lab nghiên cứu, Nhóm nghiên cứu, nhóm Khởi\nnghiệp; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nTham gia công bố khoa học tại Hội nghị hoặc tạp chí khoa học chuyên\nngành; minh chứng: được cấp khi tham gia hoạt động; điểm: 6\nTham gia các cuộc thi Olympic cấp trường, cấp quốc gia, quốc tế; minh chứng: được cấp khi tham gia hoạt động; điểm: 6',
821
+ 'Quy định quản lý, hỗ trợ sinh viên nước ngoài học tập tại Đại học Bách khoa Hà Nội\nChương III TRÁCH NHIỆM CỦA CÁC ĐƠN VỊ LIÊN QUAN\nĐiều 11. Phòng/Ban chức năng Hợp tác đối ngoại\n1. Hoàn thành hồ sơ quản lý LHS học tích lũy tín chỉ như quy định tại khoản 1,\nĐiều 2 và bàn giao cho Phòng/ Ban chức năng Công tác sinh viên quản lý.\n2. Lập và quản lý hồ sơ LHS trao đổi như quy định tại khoản 2, Điều 2.\n3. Chủ trì, phối hợp với các đơn vị liên quan trong ĐHBK Hà Nội cung cấp\nthông tin, giải quyết các vấn đề liên quan trong và sau quá trình thực hiện các hoạt\nđộng trao đổi tới LHS .\n4. Tổ chức và hỗ trợ các đơn vị liên quan tổ chức các chương trình giao lưu, trao\nđổi văn hóa cho LHS ; thủ tục cấp, gia hạn, sửa đổi thị thực nhập cảnh phục vụ cho\nviệc học tập của LHS.\n5. Tổng hợp báo cáo lãnh đạo ĐHBK Hà Nội và các cơ quan chức năng định kỳ\nvà đột xuất theo yêu cầu.\nĐiều 12. Đơn vị chức năng Hỗ trợ trao đổi học thuật\nPhối hợp với các đơn vị liên quan trong và ngoài ĐHBK Hà Nội tổ chức các\nchương trình giao lưu, trao đổi văn hóa cho LHS.\n',
822
+ ]
823
+ embeddings = model.encode(sentences)
824
+ print(embeddings.shape)
825
+ # [3, 384]
826
+
827
+ # Get the similarity scores for the embeddings
828
+ similarities = model.similarity(embeddings, embeddings)
829
+ print(similarities)
830
+ # tensor([[1.0000, 0.7406, 0.2134],
831
+ # [0.7406, 1.0000, 0.0214],
832
+ # [0.2134, 0.0214, 1.0000]])
833
+ ```
834
+
835
+ <!--
836
+ ### Direct Usage (Transformers)
837
+
838
+ <details><summary>Click to see the direct usage in Transformers</summary>
839
+
840
+ </details>
841
+ -->
842
+
843
+ <!--
844
+ ### Downstream Usage (Sentence Transformers)
845
+
846
+ You can finetune this model on your own dataset.
847
+
848
+ <details><summary>Click to expand</summary>
849
+
850
+ </details>
851
+ -->
852
+
853
+ <!--
854
+ ### Out-of-Scope Use
855
+
856
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
857
+ -->
858
+
859
+ ## Evaluation
860
+
861
+ ### Metrics
862
+
863
+ #### Information Retrieval
864
+
865
+ * Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
866
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
867
+
868
+ | Metric | Value |
869
+ |:--------------------|:-----------|
870
+ | cosine_accuracy@1 | 0.8243 |
871
+ | cosine_accuracy@3 | 0.9189 |
872
+ | cosine_accuracy@5 | 0.973 |
873
+ | cosine_accuracy@10 | 0.9865 |
874
+ | cosine_precision@1 | 0.8243 |
875
+ | cosine_precision@3 | 0.6937 |
876
+ | cosine_precision@5 | 0.6216 |
877
+ | cosine_precision@10 | 0.4865 |
878
+ | cosine_recall@1 | 0.2536 |
879
+ | cosine_recall@3 | 0.4425 |
880
+ | cosine_recall@5 | 0.584 |
881
+ | cosine_recall@10 | 0.7623 |
882
+ | **cosine_ndcg@10** | **0.8175** |
883
+ | cosine_mrr@10 | 0.8801 |
884
+ | cosine_map@100 | 0.76 |
885
+
886
+ #### Information Retrieval
887
+
888
+ * Dataset: `paraphrase-multilingual-MiniLM-L12-v2-251218`
889
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
890
+
891
+ | Metric | Value |
892
+ |:--------------------|:-----------|
893
+ | cosine_accuracy@1 | 0.8899 |
894
+ | cosine_accuracy@3 | 0.9358 |
895
+ | cosine_accuracy@5 | 0.9541 |
896
+ | cosine_accuracy@10 | 0.9725 |
897
+ | cosine_precision@1 | 0.8899 |
898
+ | cosine_precision@3 | 0.7431 |
899
+ | cosine_precision@5 | 0.6459 |
900
+ | cosine_precision@10 | 0.4945 |
901
+ | cosine_recall@1 | 0.2251 |
902
+ | cosine_recall@3 | 0.4253 |
903
+ | cosine_recall@5 | 0.5414 |
904
+ | cosine_recall@10 | 0.7116 |
905
+ | **cosine_ndcg@10** | **0.8043** |
906
+ | cosine_mrr@10 | 0.9164 |
907
+ | cosine_map@100 | 0.7564 |
908
+
909
+ <!--
910
+ ## Bias, Risks and Limitations
911
+
912
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
913
+ -->
914
+
915
+ <!--
916
+ ### Recommendations
917
+
918
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
919
+ -->
920
+
921
+ ## Training Details
922
+
923
+ ### Training Dataset
924
+
925
+ #### Unnamed Dataset
926
+
927
+ * Size: 4,485 training samples
928
+ * Columns: <code>anchor</code> and <code>positive</code>
929
+ * Approximate statistics based on the first 1000 samples:
930
+ | | anchor | positive |
931
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
932
+ | type | string | string |
933
+ | details | <ul><li>min: 11 tokens</li><li>mean: 22.66 tokens</li><li>max: 46 tokens</li></ul> | <ul><li>min: 128 tokens</li><li>mean: 128.0 tokens</li><li>max: 128 tokens</li></ul> |
934
+ * Samples:
935
+ | anchor | positive |
936
+ |:-------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
937
+ | <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 2. Các quy định chung<br>2. Học bổng KKHT nhằm khuyến khích sinh viên nâng cao thành tích học tập và<br>rèn luyện tại ĐHBK Hà Nội.<br>3. Quỹ học bổng KKHT hình thành từ nguồn học phí và bằng 8% (tám phần<br>trăm) học phí của học kỳ lấy điểm xét cấp học bổng.<br>4. Học bổng KKHT có 3 mức:<br>a) Học bổng loại khá (loại C): Bằng tổng học phí của tất cả các học phần tính<br>điểm trung bình học kỳ (GPA).<br>b) Học bổng loại giỏi (loại B): Bằng 1,2 lần mức học bổng loại khá.<br>c) Học bổng loại xuất sắc (loại A): Bằng 1,5 lần mức học bổng loại khá.<br>Điều 3. Tiêu chuẩn xét cấp học bổng<br>1. Học bổng loại C: GPA ≥ 2,5 và điểm rèn luyện học kỳ ≥ 65 điểm.<br>2. Học bổng loại B: GPA ≥ 3,2 và điểm rèn luyện học kỳ ≥ 80 điểm.<br>3. Học bổng loại A: GPA ≥ 3,6 và điểm rèn luyện học kỳ ≥ 90 điểm.<br>Điều 4. Nguyên tắc xét cấp học bổng<br>1. Sử dụng kết quả học tập và rèn luyện của học kỳ liền trước để xét cấp học<br>bổng cho học kỳ sau.<br>2. Học bổng được xét theo ...</code> |
938
+ | <code>Tại trường có bao nhiêu loại học bổng KKHT(khuyến khích học tập)?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng<br>1. Văn bản này quy định về nguyên tắc, tiêu chuẩn xét duyệt và cấp học bổng cho<br>sinh viên đại học hình thức đào tạo chính quy tại Đại học Bách khoa Hà Nội (sau đây<br>viết tắt là ĐHBK Hà N ội), căn cứ các quy định liên quan tại Nghị định số<br>84/2020/NĐ-CP ngày 17/7/2020 của Chính phủ và Quy chế Quản lý tài chính của Đại<br>học Bách khoa Hà Nội được ban hành theo Nghị quyết số 20/NQ-ĐHBK ngày<br>16/3/2023 của Hội đồng Đại học, Đại học Bách khoa Hà Nội.<br>2. Quy định này áp dụng đối với sinh viên đại học hình thức đào tạo chính quy<br>văn bằng thứ nhất của ĐHBK Hà Nội.<br>Điều 2. Các quy định chung<br>1. Học bổng khuyến khích học tập (KKHT) cấp cho các sinh viên được lựa chọn<br>bởi Hội đồng xét cấp học bổng ĐHBK Hà Nội theo từng học kỳ chính của năm học ,<br>căn cứ vào thành tích học tập và rèn luyện của sinh viên trong học kỳ chính liền trước<br>đó.<br></code> |
939
+ | <code>trường gồm mấy loại học bổng khuyến khích học tập ?</code> | <code>Quy định xét cấp học bổng khuyến khích học tập tại Đại học Bách khoa Hà Nội<br>Điều 4. Nguyên tắc xét cấp học bổng<br>3. Không xét cấp học bổng đối với sinh viên thuộc một trong các trường hợp sau:<br>a) Chịu hình thức kỷ luật từ mức khiển trách trở lên tại thời điểm xét học bổng;<br>b) Đăng ký học ít hơn 1 5 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ lấy điểm xét, cấp học bổng, ngoại trừ học kỳ 1 năm học thứ nhất;<br>c) Đăng ký học ít hơn 6 tín chỉ (kể cả các học phần không tính điểm GPA) tại<br>học kỳ cấp học bổng;<br>d) Học quá thời gian theo kế hoạch học tập chuẩn của chương trình đào tạo;<br>đ) Học chương trình đào tạo do trường đối tác nước ngoài cấp một văn bằng tốt<br>nghiệp duy nhất;<br>Điều 5. Thời gian công bố kết quả xét duyệt và cấp học bổng<br>1. Danh sách sinh viên được cấp học bổng và mức đ iểm chuẩn để đạt học bổng<br>loại A, B, C theo khóa, ngành đào tạo tương ứng sẽ được công bố trên cổng thông tin<br>sinh viên: ctt.hust.edu.vn, chậm nhất vào tuần học thứ 10 của học kỳ cấp học bổng.<br></code> |
940
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
941
+ ```json
942
+ {
943
+ "scale": 20.0,
944
+ "similarity_fct": "cos_sim",
945
+ "gather_across_devices": false
946
+ }
947
+ ```
948
+
949
+ ### Training Hyperparameters
950
+ #### Non-Default Hyperparameters
951
+
952
+ - `eval_strategy`: steps
953
+ - `per_device_train_batch_size`: 16
954
+ - `per_device_eval_batch_size`: 16
955
+ - `learning_rate`: 2e-05
956
+ - `num_train_epochs`: 20
957
+ - `warmup_ratio`: 0.1
958
+ - `fp16`: True
959
+ - `batch_sampler`: no_duplicates
960
+
961
+ #### All Hyperparameters
962
+ <details><summary>Click to expand</summary>
963
+
964
+ - `overwrite_output_dir`: False
965
+ - `do_predict`: False
966
+ - `eval_strategy`: steps
967
+ - `prediction_loss_only`: True
968
+ - `per_device_train_batch_size`: 16
969
+ - `per_device_eval_batch_size`: 16
970
+ - `per_gpu_train_batch_size`: None
971
+ - `per_gpu_eval_batch_size`: None
972
+ - `gradient_accumulation_steps`: 1
973
+ - `eval_accumulation_steps`: None
974
+ - `torch_empty_cache_steps`: None
975
+ - `learning_rate`: 2e-05
976
+ - `weight_decay`: 0.0
977
+ - `adam_beta1`: 0.9
978
+ - `adam_beta2`: 0.999
979
+ - `adam_epsilon`: 1e-08
980
+ - `max_grad_norm`: 1.0
981
+ - `num_train_epochs`: 20
982
+ - `max_steps`: -1
983
+ - `lr_scheduler_type`: linear
984
+ - `lr_scheduler_kwargs`: {}
985
+ - `warmup_ratio`: 0.1
986
+ - `warmup_steps`: 0
987
+ - `log_level`: passive
988
+ - `log_level_replica`: warning
989
+ - `log_on_each_node`: True
990
+ - `logging_nan_inf_filter`: True
991
+ - `save_safetensors`: True
992
+ - `save_on_each_node`: False
993
+ - `save_only_model`: False
994
+ - `restore_callback_states_from_checkpoint`: False
995
+ - `no_cuda`: False
996
+ - `use_cpu`: False
997
+ - `use_mps_device`: False
998
+ - `seed`: 42
999
+ - `data_seed`: None
1000
+ - `jit_mode_eval`: False
1001
+ - `bf16`: False
1002
+ - `fp16`: True
1003
+ - `fp16_opt_level`: O1
1004
+ - `half_precision_backend`: auto
1005
+ - `bf16_full_eval`: False
1006
+ - `fp16_full_eval`: False
1007
+ - `tf32`: None
1008
+ - `local_rank`: 0
1009
+ - `ddp_backend`: None
1010
+ - `tpu_num_cores`: None
1011
+ - `tpu_metrics_debug`: False
1012
+ - `debug`: []
1013
+ - `dataloader_drop_last`: False
1014
+ - `dataloader_num_workers`: 0
1015
+ - `dataloader_prefetch_factor`: None
1016
+ - `past_index`: -1
1017
+ - `disable_tqdm`: False
1018
+ - `remove_unused_columns`: True
1019
+ - `label_names`: None
1020
+ - `load_best_model_at_end`: False
1021
+ - `ignore_data_skip`: False
1022
+ - `fsdp`: []
1023
+ - `fsdp_min_num_params`: 0
1024
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
1025
+ - `fsdp_transformer_layer_cls_to_wrap`: None
1026
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
1027
+ - `parallelism_config`: None
1028
+ - `deepspeed`: None
1029
+ - `label_smoothing_factor`: 0.0
1030
+ - `optim`: adamw_torch_fused
1031
+ - `optim_args`: None
1032
+ - `adafactor`: False
1033
+ - `group_by_length`: False
1034
+ - `length_column_name`: length
1035
+ - `project`: huggingface
1036
+ - `trackio_space_id`: trackio
1037
+ - `ddp_find_unused_parameters`: None
1038
+ - `ddp_bucket_cap_mb`: None
1039
+ - `ddp_broadcast_buffers`: False
1040
+ - `dataloader_pin_memory`: True
1041
+ - `dataloader_persistent_workers`: False
1042
+ - `skip_memory_metrics`: True
1043
+ - `use_legacy_prediction_loop`: False
1044
+ - `push_to_hub`: False
1045
+ - `resume_from_checkpoint`: None
1046
+ - `hub_model_id`: None
1047
+ - `hub_strategy`: every_save
1048
+ - `hub_private_repo`: None
1049
+ - `hub_always_push`: False
1050
+ - `hub_revision`: None
1051
+ - `gradient_checkpointing`: False
1052
+ - `gradient_checkpointing_kwargs`: None
1053
+ - `include_inputs_for_metrics`: False
1054
+ - `include_for_metrics`: []
1055
+ - `eval_do_concat_batches`: True
1056
+ - `fp16_backend`: auto
1057
+ - `push_to_hub_model_id`: None
1058
+ - `push_to_hub_organization`: None
1059
+ - `mp_parameters`:
1060
+ - `auto_find_batch_size`: False
1061
+ - `full_determinism`: False
1062
+ - `torchdynamo`: None
1063
+ - `ray_scope`: last
1064
+ - `ddp_timeout`: 1800
1065
+ - `torch_compile`: False
1066
+ - `torch_compile_backend`: None
1067
+ - `torch_compile_mode`: None
1068
+ - `include_tokens_per_second`: False
1069
+ - `include_num_input_tokens_seen`: no
1070
+ - `neftune_noise_alpha`: None
1071
+ - `optim_target_modules`: None
1072
+ - `batch_eval_metrics`: False
1073
+ - `eval_on_start`: False
1074
+ - `use_liger_kernel`: False
1075
+ - `liger_kernel_config`: None
1076
+ - `eval_use_gather_object`: False
1077
+ - `average_tokens_across_devices`: True
1078
+ - `prompts`: None
1079
+ - `batch_sampler`: no_duplicates
1080
+ - `multi_dataset_batch_sampler`: proportional
1081
+ - `router_mapping`: {}
1082
+ - `learning_rate_mapping`: {}
1083
+
1084
+ </details>
1085
+
1086
+ ### Training Logs
1087
+ | Epoch | Step | Training Loss | paraphrase-multilingual-MiniLM-L12-v2-251218_cosine_ndcg@10 |
1088
+ |:-------:|:----:|:-------------:|:-----------------------------------------------------------:|
1089
+ | -1 | -1 | - | 0.5888 |
1090
+ | 0.3559 | 100 | 1.925 | 0.6625 |
1091
+ | 0.7117 | 200 | 1.4605 | 0.7110 |
1092
+ | 1.0676 | 300 | 1.2876 | 0.7686 |
1093
+ | 1.4235 | 400 | 1.1927 | 0.7686 |
1094
+ | 1.7794 | 500 | 1.1368 | 0.7893 |
1095
+ | 2.1352 | 600 | 1.071 | 0.7679 |
1096
+ | 2.4911 | 700 | 1.0243 | 0.7707 |
1097
+ | 2.8470 | 800 | 1.0508 | 0.8115 |
1098
+ | 3.2028 | 900 | 0.9448 | 0.7878 |
1099
+ | 3.5587 | 1000 | 0.94 | 0.8023 |
1100
+ | 3.9146 | 1100 | 0.9675 | 0.7720 |
1101
+ | 4.2705 | 1200 | 0.9115 | 0.7966 |
1102
+ | 4.6263 | 1300 | 0.9163 | 0.7736 |
1103
+ | 4.9822 | 1400 | 0.9329 | 0.8026 |
1104
+ | 5.3381 | 1500 | 0.8309 | 0.8353 |
1105
+ | 5.6940 | 1600 | 0.881 | 0.7829 |
1106
+ | 6.0498 | 1700 | 0.8884 | 0.7911 |
1107
+ | 6.4057 | 1800 | 0.8497 | 0.7651 |
1108
+ | 6.7616 | 1900 | 0.8296 | 0.7948 |
1109
+ | 7.1174 | 2000 | 0.861 | 0.8055 |
1110
+ | 7.4733 | 2100 | 0.7921 | 0.7637 |
1111
+ | 7.8292 | 2200 | 0.8836 | 0.7924 |
1112
+ | 8.1851 | 2300 | 0.8131 | 0.7708 |
1113
+ | 8.5409 | 2400 | 0.787 | 0.7963 |
1114
+ | 8.8968 | 2500 | 0.8267 | 0.7975 |
1115
+ | 9.2527 | 2600 | 0.7634 | 0.8076 |
1116
+ | 9.6085 | 2700 | 0.7568 | 0.8160 |
1117
+ | 9.9644 | 2800 | 0.8086 | 0.8168 |
1118
+ | 10.3203 | 2900 | 0.7768 | 0.8118 |
1119
+ | 10.6762 | 3000 | 0.7877 | 0.7986 |
1120
+ | 11.0320 | 3100 | 0.7883 | 0.8038 |
1121
+ | 11.3879 | 3200 | 0.7316 | 0.8206 |
1122
+ | 11.7438 | 3300 | 0.7812 | 0.8090 |
1123
+ | 12.0996 | 3400 | 0.7441 | 0.8181 |
1124
+ | 12.4555 | 3500 | 0.8073 | 0.8135 |
1125
+ | 12.8114 | 3600 | 0.7424 | 0.8177 |
1126
+ | 13.1673 | 3700 | 0.7188 | 0.8132 |
1127
+ | 13.5231 | 3800 | 0.7206 | 0.8207 |
1128
+ | 13.8790 | 3900 | 0.7316 | 0.8050 |
1129
+ | 14.2349 | 4000 | 0.7378 | 0.8158 |
1130
+ | 14.5907 | 4100 | 0.7391 | 0.8098 |
1131
+ | 14.9466 | 4200 | 0.6781 | 0.7936 |
1132
+ | 15.3025 | 4300 | 0.6939 | 0.8076 |
1133
+ | 15.6584 | 4400 | 0.6879 | 0.8137 |
1134
+ | 16.0142 | 4500 | 0.7265 | 0.8146 |
1135
+ | 16.3701 | 4600 | 0.6854 | 0.8184 |
1136
+ | 16.7260 | 4700 | 0.7273 | 0.8145 |
1137
+ | 17.0819 | 4800 | 0.6828 | 0.8179 |
1138
+ | 17.4377 | 4900 | 0.6444 | 0.8204 |
1139
+ | 17.7936 | 5000 | 0.6865 | 0.8180 |
1140
+ | 18.1495 | 5100 | 0.6517 | 0.8039 |
1141
+ | 18.5053 | 5200 | 0.6502 | 0.8220 |
1142
+ | 18.8612 | 5300 | 0.6719 | 0.8114 |
1143
+ | 19.2171 | 5400 | 0.6409 | 0.8127 |
1144
+ | 19.5730 | 5500 | 0.6966 | 0.8119 |
1145
+ | 19.9288 | 5600 | 0.6707 | 0.8175 |
1146
+ | -1 | -1 | - | 0.8043 |
1147
+
1148
+
1149
+ ### Framework Versions
1150
+ - Python: 3.12.12
1151
+ - Sentence Transformers: 5.1.2
1152
+ - Transformers: 4.57.3
1153
+ - PyTorch: 2.9.0+cu126
1154
+ - Accelerate: 1.12.0
1155
+ - Datasets: 4.0.0
1156
+ - Tokenizers: 0.22.1
1157
+
1158
+ ## Citation
1159
+
1160
+ ### BibTeX
1161
+
1162
+ #### Sentence Transformers
1163
+ ```bibtex
1164
+ @inproceedings{reimers-2019-sentence-bert,
1165
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1166
+ author = "Reimers, Nils and Gurevych, Iryna",
1167
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1168
+ month = "11",
1169
+ year = "2019",
1170
+ publisher = "Association for Computational Linguistics",
1171
+ url = "https://arxiv.org/abs/1908.10084",
1172
+ }
1173
+ ```
1174
+
1175
+ #### MultipleNegativesRankingLoss
1176
+ ```bibtex
1177
+ @misc{henderson2017efficient,
1178
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1179
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1180
+ year={2017},
1181
+ eprint={1705.00652},
1182
+ archivePrefix={arXiv},
1183
+ primaryClass={cs.CL}
1184
+ }
1185
+ ```
1186
+
1187
+ <!--
1188
+ ## Glossary
1189
+
1190
+ *Clearly define terms in order to be accessible across audiences.*
1191
+ -->
1192
+
1193
+ <!--
1194
+ ## Model Card Authors
1195
+
1196
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1197
+ -->
1198
+
1199
+ <!--
1200
+ ## Model Card Contact
1201
+
1202
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1203
+ -->
config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "dtype": "float32",
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "transformers_version": "4.57.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 250037
25
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "5.2.0",
4
+ "transformers": "4.57.3",
5
+ "pytorch": "2.9.0+cu126"
6
+ },
7
+ "model_type": "SentenceTransformer",
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6eb7048f16db0159a33417f3062762a999d9c90b54f677dc38882d6aecca9ffb
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "extra_special_tokens": {},
50
+ "mask_token": "<mask>",
51
+ "max_length": 128,
52
+ "model_max_length": 128,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "<pad>",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "</s>",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "<unk>"
65
+ }
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260