ilivieris commited on
Commit
5ed4641
·
verified ·
1 Parent(s): d617579

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,956 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - gr
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - dense
10
+ - generated_from_trainer
11
+ - dataset_size:6165829
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: intfloat/multilingual-e5-base
14
+ widget:
15
+ - source_sentence: Ποιες είναι οι προϋποθέσεις για την πρώτη κυκλοφορία οχημάτων σύμφωνα
16
+ με το παρόν διάταγμα;
17
+ sentences:
18
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 253
19
+
20
+ Έτος: 1996
21
+
22
+ Προσαρμογή της Εθνικής νομοθεσίας προς τις διατάξεις της Οδηγίας 93/92/ΕΟΚ του
23
+ Συμβουλίου των Ευρωπαϊκών Κοινοτήτων της 29ης Οκτωβρίου 1993 «σχετικά με την τοποθέτηση
24
+ διατάξεων φωτισμού και φωτεινής σηματοδότησης στα δίκυκλα ή τρίκυκλα οχήματα με
25
+ κινητήρα».
26
+
27
+ Άρθρο 5
28
+
29
+ Μετά την 1 η Μαΐου 1995 οι αρμόδιες Ελληνικές Αρχές δεν μπορούν να απαγορεύσουν,
30
+ για λόγους που αφορούν την τοποθέτηση διατάξεων φωτισμού και φωτεινής σηματοδότησης,
31
+ την πρώτη κυκλοφορία οχημάτων συμφώνων προς το παρόν διάταγμα.'
32
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 4734
33
+
34
+ Έτος: 2020
35
+
36
+ Τροποποίηση του ν. 4557/2018 (Α’ 139) για την πρόληψη και καταστολή της νομιμοποίησης
37
+ εσόδων από εγκληματικές δραστηριότητες και της χρηματοδότησης της τρομοκρατίας
38
+ -Ενσωμάτωση στην ελληνική νομοθεσία της Οδηγίας (ΕΕ) 2018/843 (L 156) και του
39
+ άρθρου 3 της Οδηγίας (ΕΕ) 2019/2177 (L 334) και λοιπές διατάξεις.
40
+
41
+ Άρθρο 14
42
+
43
+ Τίτλος άρθρου: Πολιτικώς εκτεθειμένα πρόσωπα - Τροποποίηση του άρθρου 18 του ν.
44
+ 4557/2018 (παρ. 13 του άρθρου 1 της Οδηγίας (ΕΕ) 2018/843)
45
+
46
+ Στο άρθρο 18 του ν. 4557/2018 (Α’ 139) προστίθενται παρ. 4 και 5 και το άρθρο
47
+ 18 διαμορφώνεται ως εξής:
48
+
49
+ «Άρθρο 18
50
+
51
+ Πολιτικώς εκτεθειμένα πρόσωπα
52
+
53
+ (άρθρα 20, 21, 22 και 23 της Οδηγίας 2015/849)
54
+
55
+ 1. Όσον αφορά στις συναλλαγές ή επιχειρηματικές σχέσεις με πολιτικώς εκτεθειμένα
56
+ πρόσωπα, στενούς συγγενείς και στενούς συνεργάτες τους, τα υπόχρεα πρόσωπα οφείλουν,
57
+ πλέον των μέτρων δέουσας επιμέλειας του άρθρου 13, να:
58
+
59
+ α) διαθέτουν κατάλληλα συστήματα διαχείρισης κινδύνου και να εφαρμόζουν διαδικασίες
60
+ ανάλογες με τον βαθμό κινδύνου, για να διαπιστώνουν αν ο πελάτης ή ο πραγματικός
61
+ δικαιούχος ανήκουν στις ανωτέρω κατηγορίες προσώπων,
62
+
63
+ β) λαμβάνουν την έγκριση ανώτερου διοικητικού στελέχους για τη σύναψη ή διατήρηση
64
+ επιχειρηματικών σχέσεων με τους πελάτες αυτούς,
65
+
66
+ γ) λαμβάνουν επαρκή μέτρα για να διαπιστώνουν την πηγή του πλούτου και την προέλευση
67
+ των κεφαλαίων, τα οποία αφορά η επιχειρηματική σχέση ή συναλλαγή,
68
+
69
+ δ) διενεργούν στενότερη και συνεχή παρακολούθηση των εν λόγω επιχειρηματικών σχέσεων.
70
+
71
+ 2. Τα υπόχρεα πρόσωπα λαμβάνουν εύλογα μέτρα, για να διαπιστώνουν κατά πόσον οι
72
+ δικαιούχοι ασφαλίσματος ασφαλιστηρίου συμβολαίου ζωής ή, ενδεχομένως, ο πραγματικός
73
+ δικαιούχος αυτού είναι πολιτικώς εκτεθειμένο πρόσωπο, στενός συγγενής του ή στενός
74
+ συνεργάτης του. Τα μέτρα αυτά λαμβάνονται το αργότερο κατά τον χρόνο πληρωμής
75
+ του ασφαλίσματος ή εκχώρησης, εν όλω ή εν μέρει, του ασφαλιστήριου συμβολαίου.
76
+ Όταν εντοπίζεται υψηλότερος κίνδυνος, τα υπόχρεα πρόσωπα οφείλουν, πλέον της εφαρμογής
77
+ των μέτρων δέουσας επιμέλειας του άρθρου 13, να:
78
+
79
+ α) ενημερώνου'
80
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 5020
81
+
82
+ Έτος: 2023
83
+
84
+ Κώδικας Ιδιωτικού Ναυτικού Δικαίου και άλλες επείγουσες διατάξεις του Υπουργείου
85
+ Ναυτιλίας και Νησιωτικής Πολιτικής.
86
+
87
+ Άρθρο 38
88
+
89
+ Τίτλος άρθρου: Διατήρηση υποθήκης
90
+
91
+ 1. Απλή ή προτιμώμενη υποθήκη που έχει καταχωρισθεί σε δημόσιο βιβλίο σύμφωνα
92
+ με το δίκαιο της προηγούμενης σημαίας του πλοίου, εξακολουθεί να διατηρεί την
93
+ ισχύ της κατά τον χρόνο κτήσης της ελληνικής εθνικότητας, εφόσον εγγραφεί στο
94
+ ελληνικό υποθηκολόγιο εντός εξήντα (60) ημερών από τη νηολόγηση.
95
+
96
+ 2. Η κατά τα ως άνω εγγραφή της υποθήκης διασφαλίζει την τάξη που είχε κατά τον
97
+ χρόνο εγγραφής στο προηγούμενο νηολόγιο.'
98
+ - source_sentence: Ποιες είναι οι διαδικασίες επιλογής στελεχών της δημόσιας εκπαίδευσης
99
+ σύμφωνα με το Νόμο υπ' αριθμ. 3467 του 2006;
100
+ sentences:
101
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 123
102
+
103
+ Έτος: 2017
104
+
105
+ Οργανισμός του Υπουργείου Υποδομών και Μεταφορών.
106
+
107
+ Άρθρο 10
108
+
109
+ Τίτλος άρθρου: ΑΥΤΟΤΕΛΕΙΣ ΥΠΗΡΕΣΙΕΣ
110
+
111
+ 1. Στον Υπουργό Υποδομών και Μεταφορών υπάγονται σύμφωνα με τις σχετικές κείμενες
112
+ διατάξεις οι κατωτέρω Αυτοτελείς Υπηρεσίες:
113
+
114
+ α. Υπηρεσία Πολιτικής Αεροπορίας (ΥΠΑ).
115
+
116
+ β. Υπηρεσία Οδικών Τελών.'
117
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 4278
118
+
119
+ Έτος: 2014
120
+
121
+ Φάροι, Στρατολογία και άλλες διατάξεις.
122
+
123
+ Άρθρο 27
124
+
125
+ Τίτλος άρθρου: Εξαγορά –Άρση Πρόσθετων Στρατιωτικών Υποχρεώσεων
126
+
127
+ Η περίπτωση γ΄ της παρ. 5 του άρθρου 43 του ν. 3421/2005 αντικαθίσταται ως εξής:
128
+
129
+ «γ. Η Διοίκηση Στρατολογικών Υπηρεσιών αποφασίζει οριστικά και αιτιολογημένα για
130
+ την αποδοχή ή την απόρριψη της αίτησης, κοινοποιώντας την απόφασή της στη μονάδα
131
+ του ενδιαφερομένου για την ενημέρωση των ατομικών του εγγράφων και του ίδιου,
132
+ καθώς και στην αρμόδια Στρατολογική Υπηρεσία. Η αλληλογραφία τηρείται στο αρχείο
133
+ της Διοίκησης Στρατολογικών Υπηρεσιών.».'
134
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 3467
135
+
136
+ Έτος: 2006
137
+
138
+ Επιλογή στελεχών πρωτοβάθμιας και δευτεροβάθμιας εκπαίδευσης, ρύθμιση θεμάτων
139
+ διοίκησης και εκπαίδευσης και άλλες διατάξεις.
140
+
141
+ Άρθρο 1
142
+
143
+ Τίτλος άρθρου: Πίνακες Πίνακες επιλογής στελεχών Δημόσιας Εκπαίδευσης
144
+
145
+ 1. Η επιλογή και τοποθέτηση των στελεχών της δημόσιας εκπαίδευσης στις κενές θέσεις
146
+ γίνεται για τετραετή θητεία και στις κενούμενες θέσεις για το υπόλοιπο της θητείας
147
+ αυτής.
148
+
149
+ 2. Για την πλήρωση των ανωτέρω θέσεων, καταρτίζονται σύμφωνα με τις διατάξεις
150
+ των επόμενων άρθρων οι παρακάτω αξιολογικοί πίνακες επιλογής, που ισχύουν για
151
+ τέσσερα έτη:
152
+
153
+ α) Σχολικών συμβούλων δημοτικής εκπαίδευσης
154
+
155
+ β) Σχολικών συμβούλων προσχολικής αγωγής
156
+
157
+ γ) Σχολικών συμβούλων ειδικής αγωγής
158
+
159
+ δ) Σχολικών συμβούλων δευτεροβάθμιας εκπαίδευσης κατά κλάδους και ειδικότητες
160
+
161
+ ε) Διευθυντών πρωτοβάθμιας εκπαίδευσης
162
+
163
+ στ) Διευθυντών δευτεροβάθμιας εκπαίδευσης
164
+
165
+ ζ) Προϊσταμένων γραφείων πρωτοβάθμιας εκπαίδευσης
166
+
167
+ η) Προϊσταμένων γραφείων δευτεροβάθμιας εκπαίδευσης
168
+
169
+ θ) Προϊσταμένων γραφείων φυσικής αγωγής
170
+
171
+ ι) Προϊσταμένων γραφείων τεχνικής επαγγελματικής εκπαίδευσης
172
+
173
+ ια) Διευθυντών δημοτικών σχολείων
174
+
175
+ ιβ) Διευθυντών γυμνασίων
176
+
177
+ ιγ) Διευθυντών ενιαίων λυκείων
178
+
179
+ ιδ) Διευθυντών τεχνικών επαγγελματικών εκπαιδευτηρίων
180
+
181
+ ιε) Διευθυντών σχολικών εργαστηριακών κέντρων (ΣΕΚ)
182
+
183
+ ιστ) Διευθυντών σχολικών μονάδων ειδικής αγωγής πρωτοβάθμιας εκπαίδευσης
184
+
185
+ ιζ) Διευθυντών γυμνασίων ειδικής αγωγής
186
+
187
+ ιη) Διευθυντών ενιαίων λυκείων ειδικής αγωγής
188
+
189
+ ιθ) Διευθυντών τεχνικών επαγγελματικών εκπαιδευτηρίων ειδικής αγωγής α΄ και β΄
190
+ βαθμίδας
191
+
192
+ κ) Διευθυντών πειραματικών δημοτικών σχολείων
193
+
194
+ κα) Διευθυντών πειραματικών γυμνασίων
195
+
196
+ κβ) Διευθυντών πειραματικών λυκείων
197
+
198
+ κγ) Διευθυντών μουσικών σχολείων (γυμνασίων- λυκείων)
199
+
200
+ κδ) Διευθυντών εργαστηρίων ειδικής επαγγελματικής εκπαίδευσης και κατάρτισης
201
+
202
+ κε) Διευθυντών πειραματικών δημοτικών σχολείων των πανεπιστημίων
203
+
204
+ κστ) Διευθυντών πειραματικών γυμνασίων των πανεπιστημίων
205
+
206
+ κζ) Διευθυντών πειραματικών λυκείων των πανεπιστημίων.'
207
+ - source_sentence: ακίνητο, αμοιβή εκτίμησης, αναγκαστική εκτέλεση, επισπεύδων
208
+ sentences:
209
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 208
210
+
211
+ Έτος: 1996
212
+
213
+ Καθιέρωση συστήματος μεταθέσεων υπαλλήλων της Γενικής Γραμματείας της Εθνικής
214
+ Στατιστικής Υπηρεσίας της Ελλάδος με αντικειμενικά κριτήρια.
215
+
216
+ Άρθρο 7
217
+
218
+ Τίτλος άρθρου: Πίνακας μεταθετέων υπαλλήλων
219
+
220
+ 1. Μέχρι την 31 η Ιανουαρίου κάθε έτους η Δ/νση Διοικ. Υποστήριξης καταρτίζει
221
+ πίνακες μεταθετέων που περιλαμβάνουν όλους τους υπαλλήλους κατά κλάδο και βαθμό
222
+ ή ειδικότητα που σύμφωνα με τις οργανικές διατάξεις μετατίθενται για την κάλυψη
223
+ των κενών οργανικών θέσεων. Για κάθε κλάδο καταρτίζονται οι ακόλουθοι πίνακες:
224
+
225
+ α) Προϊσταμένων Διευθύνσεων
226
+
227
+ β) Προϊσταμένων Τμημάτων
228
+
229
+ γ) Υπαλλήλων,
230
+
231
+ οι οποίοι περιέχουν για τον καθένα: το ονοματεπώνυμο, το όνομα πατρός ή συζύγου,
232
+ το έτος γέννησης, το συνολικό χρόνο υπηρεσίας, την Υπηρεσία στην οποία υπηρετεί
233
+ (ΚΥ ή ΥΣΝ) καθώς και τον αριθμό μορίων που συγκεντρώνει μέχρι 31 Δεκεμβρίου του
234
+ προηγούμενου έτους, αναλυτικά κατά κριτήριο και συνολικά, σύμφωνα με τις διατάξεις
235
+ του παρόντος Π Δ/τος.
236
+
237
+ 2. Η σειρά εγγραφής στον πίνακα μεταθετέων θα γίνεται ανάλογα με το συνολικό αριθμό
238
+ μορίων που συγκεντρώνει ο υπάλληλος, με βάση τα στοιχεία του προσωπικού του μητρώου
239
+ και τα λοιπά πιστοποιητικά που έχει υποβάλει. Στον πίνακα προηγούνται οι υπάλληλοι
240
+ που συγκεντρώνουν το μικρότερο αριθμό μορίων. Σε περίπτωση που περισσότεροι από
241
+ ένας υπάλληλοι συγκεντρώνουν τον ίδιο αριθμό μορίων, προτάσσεται ο υπάλληλος με
242
+ το μικρότερο βαθμό, και αν έχουν και τον ίδιο βαθμό, ο υπάλληλος με τα λιγότερα
243
+ χρόνια υπηρεσίας, και αν έχουν και τον ίδιο χρόνο υπηρεσίας, διενεργείται κλήρωση
244
+ από το οικείο Υπηρεσιακό Συμβούλιο.
245
+
246
+ Μετά την κλήρωση συντάσσεται πρακτικό, το οποίο αποτελεί αναπόσπαστο τμήμα του
247
+ οικείου πίνακα μεταθετέων.
248
+
249
+ 3. Η μη έγκαιρη υποβολή από τον υπάλληλο των δικαιολογητικών για τα στοιχεία που
250
+ επικαλείται έχει ως συνέπεια τα δικαιολογητικά αυτά να μη ληφθούν υπόψη στη διαδικασία
251
+ των μεταθέσεων του έτους αυτού, ενώ η σκόπιμη απόκρυψη στοιχείων ή η δήλωση ψευδών
252
+ στοιχείων συνεπάγεται και τις προβλεπόμενες πειθαρχικές και ποινικές κυρώσεις
253
+ για ψευδή υπεύθυνη δήλωση.
254
+
255
+ Οι'
256
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 59
257
+
258
+ Έτος: 2016
259
+
260
+ Τρόπος προσδιορισμού της εμπορικής αξίας του ακινήτου που κατάσχεται σύμφωνα με
261
+ τον Κώδικα Πολιτικής Δικονομίας και καθορισμός του αρμοδίου οργάνου προσδιορισμού
262
+ της αξίας.
263
+
264
+ Άρθρο 3
265
+
266
+ Τίτλος άρθρου: Καθορισμός αμοιβής εκτιμήσεως
267
+
268
+ Η αμοιβή για την διενέργεια της εκτιμήσεως καθορίζεται εκ των προτέρων ελεύθερα
269
+ μετά από έγγραφη συμφωνία για την ανάθεση του έργου. Υπόχρεος για την καταβολή
270
+ της αμοιβής είναι ο επισπεύδων την αναγκαστική εκτέλεση. Το ποσό αυτό βαρύνει,
271
+ τελικώς, εκείνον κατά του οποίου στρέφεται η εκτέλεση.'
272
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 4444
273
+
274
+ Έτος: 2016
275
+
276
+ Κύρωση του Κρατικού Προϋπολογισμού οικονομικού έτους 2017.
277
+
278
+ Άρθρο 1
279
+
280
+ Τίτλος άρθρου: Κυρώνεται ο Κρατικός Προϋπολογισμός έτους
281
+
282
+ 2017. Τα έσοδα και τα έξοδα του Κρατικού Προϋπολογισμού οικονομικού έτους 2017
283
+ ορίζονται στους επισυναπτόμενους πίνακες και κατανέμονται ως ακολούθως:'
284
+ - source_sentence: Πόσα χρόνια προϋπηρεσίας απαιτούνται για τους Υπαστυνόμους Α΄ σύμφωνα
285
+ με το άρθρο 4 του ΠΔ 24/1997;
286
+ sentences:
287
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 4662
288
+
289
+ Έτος: 2020
290
+
291
+ Εθνικός Μηχανισμός Διαχείρισης Κρίσεων και Αντιμετώπισης Κινδύνων, αναδιάρθρωση
292
+ της Γενικής Γραμματείας Πολιτικής Προστασίας, αναβάθμιση συστήματος εθελοντισμού
293
+ πολιτικής προστασίας, αναδιοργάνωση του Πυροσβεστικού και άλλες διατάξεις.
294
+
295
+ Άρθρο 27
296
+
297
+ Τίτλος άρθρου: Οργανωμένη προληπτική απομάκρυνση πολιτών
298
+
299
+ 1. Η οργανωμένη προληπτική απομάκρυνση πολιτών από μια περιοχή (ολική ή μερική)
300
+ αποτελεί προληπτικό μέτρο πολιτικής προστασίας και οργανώνεται για την προστασία
301
+ της ζωής και της υγείας των πολιτών, όταν τεκμηριωμένα μία περιοχή εκτιμάται ότι,
302
+ απειλείται από εξελισσόμενη ή επικείμενη καταστροφή και ο κίνδυνος λόγω της παραμονής
303
+ των πολιτών σε αυτή είναι σοβαρός.
304
+
305
+ 2. Η απόφαση για την οργανωμένη προληπτική απομάκρυνση πολιτών λαμβάνεται, σύμφωνα
306
+ με το άρθρο 29 και σύμφωνα με το κείμενο θεσμικό πλαίσιο, τις κατευθυντήριες οδηγίες,
307
+ εγκυκλίους και κανονιστικές πράξεις της διοίκησης αναφορικά με αυτή και το οποίο
308
+ παραμένει σε ισχύ και μετά τη δημοσίευση του παρόντος νόμου. Τυχόν ειδικότερα
309
+ ζ��τήματα, που δεν συμπεριλαμβάνονται στα ανωτέρω, ρυθμίζονται με κοινή απόφαση
310
+ του Υπουργού Προστασίας του Πολίτη και των εκάστοτε συναρμόδιων Υπουργών, μετά
311
+ από εισήγηση του Γενικού Γραμματέα Πολιτικής Προστασίας.
312
+
313
+ ΚΕΦΑΛΑΙΟ Δ΄
314
+
315
+ ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΠΟΛΙΤΙΚΗΣ ΠΡΟΣΤΑΣΙΑΣ
316
+
317
+ ΤΜΗΜΑ Α΄
318
+
319
+ ΑΠΟΣΤΟΛΗ - ΑΡΜΟΔΙΟΤΗΤΕΣ ΓΕΝΙΚΗΣ
320
+
321
+ ΓΡΑΜΜΑΤΕΙΑΣ ΠΟΛΙΤΙΚΗΣ ΠΡΟΣΤΑΣΙΑΣ.'
322
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 81
323
+
324
+ Έτος: 2016
325
+
326
+ Ρύθμιση θεμάτων αστυνομικού προσωπικού.
327
+
328
+ Άρθρο 4
329
+
330
+ Οι περιπτώσεις α΄, β΄, γ΄ και δ΄ της παραγράφου 1 του άρθρου 42 του Πδ. 24/1997,
331
+ αντικαθίστανται ως εξής:
332
+
333
+ «α. Οι Υπαστυνόμοι Α΄ 11 έτη.
334
+
335
+ β. Οι Αστυνόμοι Β΄ 17 έτη.
336
+
337
+ γ. Οι Αστυνόμοι Α΄ 23 έτη.
338
+
339
+ δ. Οι Αστυνομικοί Υποδιευθυντές 29 έτη.».'
340
+ - 'Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ'' ΑΡΙΘΜ. 94
341
+
342
+ Έτος: 1998
343
+
344
+ Σύσταση ενιαίας επιχείρησης ύδρευσης - αποχέτευσης με την επωνυμία «ΔΗΜΟΤΙΚΗ ΕΠΙΧΕΙΡΗΣΗ
345
+ ΥΔΡΕΥΣΗΣ - ΑΠΟΧΕΤΕΥΣΗΣ ΤΗΛΟΥ» στο Δήμο Τήλου του Νομού Δωδεκανήσου.
346
+
347
+ Άρθρο 5
348
+
349
+ Τίτλος άρθρου: Διοίκηση
350
+
351
+ 1. Η επιχείρηση διοικείται από Διοικητικό Συμβούλιο που αποτελείται από έξι (6)
352
+ μέλη τα οποία ορίζονται με αναπληρωτές τους από το Δημοτικό Συμβούλιο. Από τα
353
+ μέλη αυτά:
354
+
355
+ α. Τέσσερα (4) είναι αιρετοί εκπρόσωποι του Δήμου, εκ των οποίων τα δύο προέρχονται
356
+ από τη μειοψηφία.
357
+
358
+ β. Ένα (1) είναι δημότης ή κάτοικος του Δήμου Τήλου που έχει πείρα ή γνώσεις σχετικές
359
+ με το αντικείμενο του Επιχείρησης.
360
+
361
+ γ. Ένα (1) είναι εκπρόσωπος του Κοινωνικού φορέα της Περιοχής (Αγροτικού Συνεταιρισμού).
362
+
363
+ δ. Στα μέλη του Διοικητικού Συμβουλίου προστίθεται και εκπρόσωπος των εργαζομένων
364
+ (χωρίς αλλαγή της συστατικής πράξης) όταν η επιχείρηση απασχολεί περισσότερους
365
+ από είκοσι εργαζόμενους.
366
+
367
+ Ο εκπρόσωπος των εργαζομένων και του Κοινωνικού Φορέα προτείνονται από τους οικείους
368
+ φορείς.
369
+
370
+ 2. Το Δημοτικό συμβούλιο ορίζει τα μέλη του διοικητικού συμβουλίου τον Πρόεδρο
371
+ και τον Αντιπρόεδρό του (άρθρο 3 παρ. 1 του Ν 1069/80 και άρθρο 278 ΠΔ 410/95).
372
+
373
+ 3. Η θητεία του Διοικητικού Συμβουλίου ακολουθεί τη θητεία του Δημοτικού Συμβουλίου
374
+ και λήγει μόλις εγκατασταθούν τα νέα μέλη (άρθρο 2 παρ. 2 της 25027/84 ΦΕΚ Β’/244
375
+ αποφ. Υπ. Εσωτερικών).
376
+
377
+ 4. Ο Πρόεδρος του Διοικητικού Συμβουλίου και σε περίπτωση απουσίας ή κωλύματός
378
+ του, ο Αντιπρόεδρος, εκπροσωπεί την επιχείρηση σε όλες τις σχέσεις της, δικαστικές
379
+ ή εξώδικες (άρθρο 5 παρ. 4 Ν 1069/80).
380
+
381
+ Στον Υφυπουργό Εσωτερικών, Δημόσιας ς και Αποκέντρωσης αναθέτουμε τη δημοσίευση
382
+ και εκτέλεση του παρόντος διατάγματος.'
383
+ - source_sentence: Η εγκατάσταση και λειτουργία ηλεκτρονικών υπολογιστών σε επιχειρήσεις
384
+ προσφοράς υπηρεσιών διαδικτύου δεν εμπίπτει στην απαγόρευση παιγνίων.
385
+ sentences:
386
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 3935
387
+
388
+ Έτος: 2011
389
+
390
+ Κύρωση της Συμφωνίας μεταξύ της Κυβέρνησης της Ελληνικής Δημοκρατίας και της Κυβέρνησης
391
+ της Δημοκρατίας της Σερβίας σχετικά με τη συνεργασία για τ��ν πρόληψη και την καταπολέμηση
392
+ του εγκλήματος και ιδιαίτερα των οργανωμένων μορφών του.
393
+
394
+ Άρθρο δεύτερο
395
+
396
+ Η ισχύς του παρόντος νόμου αρχίζει από τη δημοσίευσή του στην Εφημερίδα της Κυβερνήσεως
397
+ και της Συμφωνίας, που κυρώνεται από την πλήρωση των προϋ­ποθέσεων του άρθρου
398
+ 11 αυτής.
399
+
400
+ Παραγγέλλομε τη δημοσίευση του παρόντος στην Εφημερίδα της Κυβερνήσεως και την
401
+ εκτέλεσή του ως νόμου του Κράτους.'
402
+ - "Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ' ΑΡΙΘΜ. 15\nΈτος: 2001\nΠερί Οργανισμού Σχολών\
403
+ \ Αρχηγείου Στόλου (Ο/ΣΑΣ).\nΆρθρο 28\nΤίτλος άρθρου: Πτυχία - Πιστοποιητικά\n\
404
+ 1. Στους μαθητές που επιτυγχάνουν στις τελικές εξετάσεις Σχολείου, απονέμονται\
405
+ \ από τις Σχολές Πτυχία ή Πιστοποιητικά που είναι σύμφωνα με τα ακόλουθα υποδείγματα\
406
+ \ :\nα. Υπόδειγμα Πτυχίου\n(Θυρεός Σχολής)\nΣΧΟΛΗ .\nΠΤΥΧΙΟ .\nΟ .παρακολούθησε\
407
+ \ τα μαθήματα που καθορίζονται από τον Κανονισμό Εκπαιδεύσεως του Σχολείου . και\
408
+ \ αφού υποβλήθηκε στις προβλεπόμενες εξετάσεις, στις οποίες συγκέντρωσε το . της\
409
+ \ συνολικής βαθμολογίας, κρίθηκε άξιος να λάβει Πτυχίο . τάξης.\nΤόπος - Ημερομηνία\
410
+ \ .\nΟ ΔΙΕΥΘΥΝΤΗΣ ΣΠΟΥΔΩΝ \t Ο ΔΙΟΙΚΗΤΗΣ\nβ. Υπόδειγμα Πιστοποιητικού\n(Θυρεός\
411
+ \ Σχολής)\nΣΧΟΛΗ .\nΠΙΣΤΟΠΟΙΗΤΙΚΟ .\nΟ .παρακολούθησε τα μαθήματα που καθορίζονται\
412
+ \ από τον Κανονισμό Εκπαιδεύσεως του Σχολείου . και αφού υποβλήθηκε στις προβλεπόμενες\
413
+ \ εξετάσεις, στις οποίες συγκέντρωσε το . της συνολικής βαθμολογίας, κρίθηκε άξιος\
414
+ \ να λάβει Πιστοποιητικό . τάξης.\nΤόπος - Ημερομηνία .\nΟ ΔΙΕΥΘΥΝΤΗΣ ΣΠΟΥΔΩΝ\t\
415
+ \ Ο ΔΙΟΙΚΗΤΗΣ\n2. Τα Πτυχία ή Πιστοποιητικά έχουν την ακόλουθη διαβάθμιση ανάλογα\
416
+ \ με την απόδοση του μαθητή στις εξετάσεις και την συνολική βαθμολογία που συγκέντρωσε:\n\
417
+ α. Πτυχίο ή Πιστοποιητικό Δ’ Τάξης, εφόσον ο μαθητής συγκεντρώσει βαθμολογία 50%\
418
+ \ έως 59,99% της ανώτατης συνολικής βαθμολογίας του Σχολείου.\nβ. Πτυχίο ή Πιστοποιητικό\
419
+ \ Γ΄ Τάξης, εφόσον ο μαθητής συγκεντρώσει βαθμολογία 60% έως 74,99% της ανώτατης\
420
+ \ συνολικής βαθμολογίας του Σχολείου,\nγ. Πτυχίο ή Πιστοποιητικό Β’ Τάξης,εφόσον\
421
+ \ ο μαθητής συγκεντρώσει βαθμολογία 75% έως 94,99% της ανώτατης συνολικής βαθμολογίας\
422
+ \ του Σχολείου.\nδ. Πτυχίο ή Πιστοποιητικό Α’ Τάξης, εφόσον ο μαθητής συγκεντρώσει\
423
+ \ βαθμολογία 95% έως 100% της ανώτατης συνολικής βαθμολογίας του Σχολείου."
424
+ - 'Τίτλος: ΝΟΜΟΣ ΥΠ'' ΑΡΙΘΜ. 3037
425
+
426
+ Έτος: 2002
427
+
428
+ Απαγόρευση παιγνίων.
429
+
430
+ Άρθρο 3
431
+
432
+ Τίτλος άρθρου: Επιχειρήσεις προσφοράς υπηρεσιών διαδικτύου
433
+
434
+ Δεν εμπίπτει στην απαγόρευση που ορίζεται στο άρθρο 2 η εγκατάσταση και λειτουργία
435
+ ηλεκτρονικών υπολογιστών σε καταστήματα που λειτουργούν ως επιχειρήσεις προσφοράς
436
+ υπηρεσιών διαδικτύου. Η διενέργεια, όμως, παιγνίου με τους υπολογιστές αυτούς,
437
+ ανεξάρτητα από τον τρόπο διενέργειάς του, απαγορεύεται.
438
+
439
+ Για τη λειτουργία επιχείρησης προσφοράς υπηρεσιών διαδικτύου απαιτείται ειδική
440
+ αδεία του δήμου η της κοινότητας στην περιφέρεια του οποίου βρίσκεται το κατάστημα
441
+ και αν λειτουργεί σε πλοίο της Λιμενικής Αρχής του αφετηρίου λιμένα. Κατά την
442
+ πρώτη εφαρμογή του μέτρου η επιχείρηση πρέπει να εφοδιαστεί με την αδεία αυτή
443
+ εντός τριών (3) μηνών από την έναρξη ισχύος του νομού αυτού.'
444
+ pipeline_tag: sentence-similarity
445
+ library_name: sentence-transformers
446
+ metrics:
447
+ - cosine_accuracy@3
448
+ - cosine_accuracy@10
449
+ - cosine_precision@3
450
+ - cosine_precision@10
451
+ - cosine_recall@3
452
+ - cosine_recall@10
453
+ - cosine_ndcg@3
454
+ - cosine_ndcg@10
455
+ - cosine_mrr@3
456
+ - cosine_mrr@10
457
+ - cosine_map@100
458
+ - cosine_accuracy@50
459
+ - cosine_ndcg@50
460
+ model-index:
461
+ - name: Greek fine-tuned model based on multilingual-e5-base
462
+ results:
463
+ - task:
464
+ type: information-retrieval
465
+ name: Information Retrieval
466
+ dataset:
467
+ name: test
468
+ type: test
469
+ metrics:
470
+ - type: cosine_accuracy@3
471
+ value: 0.9380030998450077
472
+ name: Cosine Accuracy@3
473
+ - type: cosine_accuracy@10
474
+ value: 0.9705514724263787
475
+ name: Cosine Accuracy@10
476
+ - type: cosine_precision@3
477
+ value: 0.3126676999483359
478
+ name: Cosine Precision@3
479
+ - type: cosine_precision@10
480
+ value: 0.09705514724263786
481
+ name: Cosine Precision@10
482
+ - type: cosine_recall@3
483
+ value: 0.9380030998450077
484
+ name: Cosine Recall@3
485
+ - type: cosine_recall@10
486
+ value: 0.9705514724263787
487
+ name: Cosine Recall@10
488
+ - type: cosine_ndcg@3
489
+ value: 0.9087806974115595
490
+ name: Cosine Ndcg@3
491
+ - type: cosine_ndcg@10
492
+ value: 0.920897861441757
493
+ name: Cosine Ndcg@10
494
+ - type: cosine_mrr@3
495
+ value: 0.898605069746515
496
+ name: Cosine Mrr@3
497
+ - type: cosine_mrr@10
498
+ value: 0.9046598860533198
499
+ name: Cosine Mrr@10
500
+ - type: cosine_map@100
501
+ value: 0.905773159208684
502
+ name: Cosine Map@100
503
+ - task:
504
+ type: information-retrieval
505
+ name: Information Retrieval
506
+ dataset:
507
+ name: valid
508
+ type: valid
509
+ metrics:
510
+ - type: cosine_accuracy@3
511
+ value: 0.9319534023298836
512
+ name: Cosine Accuracy@3
513
+ - type: cosine_accuracy@10
514
+ value: 0.968251587420629
515
+ name: Cosine Accuracy@10
516
+ - type: cosine_accuracy@50
517
+ value: 0.9896005199740013
518
+ name: Cosine Accuracy@50
519
+ - type: cosine_precision@10
520
+ value: 0.09682515874206289
521
+ name: Cosine Precision@10
522
+ - type: cosine_recall@10
523
+ value: 0.968251587420629
524
+ name: Cosine Recall@10
525
+ - type: cosine_ndcg@3
526
+ value: 0.9026958973117432
527
+ name: Cosine Ndcg@3
528
+ - type: cosine_ndcg@10
529
+ value: 0.9162094563823976
530
+ name: Cosine Ndcg@10
531
+ - type: cosine_ndcg@50
532
+ value: 0.9211156521770739
533
+ name: Cosine Ndcg@50
534
+ - type: cosine_mrr@10
535
+ value: 0.899262953518994
536
+ name: Cosine Mrr@10
537
+ - type: cosine_map@100
538
+ value: 0.9004666335826826
539
+ name: Cosine Map@100
540
+ ---
541
+
542
+ # Greek fine-tuned model based on multilingual-e5-base
543
+
544
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
545
+
546
+ ## Model Details
547
+
548
+ ### Model Description
549
+ - **Model Type:** Sentence Transformer
550
+ - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision 835193815a3936a24a0ee7dc9e3d48c1fbb19c55 -->
551
+ - **Maximum Sequence Length:** 512 tokens
552
+ - **Output Dimensionality:** 768 dimensions
553
+ - **Similarity Function:** Cosine Similarity
554
+ <!-- - **Training Dataset:** Unknown -->
555
+ - **Language:** gr
556
+ - **License:** apache-2.0
557
+
558
+ ### Model Sources
559
+
560
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
561
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
562
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
563
+
564
+ ### Full Model Architecture
565
+
566
+ ```
567
+ SentenceTransformer(
568
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
569
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
570
+ (2): Normalize()
571
+ )
572
+ ```
573
+
574
+ ## Usage
575
+
576
+ ### Direct Usage (Sentence Transformers)
577
+
578
+ First install the Sentence Transformers library:
579
+
580
+ ```bash
581
+ pip install -U sentence-transformers
582
+ ```
583
+
584
+ Then you can load this model and run inference.
585
+ ```python
586
+ from sentence_transformers import SentenceTransformer
587
+
588
+ # Download from the 🤗 Hub
589
+ model = SentenceTransformer("novelcore/multilingual-e5-base-aristotle")
590
+ # Run inference
591
+ sentences = [
592
+ 'Η εγκατάσταση και λειτουργία ηλεκτρονικών υπολογιστών σε επιχειρήσεις προσφοράς υπηρεσιών διαδικτύου δεν εμπίπτει στην απαγόρευση παιγνίων.',
593
+ "Τίτλος: ΝΟΜΟΣ ΥΠ' ΑΡΙΘΜ. 3037\nΈτος: 2002\nΑπαγόρευση παιγνίων.\nΆρθρο 3\nΤίτλος άρθρου: Επιχειρήσεις προσφοράς υπηρεσιών διαδικτύου\nΔεν εμπίπτει στην απαγόρευση που ορίζεται στο άρθρο 2 η εγκατάσταση και λειτουργία ηλεκτρονικών υπολογιστών σε καταστήματα που λειτουργούν ως επιχειρήσεις προσφοράς υπηρεσιών διαδικτύου. Η διενέργεια, όμως, παιγνίου με τους υπολογιστές αυτούς, ανεξάρτητα από τον τρόπο διενέργειάς του, απαγορεύεται.\nΓια τη λειτουργία επιχείρησης προσφοράς υπηρεσιών διαδικτύου απαιτείται ειδική αδεία του δήμου η της κοινότητας στην περιφέρεια του οποίου βρίσκεται το κατάστημα και αν λειτουργεί σε πλοίο της Λιμενικής Αρχής του αφετηρίου λιμένα. Κατά την πρώτη εφαρμογή του μέτρου η επιχείρηση πρέπει να εφοδιαστεί με την αδεία αυτή εντός τριών (3) μηνών από την έναρξη ισχύος του νομού αυτού.",
594
+ "Τίτλος: ΝΟΜΟΣ ΥΠ' ΑΡΙΘΜ. 3935\nΈτος: 2011\nΚύρωση της Συμφωνίας μεταξύ της Κυβέρνησης της Ελληνικής Δημοκρατίας και της Κυβέρνησης της Δημοκρατίας της Σερβίας σχετικά με τη συνεργασία για την πρόληψη και την καταπολέμηση του εγκλήματος και ιδιαίτερα των οργανωμένων μορφών του.\nΆρθρο δεύτερο\nΗ ισχύς του παρόντος νόμου αρχίζει από τη δημοσίευσή του στην Εφημερίδα της Κυβερνήσεως και της Συμφωνίας, που κυρώνεται από την πλήρωση των προϋ\xadποθέσεων του άρθρου 11 αυτής.\nΠαραγγέλλομε τη δημοσίευση του παρόντος στην Εφημερίδα της Κυβερνήσεως και την εκτέλεσή του ως νόμου του Κράτους.",
595
+ ]
596
+ embeddings = model.encode(sentences)
597
+ print(embeddings.shape)
598
+ # [3, 768]
599
+
600
+ # Get the similarity scores for the embeddings
601
+ similarities = model.similarity(embeddings, embeddings)
602
+ print(similarities)
603
+ # tensor([[1.0000, 0.5922, 0.0360],
604
+ # [0.5922, 1.0000, 0.1192],
605
+ # [0.0360, 0.1192, 1.0000]])
606
+ ```
607
+
608
+ <!--
609
+ ### Direct Usage (Transformers)
610
+
611
+ <details><summary>Click to see the direct usage in Transformers</summary>
612
+
613
+ </details>
614
+ -->
615
+
616
+ <!--
617
+ ### Downstream Usage (Sentence Transformers)
618
+
619
+ You can finetune this model on your own dataset.
620
+
621
+ <details><summary>Click to expand</summary>
622
+
623
+ </details>
624
+ -->
625
+
626
+ <!--
627
+ ### Out-of-Scope Use
628
+
629
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
630
+ -->
631
+
632
+ ## Evaluation
633
+
634
+ ### Metrics
635
+
636
+ #### Information Retrieval
637
+
638
+ * Dataset: `test`
639
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
640
+
641
+ | Metric | Value |
642
+ |:--------------------|:-----------|
643
+ | cosine_accuracy@3 | 0.938 |
644
+ | cosine_accuracy@10 | 0.9706 |
645
+ | cosine_precision@3 | 0.3127 |
646
+ | cosine_precision@10 | 0.0971 |
647
+ | cosine_recall@3 | 0.938 |
648
+ | cosine_recall@10 | 0.9706 |
649
+ | cosine_ndcg@3 | 0.9088 |
650
+ | **cosine_ndcg@10** | **0.9209** |
651
+ | cosine_mrr@3 | 0.8986 |
652
+ | cosine_mrr@10 | 0.9047 |
653
+ | cosine_map@100 | 0.9058 |
654
+
655
+ #### Information Retrieval
656
+
657
+ * Dataset: `valid`
658
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
659
+
660
+ | Metric | Value |
661
+ |:--------------------|:-----------|
662
+ | cosine_accuracy@3 | 0.932 |
663
+ | cosine_accuracy@10 | 0.9683 |
664
+ | cosine_accuracy@50 | 0.9896 |
665
+ | cosine_precision@10 | 0.0968 |
666
+ | cosine_recall@10 | 0.9683 |
667
+ | cosine_ndcg@3 | 0.9027 |
668
+ | cosine_ndcg@10 | 0.9162 |
669
+ | **cosine_ndcg@50** | **0.9211** |
670
+ | cosine_mrr@10 | 0.8993 |
671
+ | cosine_map@100 | 0.9005 |
672
+
673
+ <!--
674
+ ## Bias, Risks and Limitations
675
+
676
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
677
+ -->
678
+
679
+ <!--
680
+ ### Recommendations
681
+
682
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
683
+ -->
684
+
685
+ ## Training Details
686
+
687
+ ### Training Dataset
688
+
689
+ #### Unnamed Dataset
690
+
691
+ * Size: 6,165,829 training samples
692
+ * Columns: <code>anchor</code> and <code>positive</code>
693
+ * Approximate statistics based on the first 1000 samples:
694
+ | | anchor | positive |
695
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
696
+ | type | string | string |
697
+ | details | <ul><li>min: 11 tokens</li><li>mean: 30.47 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 74 tokens</li><li>mean: 442.51 tokens</li><li>max: 512 tokens</li></ul> |
698
+ * Samples:
699
+ | anchor | positive |
700
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
701
+ | <code>Ίδρυσε το τουριστικό θέρετρο Porto Carras στη Σιθωνία Χαλκιδικής.</code> | <code>Γιάννης Κ. Καρράς<br>Ο Γιάννης Καρράς του Κωνσταντίνου (1907 10 Ιουνίου 1989) ήταν Έλληνας μεγαλοεφοπλιστής, εγγονός του καπετάνιου και πλοιοκτήτη Ιωάννη Ι. Καρρά (1852-1927) από τα Καρδάμυλα της Χίου και υπηρέτησε ως Πρόεδρος της Ελληνικής Επιτροπής Ναυτιλιακής Συνεργασίας (GSCC) στο Λονδίνο στα 1963-1965. Κατά τον Δεύτερο Παγκόσμιο Πόλεμο υπηρέτησε ως εθελοντής αξιωματικός στο Ελληνικό Ναυτικό και παρασημοφορήθηκε τρεις φορές. Υποστήριζε από την αρχή την έναρξη των Ποσειδωνίων, της πλέον επιτυχημένης διεθνούς ναυτιλιακής έκθεσης που πραγματοποιείται στην Ελλάδα. Ήταν επίσης συνιδρυτής της να��τιλιακής ακαδημίας μηχανικών στη Χίο. Ο Γιάννης Καρράς πέθανε το 1989. Όλη η περιουσία πέρασε στα παιδιά του και τους λοιπούς συγγενείς.<br>Ο Γιάννης Καρράς γεννήθηκε στα Καρδάμυλα της Χίου σε οικογένεια που είχε προϊστορία με τη ναυτιλία. Όταν ενηλικιώθηκε σπούδασε οικονομικά στη Λωζάνη της Ελβετίας.<br>Ξεκίνησε ως διευθύνων στέλεχος στα γραφεία του Άγγελου Λούζη CBE. Ωστόσο το 1965, περίπου μετά από μια...</code> |
702
+ | <code>Η νομολογία που αναπτύχθηκε μετά την Αναθεώρηση του 2001 ήταν απαγορευτική για τις αλλαγές στους χαρακτηρισμούς δασικών εκτάσεων.</code> | <code>Κυρίες και κύριοι συνάδελφοι, σε αυτήν τη δεύτερη ενότητα των αναθεωρητέων άρθρων στην Ολομέλεια της Βουλής υπάρχουν άρθρα τα οποία έχουν να κάνουν με την αξιοπιστία του πολιτικού συστήματος και υπάρχουν το άρθρο 24 και το συνοδό άρθρο 117 το οποίο έχει σχέση με το περιβάλλον. Πολύ συζήτηση έγινε τόσο στην επιτροπή όσο και στην Ολομέλεια. Θα επιχειρήσω την προσέγγιση του άρθρου 24 και του συνοδού 117 με την οπτική γωνία του πολίτη, τι βλέπει σήμερα ο πολίτης και τι νιώθει στην Ελλάδα σε σχέση με την περιβαλλοντική πολιτική της πολιτείας. Ο πολίτης αισθάνεται ότι σε αυτόν τον τόπο έχουμε ισχυρούς νόμους και πολύ μεγάλες αυθαιρεσίες πάνω σε αυτούς. Ο πολίτης αισθάνεται ότι κάποτε τον άφησε η πολιτεία να συμμετέχει σε έναν οικοδομικό συνεταιρισμό, τον ηλεκτροδότησε, του χώρισε δρόμους και στη συνέχεια του απαγόρευσε –και μιλώ ιδιαίτερα για τις κατώτερες εισοδηματικές τάξεις- τη δυνατότητα απόκτησης μιας δεύτερης κατοικίας. Ο πολίτης βλέπει την πολιτεία, μετά την Αναθεώρηση του 2001 και με...</code> |
703
+ | <code>ΣΥΡΙΖΑ, Συμβούλιο Εθνικής Ασφαλείας, κ. Καμμένος, κ. Τσίπρας</code> | <code>Κυρίες και κύριοι συνάδελφοι, η αλήθεια είναι ότι ο κ. Τσίπρας βρίσκει τρόπους να μας εκπλήσσει. Σήμερα προσπάθησε να καλύψει με κάποιες κορώνες το κενό που αφήνει η απουσία του κ. Καμμένου από την Αίθουσα. Και με καθυστέρηση -και διορθώστε με αν κάνω λάθος- μάθαμε ότι ο ΣΥΡΙΖΑ θεωρεί ενδοτική τη συμπεριφορά της Ελλάδας το 1996. Είναι η ατζέντα των εθνικιστών σε μια καινούργια ΣΥΡΙΖΑ - ΑΝΕΛ εκδοχή. Και πραγματικά θα ήθελα να ρωτήσω τον κ. Τσίπρα τι είναι χειρότερο: Το ευχαριστώ του Σημίτη τους συμμάχους ή το ευχαριστώ του κ. Τραμπ στον Έλληνα Πρωθυπουργό για την απλοχεριά στις πολεμικές δαπάνες; Σας θυμίζω ότι ήταν 2,4 δισεκατομμύρια δολάρια η μία μόνο επίσκεψη. (Χειροκροτήματα από την πτέρυγα του Ποταμιού) Θα ξεκινήσω, λοιπόν, αναγκαστικά κι εγώ με τα μεγάλα εξωτερικά θέματα και βεβαίως θα είμαι μέσα στον κανόνα του χρόνου. Ζήτησα και χθες να κάνουμε όλοι μια προσπάθεια να διαχωρίσουμε τα μείζονα εξωτερικά θέματα από τις εσωτερικές πολιτικές συγκρούσεις. Οι ώριμοι αντίπαλοι αντιπαρατί...</code> |
704
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
705
+ ```json
706
+ {
707
+ "scale": 20.0,
708
+ "similarity_fct": "cos_sim",
709
+ "gather_across_devices": false
710
+ }
711
+ ```
712
+
713
+ ### Evaluation Dataset
714
+
715
+ #### Unnamed Dataset
716
+
717
+ * Size: 35,766 evaluation samples
718
+ * Columns: <code>anchor</code> and <code>positive</code>
719
+ * Approximate statistics based on the first 1000 samples:
720
+ | | anchor | positive |
721
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
722
+ | type | string | string |
723
+ | details | <ul><li>min: 13 tokens</li><li>mean: 31.54 tokens</li><li>max: 78 tokens</li></ul> | <ul><li>min: 53 tokens</li><li>mean: 350.64 tokens</li><li>max: 512 tokens</li></ul> |
724
+ * Samples:
725
+ | anchor | positive |
726
+ |:-----------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
727
+ | <code>Ποιες είναι οι τροποποιήσεις που επέρχονται στην παρ. 3 του άρθρου 28Γ του Κώδικα Φορολογίας Εισοδήματος;</code> | <code>Τίτλος: ΝΟΜΟΣ ΥΠ' ΑΡΙΘΜ. 5162<br>Έτος: 2024<br>Μέτρα για την ενίσχυση του εισοδήματος, φορολογικά κίνητρα για την καινοτομία και τους μετασχηματισμούς επιχειρήσεων και άλλες διατάξεις.<br>Άρθρο 7<br>Τίτλος άρθρου: Μείωση του ελάχιστου ποσού καθαρού εισοδήματος από την άσκηση επιχειρηματικής δραστηριότητας σε μικρές δημοτικές κοινότητες - Τροποποίηση παρ. 3 άρθρου 28Γ Κώδικα Φορολογίας Εισοδήματος<br>Στην παρ. 3 του άρθρου 28Γ του Κώδικα Φορολογίας Εισοδήματος (ΚΦΕ, ν. 4172/2013, Α΄ 167), περί λοιπών μειώσεων του ελάχιστου ποσού καθαρού εισοδήματος από την άσκηση επιχειρηματικής δραστηριότητας και ειδικών ρυθμίσεων, επέρχονται οι ακόλουθες τροποποιήσεις: α) οι λέξεις «σε οικισμούς με πληθυσμό μικρότερο των πεντακοσίων (500) κατοίκων ή» αριθμούνται ως περ. α), β) προστίθεται περ. β), γ) οι λέξεις «σε νησιά με πληθυσμό μικρότερο των τριών χιλιάδων εκατό (3.100) κατοίκων» αριθμούνται ως περ. γ), και η παρ. 3 διαμορφώνεται ως εξής:<br>«3. Το ποσό της παρ. 2 του άρθρου 28Α μειώνεται κατά το ήμισυ (1/2) για υπ...</code> |
728
+ | <code>Ποιος εκδίδει την απόφαση για την εκκίνηση της διαδικασίας κωδικοποίησης;</code> | <code>Τίτλος: ΝΟΜΟΣ ΥΠ' ΑΡΙΘΜ. 4622<br>Έτος: 2019<br>Επιτελικό Κράτος: οργάνωση, λειτουργία και διαφάνεια της Κυβέρνησης, των κυβερνητικών οργάνων και της κεντρικής δημόσιας διοίκησης.<br>Άρθρο 67<br>Τίτλος άρθρου: Διαδικασία κωδικοποίησης<br>1. Η διαδικασία κωδικοποίησης εκκινεί με απόφαση του Γενικού Γραμματέα Νομικών και Κοινοβουλευτικών Θεμάτων, η οποία εκδίδεται: (α) ύστερα από σχετικές εισηγήσεις των οικείων υπουργείων ή του Υπουργείου που είναι αρμόδιο για την απλούστευση των διαδικασιών και η οποία αναρτάται στο διαδίκτυο σύμφωνα με τις διατάξεις του ν. 3861/2010 (Α΄ 112), (β) ύστερα από εισήγηση της ΚΕΚ.<br>2. Επιτροπές κωδικοποίησης επιτρέπεται να συστήνονται εφεξής στα καθ’ ύλην αρμόδια Υπουργεία μόνο με αιτιολογημένη απόφαση του καθ’ ύλην αρμόδιου υπουργού, ύστερα από γνώμη της ΚΕΚ. Το προηγούμενο εδάφιο δεν εφαρμόζεται στις επιτροπές κωδικοποίησης του Υπουργείου Δικαιοσύνης. Δεν αποκλείει επίσης τη διοικητική κωδικοποίηση της παραγράφου 2 του άρθρου 65 του παρόντος από τα αρμόδια Υπουργεία, υπό τ...</code> |
729
+ | <code>Ποιες είναι οι διαστάσεις του κυκλικού πλαισίου που περιβάλλει το διακριτικό σήμα;</code> | <code>Τίτλος: ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΥΠ' ΑΡΙΘΜ. 213<br>Έτος: 1999<br>Καθιέρωση στολών επιχειρήσεων και εργασίας προσωπικού Λιμενικού Σώματος (ΛΣ) που υπηρετεί σε περιπολικά και ναυαγοσωστικά πλοία.<br>Άρθρο 16<br>Τίτλος άρθρου: Διακριτικό σήμα περιπολικών πλοίων.<br>1. Στην αριστερή χειρίδα του υποκάμισου και στο άνω αριστερό μέρος του στήθους του επενδύτη και της φανέλας φέρεται το διακριτικό σήμα των περιπολικών πλοίων ΛΣ(σχ. 8).<br>2. Το ανωτέρω σήμα απεικονίζει δύο χιαστί άγκυρες μέσα σε κύκλο με διάμετρο πεντέμισι (5,5) εκατοστόμετρα και κέντρο τη συμβολή των αγκυρών. Η εσωτερική επιφάνεια του κύκλου είναι κεντημένη με κλωστή χρώματος θαλασσί το δε περίγραμμά του, που είναι κεντημένο με κίτρινη κλωστή έχει πάχος ενάμισι (1,5) χιλιοστόμετρο.<br>Οι χιαστί άγκυρες είναι κεντημένες με κίτρινη κλωστή τα δε ακρότατα σημεία τους περιέχονται σε νοητό κύκλο διαμέτρου τριάντα πέντε (35) χιλιοστόμετρων. Κάτω από τις χιαστί άγκυρες και σε απόσταση τριών (3) χιλιοστόμετρων απεικονίζεται θάλασσα σε κυματώδη κατάσταση με τρει...</code> |
730
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
731
+ ```json
732
+ {
733
+ "scale": 20.0,
734
+ "similarity_fct": "cos_sim",
735
+ "gather_across_devices": false
736
+ }
737
+ ```
738
+
739
+ ### Training Hyperparameters
740
+ #### Non-Default Hyperparameters
741
+
742
+ - `eval_strategy`: steps
743
+ - `per_device_train_batch_size`: 64
744
+ - `per_device_eval_batch_size`: 64
745
+ - `gradient_accumulation_steps`: 8
746
+ - `learning_rate`: 5e-06
747
+ - `lr_scheduler_type`: cosine
748
+ - `warmup_ratio`: 0.1
749
+ - `bf16`: True
750
+ - `tf32`: True
751
+ - `load_best_model_at_end`: True
752
+ - `batch_sampler`: no_duplicates
753
+
754
+ #### All Hyperparameters
755
+ <details><summary>Click to expand</summary>
756
+
757
+ - `overwrite_output_dir`: False
758
+ - `do_predict`: False
759
+ - `eval_strategy`: steps
760
+ - `prediction_loss_only`: True
761
+ - `per_device_train_batch_size`: 64
762
+ - `per_device_eval_batch_size`: 64
763
+ - `per_gpu_train_batch_size`: None
764
+ - `per_gpu_eval_batch_size`: None
765
+ - `gradient_accumulation_steps`: 8
766
+ - `eval_accumulation_steps`: None
767
+ - `torch_empty_cache_steps`: None
768
+ - `learning_rate`: 5e-06
769
+ - `weight_decay`: 0.0
770
+ - `adam_beta1`: 0.9
771
+ - `adam_beta2`: 0.999
772
+ - `adam_epsilon`: 1e-08
773
+ - `max_grad_norm`: 1.0
774
+ - `num_train_epochs`: 3
775
+ - `max_steps`: -1
776
+ - `lr_scheduler_type`: cosine
777
+ - `lr_scheduler_kwargs`: {}
778
+ - `warmup_ratio`: 0.1
779
+ - `warmup_steps`: 0
780
+ - `log_level`: passive
781
+ - `log_level_replica`: warning
782
+ - `log_on_each_node`: True
783
+ - `logging_nan_inf_filter`: True
784
+ - `save_safetensors`: True
785
+ - `save_on_each_node`: False
786
+ - `save_only_model`: False
787
+ - `restore_callback_states_from_checkpoint`: False
788
+ - `no_cuda`: False
789
+ - `use_cpu`: False
790
+ - `use_mps_device`: False
791
+ - `seed`: 42
792
+ - `data_seed`: None
793
+ - `jit_mode_eval`: False
794
+ - `use_ipex`: False
795
+ - `bf16`: True
796
+ - `fp16`: False
797
+ - `fp16_opt_level`: O1
798
+ - `half_precision_backend`: auto
799
+ - `bf16_full_eval`: False
800
+ - `fp16_full_eval`: False
801
+ - `tf32`: True
802
+ - `local_rank`: 0
803
+ - `ddp_backend`: None
804
+ - `tpu_num_cores`: None
805
+ - `tpu_metrics_debug`: False
806
+ - `debug`: []
807
+ - `dataloader_drop_last`: False
808
+ - `dataloader_num_workers`: 0
809
+ - `dataloader_prefetch_factor`: None
810
+ - `past_index`: -1
811
+ - `disable_tqdm`: False
812
+ - `remove_unused_columns`: True
813
+ - `label_names`: None
814
+ - `load_best_model_at_end`: True
815
+ - `ignore_data_skip`: False
816
+ - `fsdp`: []
817
+ - `fsdp_min_num_params`: 0
818
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
819
+ - `fsdp_transformer_layer_cls_to_wrap`: None
820
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
821
+ - `deepspeed`: None
822
+ - `label_smoothing_factor`: 0.0
823
+ - `optim`: adamw_torch_fused
824
+ - `optim_args`: None
825
+ - `adafactor`: False
826
+ - `group_by_length`: False
827
+ - `length_column_name`: length
828
+ - `ddp_find_unused_parameters`: None
829
+ - `ddp_bucket_cap_mb`: None
830
+ - `ddp_broadcast_buffers`: False
831
+ - `dataloader_pin_memory`: True
832
+ - `dataloader_persistent_workers`: False
833
+ - `skip_memory_metrics`: True
834
+ - `use_legacy_prediction_loop`: False
835
+ - `push_to_hub`: False
836
+ - `resume_from_checkpoint`: None
837
+ - `hub_model_id`: None
838
+ - `hub_strategy`: every_save
839
+ - `hub_private_repo`: None
840
+ - `hub_always_push`: False
841
+ - `hub_revision`: None
842
+ - `gradient_checkpointing`: False
843
+ - `gradient_checkpointing_kwargs`: None
844
+ - `include_inputs_for_metrics`: False
845
+ - `include_for_metrics`: []
846
+ - `eval_do_concat_batches`: True
847
+ - `fp16_backend`: auto
848
+ - `push_to_hub_model_id`: None
849
+ - `push_to_hub_organization`: None
850
+ - `mp_parameters`:
851
+ - `auto_find_batch_size`: False
852
+ - `full_determinism`: False
853
+ - `torchdynamo`: None
854
+ - `ray_scope`: last
855
+ - `ddp_timeout`: 1800
856
+ - `torch_compile`: False
857
+ - `torch_compile_backend`: None
858
+ - `torch_compile_mode`: None
859
+ - `include_tokens_per_second`: False
860
+ - `include_num_input_tokens_seen`: False
861
+ - `neftune_noise_alpha`: None
862
+ - `optim_target_modules`: None
863
+ - `batch_eval_metrics`: False
864
+ - `eval_on_start`: False
865
+ - `use_liger_kernel`: False
866
+ - `liger_kernel_config`: None
867
+ - `eval_use_gather_object`: False
868
+ - `average_tokens_across_devices`: False
869
+ - `prompts`: None
870
+ - `batch_sampler`: no_duplicates
871
+ - `multi_dataset_batch_sampler`: proportional
872
+ - `router_mapping`: {}
873
+ - `learning_rate_mapping`: {}
874
+
875
+ </details>
876
+
877
+ ### Training Logs
878
+ | Epoch | Step | Training Loss | Validation Loss | test_cosine_ndcg@10 | valid_cosine_ndcg@50 |
879
+ |:----------:|:---------:|:-------------:|:---------------:|:-------------------:|:--------------------:|
880
+ | -1 | -1 | - | - | 0.7661 | - |
881
+ | 0.1661 | 2000 | 0.6325 | 0.0720 | 0.8773 | 0.8801 |
882
+ | 0.3322 | 4000 | 0.1102 | 0.0520 | 0.9004 | 0.9016 |
883
+ | 0.4982 | 6000 | 0.0869 | 0.0466 | 0.9079 | 0.9088 |
884
+ | 0.6643 | 8000 | 0.0775 | 0.0411 | 0.9086 | 0.9098 |
885
+ | 0.8304 | 10000 | 0.0727 | 0.0396 | 0.9108 | 0.9118 |
886
+ | 0.9965 | 12000 | 0.0686 | 0.0381 | 0.9141 | 0.9155 |
887
+ | 1.1625 | 14000 | 0.064 | 0.0371 | 0.9155 | 0.9161 |
888
+ | 1.3286 | 16000 | 0.0624 | 0.0360 | 0.9169 | 0.9176 |
889
+ | 1.4947 | 18000 | 0.0601 | 0.0354 | 0.9172 | 0.9179 |
890
+ | 1.6607 | 20000 | 0.059 | 0.0345 | 0.9196 | 0.9204 |
891
+ | 1.8268 | 22000 | 0.0586 | 0.0343 | 0.9193 | 0.9196 |
892
+ | 1.9929 | 24000 | 0.0573 | 0.0336 | 0.9195 | 0.9196 |
893
+ | 2.1589 | 26000 | 0.0551 | 0.0334 | 0.9196 | 0.9201 |
894
+ | 2.3250 | 28000 | 0.0546 | 0.0332 | 0.9206 | 0.9205 |
895
+ | 2.4911 | 30000 | 0.0546 | 0.0330 | 0.9208 | 0.9208 |
896
+ | 2.6572 | 32000 | 0.0545 | 0.0329 | 0.9207 | 0.9207 |
897
+ | 2.8232 | 34000 | 0.0542 | 0.0328 | 0.9207 | 0.9210 |
898
+ | **2.9893** | **36000** | **0.0546** | **0.0329** | **0.9209** | **0.9211** |
899
+
900
+ * The bold row denotes the saved checkpoint.
901
+
902
+ ### Framework Versions
903
+ - Python: 3.12.3
904
+ - Sentence Transformers: 5.1.0
905
+ - Transformers: 4.55.4
906
+ - PyTorch: 2.8.0+cu128
907
+ - Accelerate: 1.10.1
908
+ - Datasets: 4.0.0
909
+ - Tokenizers: 0.21.4
910
+
911
+ ## Citation
912
+
913
+ ### BibTeX
914
+
915
+ #### Sentence Transformers
916
+ ```bibtex
917
+ @inproceedings{reimers-2019-sentence-bert,
918
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
919
+ author = "Reimers, Nils and Gurevych, Iryna",
920
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
921
+ month = "11",
922
+ year = "2019",
923
+ publisher = "Association for Computational Linguistics",
924
+ url = "https://arxiv.org/abs/1908.10084",
925
+ }
926
+ ```
927
+
928
+ #### MultipleNegativesRankingLoss
929
+ ```bibtex
930
+ @misc{henderson2017efficient,
931
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
932
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
933
+ year={2017},
934
+ eprint={1705.00652},
935
+ archivePrefix={arXiv},
936
+ primaryClass={cs.CL}
937
+ }
938
+ ```
939
+
940
+ <!--
941
+ ## Glossary
942
+
943
+ *Clearly define terms in order to be accessible across audiences.*
944
+ -->
945
+
946
+ <!--
947
+ ## Model Card Authors
948
+
949
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
950
+ -->
951
+
952
+ <!--
953
+ ## Model Card Contact
954
+
955
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
956
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "XLMRobertaModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "eos_token_id": 2,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 768,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 3072,
14
+ "layer_norm_eps": 1e-05,
15
+ "max_position_embeddings": 514,
16
+ "model_type": "xlm-roberta",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "output_past": true,
20
+ "pad_token_id": 1,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.55.4",
24
+ "type_vocab_size": 1,
25
+ "use_cache": true,
26
+ "vocab_size": 250002
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.1.0",
5
+ "transformers": "4.55.4",
6
+ "pytorch": "2.8.0+cu128"
7
+ },
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4625f4fe8d1a4789e667dc602fef8e6f17fa887c5109f426e705b66286da57d1
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 512,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }