Text Ranking
sentence-transformers
Safetensors
multilingual
modernbert
cross-encoder
reranker
Generated from Trainer
dataset_size:13249
loss:BinaryCrossEntropyLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use davanstrien/fineweb-c-quality-reranker-v1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use davanstrien/fineweb-c-quality-reranker-v1 with sentence-transformers:
from sentence_transformers import CrossEncoder model = CrossEncoder("davanstrien/fineweb-c-quality-reranker-v1") query = "Which planet is known as the Red Planet?" passages = [ "Venus is often called Earth's twin because of its similar size and proximity.", "Mars, known for its reddish appearance, is often referred to as the Red Planet.", "Jupiter, the largest planet in our solar system, has a prominent red spot.", "Saturn, famous for its rings, is sometimes mistaken for the Red Planet." ] scores = model.predict([(query, passage) for passage in passages]) print(scores) - Notebooks
- Google Colab
- Kaggle
| language: | |
| - multilingual | |
| license: apache-2.0 | |
| tags: | |
| - sentence-transformers | |
| - cross-encoder | |
| - reranker | |
| - generated_from_trainer | |
| - dataset_size:13249 | |
| - loss:BinaryCrossEntropyLoss | |
| base_model: jhu-clsp/mmBERT-base | |
| pipeline_tag: text-ranking | |
| library_name: sentence-transformers | |
| metrics: | |
| - accuracy | |
| - accuracy_threshold | |
| - f1 | |
| - f1_threshold | |
| - precision | |
| - recall | |
| - average_precision | |
| model-index: | |
| - name: mmBERT-base multilingual educational-quality reranker (FineWeb-C) | |
| results: | |
| - task: | |
| type: cross-encoder-classification | |
| name: Cross Encoder Classification | |
| dataset: | |
| name: fineweb c eval | |
| type: fineweb_c_eval | |
| metrics: | |
| - type: accuracy | |
| value: 0.9211956521739131 | |
| name: Accuracy | |
| - type: accuracy_threshold | |
| value: 0.8444083333015442 | |
| name: Accuracy Threshold | |
| - type: f1 | |
| value: 0.7536231884057971 | |
| name: F1 | |
| - type: f1_threshold | |
| value: 0.7453806400299072 | |
| name: F1 Threshold | |
| - type: precision | |
| value: 0.7711864406779662 | |
| name: Precision | |
| - type: recall | |
| value: 0.7368421052631579 | |
| name: Recall | |
| - type: average_precision | |
| value: 0.8135626529584756 | |
| name: Average Precision | |
| # mmBERT-base multilingual educational-quality reranker (FineWeb-C) | |
| This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [jhu-clsp/mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search. | |
| ## Model Details | |
| ### Model Description | |
| - **Model Type:** Cross Encoder | |
| - **Base model:** [jhu-clsp/mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base) <!-- at revision c5955035435e2bf121cde7f3c8863ef52ff35d82 --> | |
| - **Maximum Sequence Length:** 512 tokens | |
| - **Number of Output Labels:** 1 label | |
| - **Supported Modality:** Text | |
| <!-- - **Training Dataset:** Unknown --> | |
| - **Language:** multilingual | |
| - **License:** apache-2.0 | |
| ### Model Sources | |
| - **Documentation:** [Sentence Transformers Documentation](https://sbert.net) | |
| - **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html) | |
| - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers) | |
| - **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder) | |
| ### Full Model Architecture | |
| ``` | |
| CrossEncoder( | |
| (0): Transformer({'transformer_task': 'sequence-classification', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'logits'}}, 'module_output_name': 'scores', 'architecture': 'ModernBertForSequenceClassification'}) | |
| ) | |
| ``` | |
| ## Usage | |
| ### Direct Usage (Sentence Transformers) | |
| First install the Sentence Transformers library: | |
| ```bash | |
| pip install -U sentence-transformers | |
| ``` | |
| Then you can load this model and run inference. | |
| ```python | |
| from sentence_transformers import CrossEncoder | |
| # Download from the 🤗 Hub | |
| model = CrossEncoder("davanstrien/fineweb-c-quality-reranker-v1") | |
| # Get scores for pairs of inputs | |
| pairs = [ | |
| ["काठमाडौं : काठमाडौं प्रमुख आकर्षणका रुपमा रहेको रानीपोखरी ५ वर्षपछि भरिएको छ । खानेपानी मन्त्रालयको सहयोगमा आयोजना कार्यान्वयन निर्देशनालयले रानीपोखरीमा पानी भरेको हो । विस २०७२ सालको भूकम्पले क्षति पुर्याएको रानीपोखरी पुनर्निमाण सम्पन्न हुने चरणमा पुगेको छ ।\nयसैक्रममा राष्ट्रिय पुनर्निर्माण प्राधिकरणको अनुरोधमा निर्देशनालयले रानीपोखरीमा पानी भरिदिएको हो। यससँगै धा'र्मिक, सांस्कृतिक तथा ऐतिहासिक धरोहरको रुपमा रहेको रानीपोखरी सुन्दर र मनमोहक बनेको छ । खानेपानी तथा सरसफाई मन्त्रालय अन्तर्गतको आयोजना कार्यान्वयन निर्देशनालयले २ दिन लगाएर रानीपोखरीमा पानी भरेको निर्देशनालयका निर्देशक भोजविक्रम थापाले जानकारी दिए ।\nथापाका अनुसार रानीपोखरीमा ३ करोड लिटर पानी भरिएको हो । रानीपोखरीको लम्बाई १८० मिटर रहेको छ भने चौडाई १४० मिटर रहेको छ । जसमा पानी भर्नका लागि निर्धारण गरिएको ९ फिट गहिराईमा पानी भरिएको छ । राष्ट्रिय पुन र्निर्माण प्राधिकरणले पुनर्निर्माण गरिरहेको रानीपोखरी निर्माणको काम लगभग सम्पन्न भएको छ । प्राधिकरणका अनुसार आगामी भाइटीकाबाट सबै नागरिकका लागि रानीपोखरी तथा बालगोपालेश्वर मन्दिर सञ्चालनमा आउनेछ ।", 'नेपाल, भारत र बेलायतबीच सन् १९४७ मा भएको त्रिपक्षीय सम्झौता खारेज हुनुपर्ने भन्दै ब्रिटिश गोर्खा भूतपूर्व सैनिकहरुले बुधबार काठमाडौंको शान्तिबाटिकामा प्रदर्शन गरेका छन् । उनीहरुले सो विषयमा परेको रिट निवेदनमा सर्वोच्च अदालतले दिएको निर्देशनात्मक आदेश पालना गर्न माग गरेका हुन् । ब्रिटिश गोर्खा सैनिकहरुको न्याय, समानता र स्वाभिमानका लागि आफूहरु सडकमा आउनुपरेको ब्रिटिश गोर्खा भूतपूर्व सैनिक संगठनका अध्यक्ष पदमसुन्दर लिम्बूले बताए ।\nवर्षा र सहकालका देवता रातो मत्स्येन्द्रनाथलाई बुङमतिबाट पाटन लगिएको छ । मत्स्येन्द्रनाथलाई ६ महिना पाटन र ६ महिना बुङमति राखिने चलनअनुसार बुधबार दिउँसो तःबहाल लगिएको हो । किंवदन्तीअनुसार एकपटक भिक्षा माग्न आएका गोरखनाथलाई कान्तिपुरवासीले नदिएपछि त्यसैको झोकमा उनले पशुपति मृगस्थलीमा नवनागलाई आसन बनाए ।\nश्रीस्वस्थानी माधवनारायण व्रत बिहीबार विधिवत् रूपमा सुरु भएको छ । एकमहिने स्वस्थानी व्रतका अवसरमा देशका विभिन्न स्थानमा मेला लाग्ने गर्छ । भक्तपुरको हनुमान घाटमा पनि बिहीबार बिहानै ब्रतालुहरू भेला भएर स्नान गरी पूजाआजा गरे ।\nभारतको अयोध्यामा निर्माण गरिएको राम मन्दिरमा प्राण प्रतिष्ठा गरिएसँगै नेपालमा पनि भक्तजनहरूले उत्सव मनाइरहेका छन्। सोमबार देशका प्रमुख सहरमा दीप प्रज्वलन गरिएको छ भने शोभा यात्रा निकालिएको छ । काठमाडौं उपत्यकामा पनि राम मन्दिर, हनुमान मन्दिरमा भक्तजनहरूले उत्सव मनाएका हुन्।\nचाकुका लागि नेपालमै प्रसिद्ध ठाउँ हो टोखा । माघे संक्रान्ति नजिकिँदै गर्दा टोखाका व्यवसायीहरुलाई अहिले चाकु बनाउने चटारोले छोपेको छ । मकर (माघे) संक्रान्तिमा घिउ, चाकु खाने प्रचलनका साथै जाडोयाममा शरीरलाई न्यानो र ऊर्जा दिने भएकोले यहाँका व्यवसायीहरु मसिंरदेखि माघ महिनासम्म चाकु बनाउन व्यस्त हुन्छन् ।\nपृथ्वीजयन्तीका अवसर पारेर राष्ट्रिय प्रजातन्त्र पार्टीले शुक्रबार आयोजना गरेको शुभकामना आदानप्रदान एवं चियापान कार्यक्रममा प्रधानमन्त्री पुष्पकमल दाहालसहित विभिन्न राजनीतिक दलका शीर्ष नेता सहभागी भएका छन् ।\nनेपाली पत्रकारहरूले इजरायली आक्रमणमा पत्रकारहरू परिरहेको भन्दै निन्दा गरेका छन् । सोमबार पत्रकारहरूले पाटन दरबार स्क्वायरमा प्यालेस्टिनी पत्रकारहरूको सम्झनामा दीप प्रज्वलन गर्दै इजरायली आक्रमणको निन्दा गरेका हुन् ।\nललितपुरको बालकुमारीमा शुक्रबार प्रदर्शन गर्नेक्रममा दुई युवकको मृत्यु भएको विरोधमा शनिबार युवाहरुले काठमाडौँको माइतीघरमा विरोध प्रदर्शन गरेका छन् । उनीहरुले प्रहरीको गोली लागी दुई युवकको मृत्यु भएको घटनाको विरोध गरेका थिए ।\nप्रकृति पुजारी किरात समुदायको दोस्रो महत्त्वपूर्ण चाड उधौली देशभर हर्षोल्लासका साथ मनाइएको छ । हरेक वर्ष संसिर पूर्णिमाका दिनदेखि सुरु हुने उधौली चाड मानिस, जीवजन्तु तथा चराचुरुंगी लेकतिरबाट बेँसीतिर बसाइँ सर्ने समय भएको संकेत गर्न तथा अन्नबाली भित्र्याइएको खुशियालीमा मनाउने गरिन्छ । ललितपुरमा मंगलबार किराती समुदायले किरात पूजाघरमा जम्मा भएर उधौली चाड मनाएका छन् ।'], | |
| ['Петуния белән гортензия чәчәкләренең яфрагы саргайса, нишләргә?\nАның сәбәпләре күптөрле булырга мөмкин: суны артык күп сипкәннән, талпан, үсемлек бете, хлороздан (туфракта тимер тозлары җитешмәгәнлектән, үсемлекләрнең саргаюы). Әгәр дә корткычлар күренмәсә, хлороздан «дәваларга» кирәк була.\nМоның өчен түбәндәге эремәне әзерләгез: бер чәй кашыгы лимон кислотасын аз гына җылы суда эретәбез дә, ун литр суга салабыз һәм сибәбез. Файдасы булса, профилактика өчен беничә такыр сибәсе була. Әгәр дә булышмаса, түбәндәге катнашманы кулланып карагыз: ярты чәй кашыгы тимер купоросына шуның кадәр үк лимон кислотасы һәм бер литр су салыгыз. Бу катнашманы чәчәк тирәли туфракка сибәбез, яфракларына тидермәскә тырышыгыз. Ә туфракка алдан берк ат су сибелгән булырга тиеш.\nФото: Лениногорск-информ\nСледите за самым важным и интересным в Telegram-каналеТатмедиа', 'Бик гади тоелса да, куакларны эссе су белән коендыру күп проблемаларны искәртергә ярдәм итә. Бу ысул белән "Авыл хатыны" төркеме уртаклаша.\nБеренче чиратта эссе су карлыганда кышлаган талпанны юк итә. Бу талпан, яз җитү белән бөре эчендәге яфракны ашый һәм уңышка зур зыян китерә.\nОнчыл чыкка каршы эссе суның ярдәме дә шактый. Көн җылыну белән бу авыру шаша башлый, һәм чаралар күрелмәгән очракта, җәй уртасына куакның коруы мөмкин. Бу авыруга карлыган һәм крыжовник аеруча тиз бирешә.\nЭссе су куакның тамырына зыян китерер дип куркырга ярамый. Кайнар су белән эшкәрткәннән соң, куакта чәчәкле береләр саны да бермә-бер арта икәнен исегездән чыгармагыз.\nИң мөһиме бу киңәшне кар эрегәнчегә кадәр кулланырга кирәк.'], | |
| ['上 一 篇 講 到 , 只 要 响 云 云 眾 多 嘅 強 積 金 基 金 之 中 搵 倒 Track SP500嘅 基 金 , 作 長 時 間 投 資 , 都 可 以 有 信 心 得 到 令 人 滿 意 嘅 回 報 。 咁 ……有 冇 呢 ?\n強 積 金 入 面 有 好 多 追 蹤 恒 生 指 數 嘅 基 金 , 但 係 我 就 搵 唔 倒 關 於 恒 生 指 數 比 較 有 系 統 嘅 研 究 , 唔 肯 定 長 線 投 資 就 賺 到 錢 , 所 以 我 都 係 集 中 搵 美 股 嘅 基 金 。 我 响 積 金 局 個 收 費 比 較 平 台 搵 倒 一 個 似 似 哋 嘅 美 股 基 金 。 佢 嘅 基 金 開 支 比 率 為 1.06%, 再 睇 下 佢 個 基 金 目 標 , 「 預 期 會 偏 向 先 考 慮 緊 貼 指 數 」 , 又 google吓 個 基 金 嘅 正 式 名 稱 , 竟 然 發 現 hk.morningstar.com有 佢 嘅 track record。 morningstar 用 另 一 個 指 數 – MSCI USA NR USD – 黎 同 佢 比 較 – 結 果 係 : 輸 ( 梗 輸 啦 , 跟 住 人 跑 但 係 每 一 百 步 跑 少 一 步 , 每 年 收 左 1.06%管 理 費 吖 嘛 ) 。 不 過 , 相 比 強 積 金 裡 面 同 一 地 區 股 票 類 基 金 嘅 平 均 表 現 , 佢 係 贏 嘅 。 在 2012, 2013年 分 別 升 咗 11.57%及 29.91%。 SP500呢 , 就 分 別 係 16%及 32.39%。 可 能 佢 唔 係 追 實 一 隻 指 數 啦 , 退 一 步 講 , 同 SP500一 樣 , 都 係 反 映 緊 美 股 嘅 大 市 表 現 , 都 勉 勉 強 強 接 受 佢 啦 。 啲 錢 被 困 係 強 積 金 入 面 吖 嘛 , 唯 有 揀 啲 冇 咁 差 架 啦 , 呢 啲 埋 就 係 被 篩 選 過 後 嘅 結 果 。 所 以 無 奈 地 , 我 都 打 算 利 用 強 積 金 半 自 行 , 從 而 家 被 選 擇 嘅 強 積 金 公 司 轉 走 一 部 份 錢 , 開 個 戶 口 , 投 資 一 部 分 嘅 錢 落 哩 一 個 基 金 度 。 哩 個 就 係 我 話 強 積 金 半 自 由 係 一 項 德 政 嘅 原 因 , 起 碼 可 以 將 自 己 供 果 部 份 嘅 錢 搬 去 自 己 覺 得 冇 咁 差 嘅 地 方 。 呀 ! 其 實 你 以 前 份 工 供 落 嘅 錢 , 而 家 變 成 獨 立 成 員 賬 戶 , 成 份 錢 連 埋 僱 主 供 果 啲 , 都 可 以 搬 去 唔 同 嘅 地 方 。 呢 份 錢 可 能 仲 大 份 , 千 祈 唔 好 唔 理 呀 , 果 啲 係 錢 黎 架 , 咪 當 佢 地 係 糞 土 呀 。 好 似 我 咁 , 做 吓 功 課 理 吓 佢 啦 , 理 一 次 , 之 後 由 得 佢 自 己 run就 得 架 啦 。\n附 記 :\n基 金 收 費 的 影 響\n追 蹤 指 數 基 金 唔 使 投 資 研 究 , 投 資 者 唔 要 求 佢 跑 贏 指 數 , 只 需 要 機 械 地 跟 足 指 數 嘅 成 份 買 股 , 所 以 越 平 越 好 。 我 响 MPFA網 站 搵 到 果 隻 美 股 基 金 嘅 開 支 比 率 係 1.06%, 而 VOO係 0.05%。 呢 兩 個 開 支 比 率 對 我 哋 將 來 的 退 休 金 會 有 咩 影 響 ? 那 , 就 當 你 打 30年 工 , 每 個 月 連 埋 僱 主 果 份 總 共 3000蚊 強 積 金 供 款 , 响 唔 同 嘅 大 市 回 報 率 下 , 30年 後 你 嘅 戶 口 結 餘 會 幾 多 呢 ?\n|每 年 供 款||供 款 年 期||基 開 支 比 率||大 市 回 報||淨 回 報||期 末 結 餘|\n|36000||30.00||1.06%||5%||3.94%||2,077,698|\n|36000||30.00||0.05%||5%||4.95%||2,488,746|\n|36000||30.00||1.06%||10%||8.94%||5,286,289|\n|36000||30.00||0.05%||10%||9.95%||6,449,685|\n由 於 大 家 都 係 投 資 美 股 , 預 期 回 報 每 年 係 10%。 每 年 比 人 收 多 1.01%, 30年 後 就 會 賺 少 百 幾 萬 。 果 時 嘅 百 幾 萬 以 3%嘅 通 脹 率 嚟 計 , 即 相 當 於 今 日 嘅 四 五 十 萬 , 其 實 唔 少 架 。 但 係 呢 個 已 經 係 強 積 金 同 類 基 金 之 中 收 費 最 低 嘅 一 個 , 其 他 嘅 基 金 包 括 Active Managed 或 追 蹤 指 數 嘅 , 平 均 回 報 就 更 差 , 所 以 埋 有 咁 多 人 唔 妥 強 績 金 呢 個 制 度 囉 。 我 唔 打 算 响 度 加 把 口 鬧 嘞 , 鬧 幾 多 都 冇 用 嘅 , 不 如 大 家 多 啲 關 心 自 己 嘅 MPF, 將 錢 轉 過 去 又 平 又 靚 嘅 基 金 , 比 啲 壓 力 強 積 金 公 司 , 等 佢 地 鬥 下 價 先 至 有 用 。\n要 提 提 大 家 , 唔 好 以 為 基 金 收 費 低 , 投 資 回 報 就 一 定 會 勝 人 一 籌 。 响 Forbes有 篇 研 究 報 告 就 發 現 , 如 果 將 Active Managed 嘅 基 金 嘅 收 費 分 為 四 個 等 份 , 表 現 最 好 嘅 基 金 並 唔 係 最 貴 或 最 平 果 兩 批 , 而 係 第 二 貴 果 一 批 。 如 果 唔 分 清 楚 個 基 金 係 唔 係 追 蹤 指 數 嘅 , 搵 倒 最 平 嘅 就 放 啲 錢 落 去 , 分 分 鐘 又 會 乃 嘢 。', 'This page is intended for users in Hong Kong. Go to the page for users in United States.\nHighlighted posts\nAll posts\n賺到盡:返工=自己搞生意?!\n撰文:Wantedly編集部 | 2018-10-08而家年輕一代較自主又多諗頭,周圍都講緊startup,自己搞生意嘅風氣的確係十分之盛行,之但係個個都話創業,唔通個個都咁易創業咩? 會唔會有辦法可以喺大企業返工,又享受到呢種「自己話事」嘅模式呢?企業sales可能幫到你。唔好以為sales就一定係喺舖頭做前線,今日就搵嚟HKBN 企業方案Sales Team嘅Mingo Tsang同Ray Lam…畀多啲指導你哋,一齊分享做sales嘅樂趣!「要Sell啲咩人?」呢條team主要係將商業寬頻呀、話音呀、雲端服務呀、流動通訊呀、Wi-Fi方案呀等等唔同嘅通訊科技產品同埋企業方案,sel...\n冇Degree?依然大把機會!\n撰文:Wantedly編集部 | 2018-08-16今時今日有大學學位,甚至係海龜系(外國留學回流)嘅畢業生一街都係。咁我冇大學Degree,係咪就冇出路呢?小編今次就搵嚟香港寬頻(HKBN)同大家分享吓一份唔需要Degree、平日被大家忽略咗、但其實好多機會嘅職業 — Service Technician 服務技術員。「服務技術員做咩㗎?」服務技術員有個耳熟能詳嘅稱號,冇錯就係「拉線師傅」喇。唔好以為做「拉線」,就真係駁條線咁簡單呀,真係咁容易嘅⋯⋯你自己整咪得囉係咪先?技術服務經理Jacky Lo話為咗提升員工喺客戶服務、技術同埋產品嘅知識水平,香港寬頻嘅所有師傅都要接受「CPE ...'], | |
| ["دليل المعلم\nطريقه ت صيل الابواب سنتر لوك شبحالجملة الفعلية المثبتة المصدر السعودي ص 185 السمع و الطاعةwith english translation آ 'أـ أ أ لأ.ب رنتمقوله حلوه إ اعة كاملة عن الجودة الحاسب الخادم.اخ ت بار الد ريئةاللهم ان جدي في ذمتك خاطر ه كتاب الاجتماعيات اول متوسط ف 2تقويم الفرق بين ديلونجي 1394 و 1396.مسلسا المد و الجزرHow you can learn english well وكالة لافت للدعاية والاعلان خدمات و منتجات إعلانية انواع النسك.اسرار برنامج بيقو فسي في انجليزي ن اختبر كقابات بطه ب الانقليزي.\nالجر بالإضافة المضاف و المضاف اليهافتار صور ابيض و اسود الجملة الفعلية المثبتة المصدر السعودي ص 185 السمع و الطاعةwith english translation.افلام هنديه ع شيلاتالسمع و الطاعةwith english translation آ 'أـ أ أ لأ مقوله حلوه.2م-ف2-علوم-فصل11-قبل القراءة او غمقوله حلوه إ اعة كاملة عن الجودة الحاسب الخادم.كلمة دعوة زفاف pngالحاسب الخادم اللهم ان جدي في ذمتك خاطر ه كتاب الاجتماعيات اول متوسط ف 2تقويم.كوبون شي ان 15 ف 100كتاب الاجتماعيات اول متوسط ف 2تقويم الفرق بين ديلونجي 1394 و 1396 How you can learn english well.", 'أكد الرئيس عبد الفتاح السيسي، حرصه على مصارحة الشعب المصرى، بالأخطار التي تواجهه، مؤكدا على أن "مصر مهددة".\nوقال السيسي في كلمته بـ «منتدى جريدة الأخبار» بحضور رجال الأعمال: "حديثى بمنتهى الوضوح، ومتابعين خلال الأيام اللى فاتت الدنيا ماشية، مع الوضع في الاعتبار أننا مبنخبيش أبدا حاجة في الكلام اللى بنقوله للناس علشان الناس تبقى عارفة".\n> وأضاف الرئيس: "أنا عايز أقول أن مصر مهددة وأرجو أن يكون ذلك ماثلا أمام حضراتكم ".\nوأشار السيسي إلى تحذيراته المتكررة من وضع مصر ليس هدفه إثارة القلق. قائلا: " ما بقولش كده علشان أقلقك فأنا على المستوى الشخصى كإنسان وعلى مستوى الدولة معاك وجانبك لأساعدك في كل شىء لأن نجاحك نجاحى".\nووجه الرئيس حديثه لرجال الأعمال بقوله: " النهارده لو عندى ألف رجل أعمال كل واحد عنده مليون جنيه هبقى سعيد جدا لأن دة في الآخر لمصر بيشغل الناس والناس بتاكل عيش مفيش كلام في ده".\nوتابع قائلا: " لكن في نقطة مهمة جدا ممكن واحد وهو مهتم بعمله يركز على كل مسارات النجاح فيبعده الفشل لو مخدناش بالنا من السياق العام اللى بتمر بيه منطقتنا بالكامل".\nوأكد الرئيس في حديثه، أن الله أراد نجاح مصر. قائلا: " ربنا سبحانه وتعالى أراد أن البلد دى تنجح كده إزاى أنا معرفشى في الآخر مصر عدت".\nونفى السيى، ظلمه لأى مواطن وقال: " انا إنسان واضح جدا وعندى حاجة مهمة تعرفوها حضراتكم انا مبخفش خالص ابدا ومعرفش اعمل حاجة غلط في حق أحد مقدرش اظلم حد في حاجته اللى شقى عليها وجابها ده خط أحمر وده مش مجاملة لاحد".'], | |
| ['काठमाडौं / पुर्वसभामुख कृष्णबहादुर महराले संसदबाट एमसीसी सहजै पास हुन नदिने भएपछि अमेरिका लगायत नेपालमै एमसीसी पास गराउन प्रयत्नशील राष्ट्रको बागडोर सम्हालेका केही व्यक्तिको जालझेलमा महरा कारावास पुर्याइए भन्ने किसिमका टिका टिप्पणी समेत आउन थालेका छन् ।नेपाल सरकार र अमेरिकी सरकारद्वारा गठिन मिलेनियम च्यालेन्ज कर्पोरेसन (एमसीसी) विच भएको ७७ पृष्ठ लामो सम्झौता पढ्दा थाहा भयो पुर्वसभामुख महरा वास्तवमा आफु सकिएरै भएपनि देशको अस्तित्व र अस्मिता बचाएका रहेछन् । स्वाधीन नेपालको गम्भीर असहमति हुनुपर्ने मुख्य बुँदा यहाँ प्रस्तुत गरिएको छ ।\nमहराले यस कारणले एमसीसी रोकेका थिए :\n१) अमेरिकाले नेपाललाई प्रदान गर्ने भनिएको सहयोग रकम कुन परियोजनाका लागि हो भन्ने कुरा अमेरिकाले आफै छान्ने ।\n२) एमसीसी लागू भएपछि अमेरिकाको एमसीसी परिचालन बोर्डलाई नेपालले स्वायत्त अधिकार सहित संबैधानिक मान्यता प्रदान गर्नुपर्ने ।\n३) एमसीसी परियोजना संचालनमा नेपालले कुनै पनि चासो राख्न नपाउने , कुनै सोधपुछ नै गर्न नपाउने ।\n४) एमसीसी परियोजनाको बौद्धिक सम्पत्ति अमेरिकाको हुने ।\n५) रोजगारी पनि अमेरिका कै नागरिकले पाउने ।\n६) एमसीसी परियोजना लागू भएका स्थानको जमिन, नदी , बन जेजे पर्छ सबै नेपालका सम्बन्धित मन्त्रालयले अमेरिकाको नाममा बनाइदिनुपर्ने ।\n७)एमसीसी लागू भएको ठाउँमा अमेरिकाले आफ्नो परियोजनाको सुरक्षाका लागि अमेरिकी सेना राख्ने ।\n८) एमसीसी परियोजनामा आवश्यक सम्पुर्ण सामग्री सबै अमेरिकाले नै किन्ने र नेपालले के किनेर लिएको भन्न पनि नपाउने ।\n९) अमेरिकाको परियोजनामा भारतको समर्थन अनिवार्य हुनुपर्ने ।\n१०) नेपालका एमसीसी संग बाझिएका कानुन स्वत रद्द भइ अमेरिकाको कानुन लागू हुने ।', 'खेमराज खनाल , पौष २३, कास्की , वैदेशिक रोजगार बाट फर्किएका नेपालीहरुको संस्था रिटर्नी माइग्रेन्ट नेपालको कास्की जिल्ला सम्मेलन सम्पन्न भएको छ ।\nगण्डकी प्रदेशकि सामाजिक बिकास मन्त्री नरदेवी पुनको प्रमुख आतिथ्य तामा जिल्ला समन्वय समितिको सभा हलमा उक्त कार्यक्रम आयोजना भएको हो । वैदेशिक रोजगार बाट फर्केर कास्की जिल्लामा बसोबास रत झण्डै ३०० जनाले कार्यक्रममा सहभागिता जनाएका थिए । आफुले चाहेजस्तै र खोजेजस्तै विषयबस्तु रिटर्नीहरुको अभियानले उठान गरेको र यसमा सामाजिक बिकास मन्त्रालयको साथ रहने भन्दै मन्त्री पुनले सीप बिकास तथा व्यावसायिक अभिमुखिकरण जस्ता कार्यक्रममा संस्थासंग हातेमालो गर्न इच्छुक रहेको बताउनुभयो । कार्यक्रमका बिशेष अतिथि राष्ट्रिय युवा परिषदका कार्यकारी उपाध्यक्ष माधब ढुङेलले राष्ट्रका सबै क्षेत्रमा नेतृत्व गर्न सक्ने खुबी बोकेका रिटर्नीहरु नै देशको आर्थिक समृद्धि र द्रुत बिकासको आधार भएको बताउनुभयो । उहाँले विभिन्न सीप बोकेर प्रबिधिमैत्री भएर स्वदेश फर्केको यो ठूलो तप्कालाइ सहज रोजगार र उध्यममा जोडेर आर्थिक बिकासमा गति लिनका लागि राज्यले क्रमिक रूपमा निति तथा कार्यक्रम तर्जुमा गर्ने र त्यसको नेतृत्व परिषदले गर्न तयार रहेकोे उल्लेख गर्नुभयो ।\nअहिले चर्चामा रहेको सहुलियत कर्जा सम्बन्धि निर्देशिकामा थुप्रै त्रुटी रहेको र आगामी दिनमा यो परिमार्जन हुनेमा ढुक्क रहन सहभागीहरुलाइ आस्वस्त गराउनुभयो । राष्ट्रिय युवा परिषद रिटर्नी माइग्रेन्ट नेपालको अभियानमा सहयोगी भुमिका खेल्न सधैं तत्पर रहेको बताउदै ढुङेलले परिषदकै कार्यालय परिसरमा रिटर्नीहरुको सम्पर्क कार्यालय राख्ने विषयमा पहल गरिरहेको घोषणा गर्नुभयो । कार्यक्रममा जिल्ला समन्वय समितिका सभापति बयन बहादुर क्षेत्रीले वैदेशिक रोजगारबाट फर्केका जिल्लावासिहरुको उपस्थिति, सक्रियता र स्थानीय स्तरमै आफ्ना सीप र अनुभवको प्रयोग मार्फत स्थापित हुन चाहेको अभियानले अत्यन्त खुशी दिलाएको बताउनुभयो । कार्यक्रममा संस्थाका अध्यक्ष उत्तम अधिकारीले संस्था स्थापनाको औचित्य र उद्देश्य माथी सहभागीहरुलाइ स्पष्ट पारेका थिए । सामुहिक लगानीका लागि लगानी बोर्डले परियोजना तयार पार्दै गरेको र चाडै इच्छुकहरुलाइ लगानीका लागि आव्हान गर्न गइरहेको अधिकारीले बताए ।\nसम्मेलनले बुद्धि प्रसाद सुबेदिको नेतृत्वमा १७ सदस्यीय कास्की जिल्ला समिति निर्बिरोध निर्वाचित गरेको छ । संस्थाका महासचिव लक्ष्मी प्रसाद आचार्य, सचीव कृष्ण कुमार न्यौपाने, गण्डकी प्रदेशका अध्यक्ष नेत्र नारायण थनेत तथा अन्य पदाधिकारीहरुको उपस्थितिमा उक्त कार्यक्रम सम्पन्न भएको हो ।'], | |
| ] | |
| scores = model.predict(pairs) | |
| print(scores) | |
| # [0.0311 0.0995 0.0021 0.5245 0.9941] | |
| # Or rank different texts based on similarity to a single text | |
| ranks = model.rank( | |
| "काठमाडौं : काठमाडौं प्रमुख आकर्षणका रुपमा रहेको रानीपोखरी ५ वर्षपछि भरिएको छ । खानेपानी मन्त्रालयको सहयोगमा आयोजना कार्यान्वयन निर्देशनालयले रानीपोखरीमा पानी भरेको हो । विस २०७२ सालको भूकम्पले क्षति पुर्याएको रानीपोखरी पुनर्निमाण सम्पन्न हुने चरणमा पुगेको छ ।\nयसैक्रममा राष्ट्रिय पुनर्निर्माण प्राधिकरणको अनुरोधमा निर्देशनालयले रानीपोखरीमा पानी भरिदिएको हो। यससँगै धा'र्मिक, सांस्कृतिक तथा ऐतिहासिक धरोहरको रुपमा रहेको रानीपोखरी सुन्दर र मनमोहक बनेको छ । खानेपानी तथा सरसफाई मन्त्रालय अन्तर्गतको आयोजना कार्यान्वयन निर्देशनालयले २ दिन लगाएर रानीपोखरीमा पानी भरेको निर्देशनालयका निर्देशक भोजविक्रम थापाले जानकारी दिए ।\nथापाका अनुसार रानीपोखरीमा ३ करोड लिटर पानी भरिएको हो । रानीपोखरीको लम्बाई १८० मिटर रहेको छ भने चौडाई १४० मिटर रहेको छ । जसमा पानी भर्नका लागि निर्धारण गरिएको ९ फिट गहिराईमा पानी भरिएको छ । राष्ट्रिय पुन र्निर्माण प्राधिकरणले पुनर्निर्माण गरिरहेको रानीपोखरी निर्माणको काम लगभग सम्पन्न भएको छ । प्राधिकरणका अनुसार आगामी भाइटीकाबाट सबै नागरिकका लागि रानीपोखरी तथा बालगोपालेश्वर मन्दिर सञ्चालनमा आउनेछ ।", | |
| [ | |
| 'नेपाल, भारत र बेलायतबीच सन् १९४७ मा भएको त्रिपक्षीय सम्झौता खारेज हुनुपर्ने भन्दै ब्रिटिश गोर्खा भूतपूर्व सैनिकहरुले बुधबार काठमाडौंको शान्तिबाटिकामा प्रदर्शन गरेका छन् । उनीहरुले सो विषयमा परेको रिट निवेदनमा सर्वोच्च अदालतले दिएको निर्देशनात्मक आदेश पालना गर्न माग गरेका हुन् । ब्रिटिश गोर्खा सैनिकहरुको न्याय, समानता र स्वाभिमानका लागि आफूहरु सडकमा आउनुपरेको ब्रिटिश गोर्खा भूतपूर्व सैनिक संगठनका अध्यक्ष पदमसुन्दर लिम्बूले बताए ।\nवर्षा र सहकालका देवता रातो मत्स्येन्द्रनाथलाई बुङमतिबाट पाटन लगिएको छ । मत्स्येन्द्रनाथलाई ६ महिना पाटन र ६ महिना बुङमति राखिने चलनअनुसार बुधबार दिउँसो तःबहाल लगिएको हो । किंवदन्तीअनुसार एकपटक भिक्षा माग्न आएका गोरखनाथलाई कान्तिपुरवासीले नदिएपछि त्यसैको झोकमा उनले पशुपति मृगस्थलीमा नवनागलाई आसन बनाए ।\nश्रीस्वस्थानी माधवनारायण व्रत बिहीबार विधिवत् रूपमा सुरु भएको छ । एकमहिने स्वस्थानी व्रतका अवसरमा देशका विभिन्न स्थानमा मेला लाग्ने गर्छ । भक्तपुरको हनुमान घाटमा पनि बिहीबार बिहानै ब्रतालुहरू भेला भएर स्नान गरी पूजाआजा गरे ।\nभारतको अयोध्यामा निर्माण गरिएको राम मन्दिरमा प्राण प्रतिष्ठा गरिएसँगै नेपालमा पनि भक्तजनहरूले उत्सव मनाइरहेका छन्। सोमबार देशका प्रमुख सहरमा दीप प्रज्वलन गरिएको छ भने शोभा यात्रा निकालिएको छ । काठमाडौं उपत्यकामा पनि राम मन्दिर, हनुमान मन्दिरमा भक्तजनहरूले उत्सव मनाएका हुन्।\nचाकुका लागि नेपालमै प्रसिद्ध ठाउँ हो टोखा । माघे संक्रान्ति नजिकिँदै गर्दा टोखाका व्यवसायीहरुलाई अहिले चाकु बनाउने चटारोले छोपेको छ । मकर (माघे) संक्रान्तिमा घिउ, चाकु खाने प्रचलनका साथै जाडोयाममा शरीरलाई न्यानो र ऊर्जा दिने भएकोले यहाँका व्यवसायीहरु मसिंरदेखि माघ महिनासम्म चाकु बनाउन व्यस्त हुन्छन् ।\nपृथ्वीजयन्तीका अवसर पारेर राष्ट्रिय प्रजातन्त्र पार्टीले शुक्रबार आयोजना गरेको शुभकामना आदानप्रदान एवं चियापान कार्यक्रममा प्रधानमन्त्री पुष्पकमल दाहालसहित विभिन्न राजनीतिक दलका शीर्ष नेता सहभागी भएका छन् ।\nनेपाली पत्रकारहरूले इजरायली आक्रमणमा पत्रकारहरू परिरहेको भन्दै निन्दा गरेका छन् । सोमबार पत्रकारहरूले पाटन दरबार स्क्वायरमा प्यालेस्टिनी पत्रकारहरूको सम्झनामा दीप प्रज्वलन गर्दै इजरायली आक्रमणको निन्दा गरेका हुन् ।\nललितपुरको बालकुमारीमा शुक्रबार प्रदर्शन गर्नेक्रममा दुई युवकको मृत्यु भएको विरोधमा शनिबार युवाहरुले काठमाडौँको माइतीघरमा विरोध प्रदर्शन गरेका छन् । उनीहरुले प्रहरीको गोली लागी दुई युवकको मृत्यु भएको घटनाको विरोध गरेका थिए ।\nप्रकृति पुजारी किरात समुदायको दोस्रो महत्त्वपूर्ण चाड उधौली देशभर हर्षोल्लासका साथ मनाइएको छ । हरेक वर्ष संसिर पूर्णिमाका दिनदेखि सुरु हुने उधौली चाड मानिस, जीवजन्तु तथा चराचुरुंगी लेकतिरबाट बेँसीतिर बसाइँ सर्ने समय भएको संकेत गर्न तथा अन्नबाली भित्र्याइएको खुशियालीमा मनाउने गरिन्छ । ललितपुरमा मंगलबार किराती समुदायले किरात पूजाघरमा जम्मा भएर उधौली चाड मनाएका छन् ।', | |
| 'Бик гади тоелса да, куакларны эссе су белән коендыру күп проблемаларны искәртергә ярдәм итә. Бу ысул белән "Авыл хатыны" төркеме уртаклаша.\nБеренче чиратта эссе су карлыганда кышлаган талпанны юк итә. Бу талпан, яз җитү белән бөре эчендәге яфракны ашый һәм уңышка зур зыян китерә.\nОнчыл чыкка каршы эссе суның ярдәме дә шактый. Көн җылыну белән бу авыру шаша башлый, һәм чаралар күрелмәгән очракта, җәй уртасына куакның коруы мөмкин. Бу авыруга карлыган һәм крыжовник аеруча тиз бирешә.\nЭссе су куакның тамырына зыян китерер дип куркырга ярамый. Кайнар су белән эшкәрткәннән соң, куакта чәчәкле береләр саны да бермә-бер арта икәнен исегездән чыгармагыз.\nИң мөһиме бу киңәшне кар эрегәнчегә кадәр кулланырга кирәк.', | |
| 'This page is intended for users in Hong Kong. Go to the page for users in United States.\nHighlighted posts\nAll posts\n賺到盡:返工=自己搞生意?!\n撰文:Wantedly編集部 | 2018-10-08而家年輕一代較自主又多諗頭,周圍都講緊startup,自己搞生意嘅風氣的確係十分之盛行,之但係個個都話創業,唔通個個都咁易創業咩? 會唔會有辦法可以喺大企業返工,又享受到呢種「自己話事」嘅模式呢?企業sales可能幫到你。唔好以為sales就一定係喺舖頭做前線,今日就搵嚟HKBN 企業方案Sales Team嘅Mingo Tsang同Ray Lam…畀多啲指導你哋,一齊分享做sales嘅樂趣!「要Sell啲咩人?」呢條team主要係將商業寬頻呀、話音呀、雲端服務呀、流動通訊呀、Wi-Fi方案呀等等唔同嘅通訊科技產品同埋企業方案,sel...\n冇Degree?依然大把機會!\n撰文:Wantedly編集部 | 2018-08-16今時今日有大學學位,甚至係海龜系(外國留學回流)嘅畢業生一街都係。咁我冇大學Degree,係咪就冇出路呢?小編今次就搵嚟香港寬頻(HKBN)同大家分享吓一份唔需要Degree、平日被大家忽略咗、但其實好多機會嘅職業 — Service Technician 服務技術員。「服務技術員做咩㗎?」服務技術員有個耳熟能詳嘅稱號,冇錯就係「拉線師傅」喇。唔好以為做「拉線」,就真係駁條線咁簡單呀,真係咁容易嘅⋯⋯你自己整咪得囉係咪先?技術服務經理Jacky Lo話為咗提升員工喺客戶服務、技術同埋產品嘅知識水平,香港寬頻嘅所有師傅都要接受「CPE ...', | |
| 'أكد الرئيس عبد الفتاح السيسي، حرصه على مصارحة الشعب المصرى، بالأخطار التي تواجهه، مؤكدا على أن "مصر مهددة".\nوقال السيسي في كلمته بـ «منتدى جريدة الأخبار» بحضور رجال الأعمال: "حديثى بمنتهى الوضوح، ومتابعين خلال الأيام اللى فاتت الدنيا ماشية، مع الوضع في الاعتبار أننا مبنخبيش أبدا حاجة في الكلام اللى بنقوله للناس علشان الناس تبقى عارفة".\n> وأضاف الرئيس: "أنا عايز أقول أن مصر مهددة وأرجو أن يكون ذلك ماثلا أمام حضراتكم ".\nوأشار السيسي إلى تحذيراته المتكررة من وضع مصر ليس هدفه إثارة القلق. قائلا: " ما بقولش كده علشان أقلقك فأنا على المستوى الشخصى كإنسان وعلى مستوى الدولة معاك وجانبك لأساعدك في كل شىء لأن نجاحك نجاحى".\nووجه الرئيس حديثه لرجال الأعمال بقوله: " النهارده لو عندى ألف رجل أعمال كل واحد عنده مليون جنيه هبقى سعيد جدا لأن دة في الآخر لمصر بيشغل الناس والناس بتاكل عيش مفيش كلام في ده".\nوتابع قائلا: " لكن في نقطة مهمة جدا ممكن واحد وهو مهتم بعمله يركز على كل مسارات النجاح فيبعده الفشل لو مخدناش بالنا من السياق العام اللى بتمر بيه منطقتنا بالكامل".\nوأكد الرئيس في حديثه، أن الله أراد نجاح مصر. قائلا: " ربنا سبحانه وتعالى أراد أن البلد دى تنجح كده إزاى أنا معرفشى في الآخر مصر عدت".\nونفى السيى، ظلمه لأى مواطن وقال: " انا إنسان واضح جدا وعندى حاجة مهمة تعرفوها حضراتكم انا مبخفش خالص ابدا ومعرفش اعمل حاجة غلط في حق أحد مقدرش اظلم حد في حاجته اللى شقى عليها وجابها ده خط أحمر وده مش مجاملة لاحد".', | |
| 'खेमराज खनाल , पौष २३, कास्की , वैदेशिक रोजगार बाट फर्किएका नेपालीहरुको संस्था रिटर्नी माइग्रेन्ट नेपालको कास्की जिल्ला सम्मेलन सम्पन्न भएको छ ।\nगण्डकी प्रदेशकि सामाजिक बिकास मन्त्री नरदेवी पुनको प्रमुख आतिथ्य तामा जिल्ला समन्वय समितिको सभा हलमा उक्त कार्यक्रम आयोजना भएको हो । वैदेशिक रोजगार बाट फर्केर कास्की जिल्लामा बसोबास रत झण्डै ३०० जनाले कार्यक्रममा सहभागिता जनाएका थिए । आफुले चाहेजस्तै र खोजेजस्तै विषयबस्तु रिटर्नीहरुको अभियानले उठान गरेको र यसमा सामाजिक बिकास मन्त्रालयको साथ रहने भन्दै मन्त्री पुनले सीप बिकास तथा व्यावसायिक अभिमुखिकरण जस्ता कार्यक्रममा संस्थासंग हातेमालो गर्न इच्छुक रहेको बताउनुभयो । कार्यक्रमका बिशेष अतिथि राष्ट्रिय युवा परिषदका कार्यकारी उपाध्यक्ष माधब ढुङेलले राष्ट्रका सबै क्षेत्रमा नेतृत्व गर्न सक्ने खुबी बोकेका रिटर्नीहरु नै देशको आर्थिक समृद्धि र द्रुत बिकासको आधार भएको बताउनुभयो । उहाँले विभिन्न सीप बोकेर प्रबिधिमैत्री भएर स्वदेश फर्केको यो ठूलो तप्कालाइ सहज रोजगार र उध्यममा जोडेर आर्थिक बिकासमा गति लिनका लागि राज्यले क्रमिक रूपमा निति तथा कार्यक्रम तर्जुमा गर्ने र त्यसको नेतृत्व परिषदले गर्न तयार रहेकोे उल्लेख गर्नुभयो ।\nअहिले चर्चामा रहेको सहुलियत कर्जा सम्बन्धि निर्देशिकामा थुप्रै त्रुटी रहेको र आगामी दिनमा यो परिमार्जन हुनेमा ढुक्क रहन सहभागीहरुलाइ आस्वस्त गराउनुभयो । राष्ट्रिय युवा परिषद रिटर्नी माइग्रेन्ट नेपालको अभियानमा सहयोगी भुमिका खेल्न सधैं तत्पर रहेको बताउदै ढुङेलले परिषदकै कार्यालय परिसरमा रिटर्नीहरुको सम्पर्क कार्यालय राख्ने विषयमा पहल गरिरहेको घोषणा गर्नुभयो । कार्यक्रममा जिल्ला समन्वय समितिका सभापति बयन बहादुर क्षेत्रीले वैदेशिक रोजगारबाट फर्केका जिल्लावासिहरुको उपस्थिति, सक्रियता र स्थानीय स्तरमै आफ्ना सीप र अनुभवको प्रयोग मार्फत स्थापित हुन चाहेको अभियानले अत्यन्त खुशी दिलाएको बताउनुभयो । कार्यक्रममा संस्थाका अध्यक्ष उत्तम अधिकारीले संस्था स्थापनाको औचित्य र उद्देश्य माथी सहभागीहरुलाइ स्पष्ट पारेका थिए । सामुहिक लगानीका लागि लगानी बोर्डले परियोजना तयार पार्दै गरेको र चाडै इच्छुकहरुलाइ लगानीका लागि आव्हान गर्न गइरहेको अधिकारीले बताए ।\nसम्मेलनले बुद्धि प्रसाद सुबेदिको नेतृत्वमा १७ सदस्यीय कास्की जिल्ला समिति निर्बिरोध निर्वाचित गरेको छ । संस्थाका महासचिव लक्ष्मी प्रसाद आचार्य, सचीव कृष्ण कुमार न्यौपाने, गण्डकी प्रदेशका अध्यक्ष नेत्र नारायण थनेत तथा अन्य पदाधिकारीहरुको उपस्थितिमा उक्त कार्यक्रम सम्पन्न भएको हो ।', | |
| ] | |
| ) | |
| # [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...] | |
| ``` | |
| <!-- | |
| ### Direct Usage (Transformers) | |
| <details><summary>Click to see the direct usage in Transformers</summary> | |
| </details> | |
| --> | |
| <!-- | |
| ### Downstream Usage (Sentence Transformers) | |
| You can finetune this model on your own dataset. | |
| <details><summary>Click to expand</summary> | |
| </details> | |
| --> | |
| <!-- | |
| ### Out-of-Scope Use | |
| *List how the model may foreseeably be misused and address what users ought not to do with the model.* | |
| --> | |
| ## Evaluation | |
| ### Metrics | |
| #### Cross Encoder Classification | |
| * Dataset: `fineweb_c_eval` | |
| * Evaluated with [<code>CrossEncoderClassificationEvaluator</code>](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CrossEncoderClassificationEvaluator) | |
| | Metric | Value | | |
| |:----------------------|:-----------| | |
| | accuracy | 0.9212 | | |
| | accuracy_threshold | 0.8444 | | |
| | f1 | 0.7536 | | |
| | f1_threshold | 0.7454 | | |
| | precision | 0.7712 | | |
| | recall | 0.7368 | | |
| | **average_precision** | **0.8136** | | |
| <!-- | |
| ## Bias, Risks and Limitations | |
| *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.* | |
| --> | |
| <!-- | |
| ### Recommendations | |
| *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.* | |
| --> | |
| ## Training Details | |
| ### Training Dataset | |
| #### Unnamed Dataset | |
| * Size: 13,249 training samples | |
| * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code> | |
| * Approximate statistics based on the first 100 samples: | |
| | | anchor | text | label | | |
| |:---------|:-------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------| | |
| | type | string | string | float | | |
| | modality | text | text | | | |
| | details | <ul><li>min: 89 tokens</li><li>mean: 470.35 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 102 tokens</li><li>mean: 473.45 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.15</li><li>max: 1.0</li></ul> | | |
| * Samples: | |
| | anchor | text | label | | |
| |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------| | |
| | <code>Dändändändänn-dändändändändädädän-dädäddädäädädäädä-dädäädää… Sehän on selvästi James Bondin tunnari jota tuossa tulkitsen. Se alkoi soida päässäni lukiessani juttua teknisistä ongelmista Iranissa sijaitsevissa Natanzin uraaninrikastuslaitoksessa sekä Bushehrin ydinvoimalassa.<br>Iranin ydinlaitokset ovat joutuneet vakavien cyber-iskujen kohteeksi kuluneen vuoden aikana. Syyllinen ongelmiin on huippumoderni Stuxnet-mato, joka turvallisuusasiantuntijoiden mukaan on liian hienostunut ollakseen energiajuomasta ja pizzasta voimansa saavien monniviiksisten teinien autotallissa kyhäämä. Viruksen suunnittelu ja toteutus on vaatinut kymmeniä ihmistyövuosia ja julkinen salaisuus onkin, että se on Israelin ja/tai Yhdysvaltain tiedustelupalveluiden luomus.<br>Stuxnetin tekee poikkeukselliseksi se, että se on kohdistettu erityisesti teollisuusjärjestelmiin ja Iranin tapauksessa uraanin väkevöimistä varten käytettyihin sentrifugeihin. Sentrifuugilla (ikään kuin turboahdettu vatkain) voidaan mm. erottaa e...</code> | <code>Vaimoni sai muutaman tonnin perintörahaa ja yhdessä mietimme, mitä sille tekisimme. Koska elämämme on lähes aina ollut kädestä suuhun elämistä tyyliin; tili tuli ja tili meni, niin päätimme laittaa rahat pankkiin. Olinkin pitkään haaveillut puskurirahastosta pesukoneen rikkoutumista tai jotain vastaavaa varten.<br>Käyttötilillämme oli mitätön korko, niinpä vertailin eri säästötilien korkoja. Kaupthing-pankki näytti kaikin tavoin parhaalta vaihtoehdolta. Ei kuukausimaksuja, ei nostorajoitteita ja koronmaksukin joka kuukausi. Kysyin parilta asiantuntijalta, sisältyisikö talletukseen riskejä. Molemmat olivat sitä mieltä, että talletussuojan rajoissa talletus on turvallinen.<br>Kun sitten eräänä aamuna uutisissa sanottiin pankin menneen nurin ja tilit jäädytetyt, alkoi ahdistus. Tilanne oli minulle vaikea koska, olen pitänyt kunnia-asianani hoitaa perheemme raha-asiat hyvin. Pienistä tuloistamme huolimatta ja hyvän taloudenhoidon ansiosta, olemme lähes aina kyenneet hoitamaan laskumme eräpäivään...</code> | <code>0.0</code> | | |
| | <code>- Loading...<br>इन्द्रावति र मण्डनदेउपुरका महिला सामूहि तरकारी खेतीमा सक्रिय<br>- कृषि टि.भी.<br>- २ साल अघि<br>- १९ पटक पढिएको<br>परम्परागत तरीकाबाट तरकारी खेती गर्दै आएपनि आधुनिक तरिकाबाट कसरी व्यवसयाीक तरकारी खेती गर्ने भन्ने बारेमा जानकारी नभएका सिन्धुपाल्चोक इन्द्रावति गाउँपालिकाको वडहरे र काभ्रे मण्डनदेउपुरका महिलाहरुलाई राष्ट्रिय कृषक समुह माहसंघले सहयोग गरेको छ । महासंघले सिन्धुपाल्चोक इन्द्रावती गाउँपालिकाको वडहरे र काभ्रेका मण्डन देउपुरका महिला तरकारीको विउ र वेर्ना उपलब्ध गराइ आधुनिक तरीकाबाट व्यवसायीक तरकारी खेती गर्न सहयोग गरेको हो । महासंघको सहयोग पछि व्यवसायिक रुपमा तरकारी खेती गर्ने योजना बनाएको बताउँछिन् चित्रकुमारी दर्जी ।<br>तरकारी किन्नका लागी लामो बाटो हिडेर जानुपर्ने बाध्यता थियो । तर अहिले करेसामा लठ्रम्म तरकारी फलेका छन् । तरकारी उत्पादन सँगै वरिपरिको वातावरण हरियाली र रमणीय हुदै गएको बताउँछिन् रुपा सुन्दास ।<br>व्यवसायिक तरकारी खेतीबाट बालबालीका पढाउन र घरखर्चका लागि कसैको भर पर्नु नपर्ने लक्ष्मी नेपालीको भनाई छ । आफूलाई खानमात्र तरकारी रोप्दै आएकी लक्ष्मी व्यवसायीक रुपमा तरकारी खे...</code> | <code>पुष ५, चितवन – यहाँ उत्पादित माछाको तयारी दानाले बजार नपाउँदा समस्या भएको छ । मत्स्यपालक किसानको लगानीमा स्थापना गरिएको चितवन सामुदायिक माछा दाना उद्योगमा उत्पादित दानाले बजार पाउन कठिन भएको लगानी कर्ताहरुले गुनासो गरेका छन् ।<br>पूर्वी चितवनको रत्ननगर नगरपालिका–१६ पिठुवामा सञ्चालनमा रहेको उद्योगमा डुव्ने दाना (सिंकिङ) दाना प्रतिघण्टा ३ टन र तैरने (फल्टिङ) दाना प्रतिघण्टा २ टन उत्पादन गर्ने क्षमता छ । उद्योगका अध्यक्ष वुद्धिराज चौधरीले आयातित माछा दानासँग यहाँ उत्पादित दानाले प्रतिस्पर्धा गर्न नसक्दा समस्या भएको जानकारी दिए ।<br>उनले भने 'लागत मूल्य बढी पर्दा बजार पाउन सकेन । ' नेपालमा उत्पादित दानाको मूल्य र आयातित दानाको मूल्यमा नेपालको दानाको मूल्य केही बढी पर्ने भएकाले महँगो पर्ने भन्दै माछा पालक कृषकले स्वदेशीभन्दा विदेशी दानाको प्रयोग बढी गरेको उनको भनाई छ ।<br>माछालाई आवश्यक पर्ने तत्व रहेको नेपाली दानाभन्दा कमशल दानाको प्रयोग बढी हुने गरेको उहाँले दुखेसो गरे ।<br>उनका अनुसार दानामा प्रयोग हुने कच्चापदार्थ भन्दा भारतबाट आयातित कम गुणस्तरको तयारी दानाको मूल्य कम पर्दा प्रतिस्पर्धा गर्न समस्य...</code> | <code>0.0</code> | | |
| | <code>Aliyev Ärdoğannı qotladı<br>Aliyev Ärdoğannı Ak partiya başlığı bulıp saylanuı belän qotladı<br>Azӓrbaycan dӓwlӓt başlığı İlham Aliyev qabat Ğadӓlӓt hӓm qalqınu partiyase ğomüm başlığı bulıp saylanğan Törkiyӓ ilbaşı Rӓcӓp Tayyip Ӓrdoğanğa qotlaw yullaması cibӓrde.<br>Aliyev "Ğaziz qardӓşem" dip başlağan yullamasında: "Ğadӓlӓt hӓm qalqınu partiyase başlığı bulıp qabat saylanuığıznı iñ izge telӓklӓr belӓn tӓbrik itӓm," – dide.<br>Azӓrbaycan ilbaşınıñ yullaması tübӓndӓgeçӓ yañğırıy: "Sez qorğan partiyaneñ qabat başlığı bulıp saylanuığız partiya ӓğzalӓreneñ sezgӓ bulğan ışanıçın kürsӓtep tora. Törkiyӓneñ üsüe hӓm mullığına kertkӓn zur öleşlӓregezgӓ kürsӓtelüçe qimmӓtter. Bügen Azӓrbaycan belӓn Törkiyӓneñ duslığı hӓm qardӓşlege, mönӓsӓbӓtlӓre hӓr ökӓdӓ üsep kilӓ. Bu mönӓsӓbӓt regional' iminlek hӓm totrıqlılıqnıñ urnaştırıluına da bulışa. İke yaqlı xezmӓttӓşlek, bergӓ başqarılğan zur proyektlar - strategik xezmӓttӓşlegebezne nığıtuçı möhim nӓrsӓlӓrder. Azӓrbaycan-Törkiyӓ arasındağı berlektӓşlegebez hӓm ...</code> | <code>Törkiäneñ islamçı tamırları bulğan xakimiättäge Ğädellek häm Täräqiät Partiäse, qısqaça anı AK partiä dip tä yörtälär, uzğan atna axırında ütkän parlament saylawlarında zur uñışqa ireşte. Bu inde xalıqnıñ xäzerge xökemät alıp barğan uñışlı iqtisadıy programmadan häm Yewropağa yöz totu säyäsätennän qänäğät buluın kürsätä. Saylawçılar oppozitsiäneñ AK partiä Törkiäne aqrınlap yäşerten genä Islamçılaştıra bara digän borçılularına ällä ni iğtibar itmäde kebek. Ämma bu mäsälädä kierenkelek qala birä. Konstitutsiä nigezendä Törkiäneñ dönyawi däwlätçelegen garantiäläwçe bulğan armiä älegä AK partiäneñ xakimiättä qaluına qarata üz fikeren beldermäde.<br>Törkiädä uzğan yäkşämbe könne ütkän parlament saylawlarında premyer ministr Räcäp Tayyip Erdogannıñ AK partiäse 46 protsenttan artıq tawış cıydıy. Anıñ artınnan kilüçe iñ yaqın köndäşe isä 2 märtäbädän dä kimräk tawış aldı. Bu inde 550 urınlı parlamentta AK Partiägä 340 urın bireläçäk digän süz.<br>Ankarada ciñüne bäyräm itärgä cıyılğan tarafdarları ...</code> | <code>0.0</code> | | |
| * Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters: | |
| ```json | |
| { | |
| "activation_fn": "torch.nn.modules.linear.Identity", | |
| "pos_weight": 5.0250115394592285 | |
| } | |
| ``` | |
| ### Evaluation Dataset | |
| #### Unnamed Dataset | |
| * Size: 1,472 evaluation samples | |
| * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code> | |
| * Approximate statistics based on the first 100 samples: | |
| | | anchor | text | label | | |
| |:---------|:-------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------| | |
| | type | string | string | float | | |
| | modality | text | text | | | |
| | details | <ul><li>min: 113 tokens</li><li>mean: 468.4 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 134 tokens</li><li>mean: 463.85 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.14</li><li>max: 1.0</li></ul> | | |
| * Samples: | |
| | anchor | text | label | | |
| |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------| | |
| | <code>काठमाडौं : काठमाडौं प्रमुख आकर्षणका रुपमा रहेको रानीपोखरी ५ वर्षपछि भरिएको छ । खानेपानी मन्त्रालयको सहयोगमा आयोजना कार्यान्वयन निर्देशनालयले रानीपोखरीमा पानी भरेको हो । विस २०७२ सालको भूकम्पले क्षति पुर्याएको रानीपोखरी पुनर्निमाण सम्पन्न हुने चरणमा पुगेको छ ।<br>यसैक्रममा राष्ट्रिय पुनर्निर्माण प्राधिकरणको अनुरोधमा निर्देशनालयले रानीपोखरीमा पानी भरिदिएको हो। यससँगै धा'र्मिक, सांस्कृतिक तथा ऐतिहासिक धरोहरको रुपमा रहेको रानीपोखरी सुन्दर र मनमोहक बनेको छ । खानेपानी तथा सरसफाई मन्त्रालय अन्तर्गतको आयोजना कार्यान्वयन निर्देशनालयले २ दिन लगाएर रानीपोखरीमा पानी भरेको निर्देशनालयका निर्देशक भोजविक्रम थापाले जानकारी दिए ।<br>थापाका अनुसार रानीपोखरीमा ३ करोड लिटर पानी भरिएको हो । रानीपोखरीको लम्बाई १८० मिटर रहेको छ भने चौडाई १४० मिटर रहेको छ । जसमा पानी भर्नका लागि निर्धारण गरिएको ९ फिट गहिराईमा पानी भरिएको छ । राष्ट्रिय पुन र्निर्माण प्राधिकरणले पुनर्निर्माण गरिरहेको रानीपोखरी निर्माणको काम लगभग सम्पन्न भएको छ । प्राधिकरणका अनुसार आगामी भाइटीकाबाट सबै नागरिकका लागि रानीपोखरी तथा बालगोपालेश्वर मन्दिर ...</code> | <code>नेपाल, भारत र बेलायतबीच सन् १९४७ मा भएको त्रिपक्षीय सम्झौता खारेज हुनुपर्ने भन्दै ब्रिटिश गोर्खा भूतपूर्व सैनिकहरुले बुधबार काठमाडौंको शान्तिबाटिकामा प्रदर्शन गरेका छन् । उनीहरुले सो विषयमा परेको रिट निवेदनमा सर्वोच्च अदालतले दिएको निर्देशनात्मक आदेश पालना गर्न माग गरेका हुन् । ब्रिटिश गोर्खा सैनिकहरुको न्याय, समानता र स्वाभिमानका लागि आफूहरु सडकमा आउनुपरेको ब्रिटिश गोर्खा भूतपूर्व सैनिक संगठनका अध्यक्ष पदमसुन्दर लिम्बूले बताए ।<br>वर्षा र सहकालका देवता रातो मत्स्येन्द्रनाथलाई बुङमतिबाट पाटन लगिएको छ । मत्स्येन्द्रनाथलाई ६ महिना पाटन र ६ महिना बुङमति राखिने चलनअनुसार बुधबार दिउँसो तःबहाल लगिएको हो । किंवदन्तीअनुसार एकपटक भिक्षा माग्न आएका गोरखनाथलाई कान्तिपुरवासीले नदिएपछि त्यसैको झोकमा उनले पशुपति मृगस्थलीमा नवनागलाई आसन बनाए ।<br>श्रीस्वस्थानी माधवनारायण व्रत बिहीबार विधिवत् रूपमा सुरु भएको छ । एकमहिने स्वस्थानी व्रतका अवसरमा देशका विभिन्न स्थानमा मेला लाग्ने गर्छ । भक्तपुरको हनुमान घाटमा पनि बिहीबार बिहानै ब्रतालुहरू भेला भएर स्नान गरी पूजाआजा गरे ।<br>भारतको अयोध्यामा निर्माण गरिएको राम मन्...</code> | <code>0.0</code> | | |
| | <code>Петуния белән гортензия чәчәкләренең яфрагы саргайса, нишләргә?<br>Аның сәбәпләре күптөрле булырга мөмкин: суны артык күп сипкәннән, талпан, үсемлек бете, хлороздан (туфракта тимер тозлары җитешмәгәнлектән, үсемлекләрнең саргаюы). Әгәр дә корткычлар күренмәсә, хлороздан «дәваларга» кирәк була.<br>Моның өчен түбәндәге эремәне әзерләгез: бер чәй кашыгы лимон кислотасын аз гына җылы суда эретәбез дә, ун литр суга салабыз һәм сибәбез. Файдасы булса, профилактика өчен беничә такыр сибәсе була. Әгәр дә булышмаса, түбәндәге катнашманы кулланып карагыз: ярты чәй кашыгы тимер купоросына шуның кадәр үк лимон кислотасы һәм бер литр су салыгыз. Бу катнашманы чәчәк тирәли туфракка сибәбез, яфракларына тидермәскә тырышыгыз. Ә туфракка алдан берк ат су сибелгән булырга тиеш.<br>Фото: Лениногорск-информ<br>Следите за самым важным и интересным в Telegram-каналеТатмедиа</code> | <code>Бик гади тоелса да, куакларны эссе су белән коендыру күп проблемаларны искәртергә ярдәм итә. Бу ысул белән "Авыл хатыны" төркеме уртаклаша.<br>Беренче чиратта эссе су карлыганда кышлаган талпанны юк итә. Бу талпан, яз җитү белән бөре эчендәге яфракны ашый һәм уңышка зур зыян китерә.<br>Ончыл чыкка каршы эссе суның ярдәме дә шактый. Көн җылыну белән бу авыру шаша башлый, һәм чаралар күрелмәгән очракта, җәй уртасына куакның коруы мөмкин. Бу авыруга карлыган һәм крыжовник аеруча тиз бирешә.<br>Эссе су куакның тамырына зыян китерер дип куркырга ярамый. Кайнар су белән эшкәрткәннән соң, куакта чәчәкле береләр саны да бермә-бер арта икәнен исегездән чыгармагыз.<br>Иң мөһиме бу киңәшне кар эрегәнчегә кадәр кулланырга кирәк.</code> | <code>0.0</code> | | |
| | <code>上 一 篇 講 到 , 只 要 响 云 云 眾 多 嘅 強 積 金 基 金 之 中 搵 倒 Track SP500嘅 基 金 , 作 長 時 間 投 資 , 都 可 以 有 信 心 得 到 令 人 滿 意 嘅 回 報 。 咁 ……有 冇 呢 ?<br>強 積 金 入 面 有 好 多 追 蹤 恒 生 指 數 嘅 基 金 , 但 係 我 就 搵 唔 倒 關 於 恒 生 指 數 比 較 有 系 統 嘅 研 究 , 唔 肯 定 長 線 投 資 就 賺 到 錢 , 所 以 我 都 係 集 中 搵 美 股 嘅 基 金 。 我 响 積 金 局 個 收 費 比 較 平 台 搵 倒 一 個 似 似 哋 嘅 美 股 基 金 。 佢 嘅 基 金 開 支 比 率 為 1.06%, 再 睇 下 佢 個 基 金 目 標 , 「 預 期 會 偏 向 先 考 慮 緊 貼 指 數 」 , 又 google吓 個 基 金 嘅 正 式 名 稱 , 竟 然 發 現 hk.morningstar.com有 佢 嘅 track record。 morningstar 用 另 一 個 指 數 – MSCI USA NR USD – 黎 同 佢 比 較 – 結 果 係 : 輸 ( 梗 輸 啦 , 跟 住 人 跑 但 係 每 一 百 步 跑 少 一 步 , 每 年 收 左 1.06%管 理 費 吖 嘛 ) 。 不 過 , 相 比 強 積 金 裡 面 同 一 地 區 股 票 類 基 金 嘅 平 均 表 現 , 佢 係 贏 嘅 。 在 2012, 2013年 分 別 升 咗 11.57%及 29.91%。 SP500呢 , 就 分 別 係 16%及 32.39%。 可 能 佢 唔 係 追 實 一 隻 指 數 啦 , 退 一 步 講 , 同 SP500一 樣 , 都 係 反 映 緊 美 股 嘅 大 市 表 現 , 都 勉 勉 強 強 接 受 佢 啦 。 啲 錢 被 困 係 強 積 金 入 面 吖 嘛 , 唯 有 揀 啲 冇 咁 差 架 啦 , 呢 啲 埋 就 係 被 篩 選 過 後 嘅 結 果 。 所 以 無 奈 地 , 我 都 打 算 利 用 強 積 金 半 自 行 , 從 而 家 被 選 擇 嘅 強 積 金 公 司 轉 走 一 部 份 錢 , 開 個 戶 口 , 投 資 一 部 分 嘅 錢 落 哩 一 個 基 金 度 。 ...</code> | <code>This page is intended for users in Hong Kong. Go to the page for users in United States.<br>Highlighted posts<br>All posts<br>賺到盡:返工=自己搞生意?!<br>撰文:Wantedly編集部 \| 2018-10-08而家年輕一代較自主又多諗頭,周圍都講緊startup,自己搞生意嘅風氣的確係十分之盛行,之但係個個都話創業,唔通個個都咁易創業咩? 會唔會有辦法可以喺大企業返工,又享受到呢種「自己話事」嘅模式呢?企業sales可能幫到你。唔好以為sales就一定係喺舖頭做前線,今日就搵嚟HKBN 企業方案Sales Team嘅Mingo Tsang同Ray Lam…畀多啲指導你哋,一齊分享做sales嘅樂趣!「要Sell啲咩人?」呢條team主要係將商業寬頻呀、話音呀、雲端服務呀、流動通訊呀、Wi-Fi方案呀等等唔同嘅通訊科技產品同埋企業方案,sel...<br>冇Degree?依然大把機會!<br>撰文:Wantedly編集部 \| 2018-08-16今時今日有大學學位,甚至係海龜系(外國留學回流)嘅畢業生一街都係。咁我冇大學Degree,係咪就冇出路呢?小編今次就搵嚟香港寬頻(HKBN)同大家分享吓一份唔需要Degree、平日被大家忽略咗、但其實好多機會嘅職業 — Service Technician 服務技術員。「服務技術員做咩㗎?」服務技術員有個耳熟能詳嘅稱號,冇錯就係「拉線師傅」喇。唔好以為做「拉線」,就真係駁條線咁簡單呀,真係咁容易嘅⋯⋯你自己整咪得囉係咪先?技術服務經理Jacky Lo話為咗提升員工喺客戶服務、技術同埋產品嘅知識水平,香港寬頻嘅所有師傅都要接受「CPE ...</code> | <code>0.0</code> | | |
| * Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters: | |
| ```json | |
| { | |
| "activation_fn": "torch.nn.modules.linear.Identity", | |
| "pos_weight": 5.0250115394592285 | |
| } | |
| ``` | |
| ### Training Hyperparameters | |
| #### Non-Default Hyperparameters | |
| - `per_device_train_batch_size`: 32 | |
| - `num_train_epochs`: 2 | |
| - `learning_rate`: 2e-05 | |
| - `warmup_steps`: 0.1 | |
| - `weight_decay`: 0.01 | |
| - `bf16`: True | |
| - `per_device_eval_batch_size`: 64 | |
| - `push_to_hub`: True | |
| - `hub_model_id`: davanstrien/fineweb-c-quality-reranker-v1 | |
| - `load_best_model_at_end`: True | |
| - `seed`: 12 | |
| #### All Hyperparameters | |
| <details><summary>Click to expand</summary> | |
| - `per_device_train_batch_size`: 32 | |
| - `num_train_epochs`: 2 | |
| - `max_steps`: -1 | |
| - `learning_rate`: 2e-05 | |
| - `lr_scheduler_type`: linear | |
| - `lr_scheduler_kwargs`: None | |
| - `warmup_steps`: 0.1 | |
| - `optim`: adamw_torch_fused | |
| - `optim_args`: None | |
| - `weight_decay`: 0.01 | |
| - `adam_beta1`: 0.9 | |
| - `adam_beta2`: 0.999 | |
| - `adam_epsilon`: 1e-08 | |
| - `optim_target_modules`: None | |
| - `gradient_accumulation_steps`: 1 | |
| - `average_tokens_across_devices`: True | |
| - `max_grad_norm`: 1.0 | |
| - `label_smoothing_factor`: 0.0 | |
| - `bf16`: True | |
| - `fp16`: False | |
| - `bf16_full_eval`: False | |
| - `fp16_full_eval`: False | |
| - `tf32`: None | |
| - `gradient_checkpointing`: False | |
| - `gradient_checkpointing_kwargs`: None | |
| - `torch_compile`: False | |
| - `torch_compile_backend`: None | |
| - `torch_compile_mode`: None | |
| - `use_liger_kernel`: False | |
| - `liger_kernel_config`: None | |
| - `use_cache`: False | |
| - `neftune_noise_alpha`: None | |
| - `torch_empty_cache_steps`: None | |
| - `auto_find_batch_size`: False | |
| - `log_on_each_node`: True | |
| - `logging_nan_inf_filter`: True | |
| - `include_num_input_tokens_seen`: no | |
| - `log_level`: passive | |
| - `log_level_replica`: warning | |
| - `disable_tqdm`: False | |
| - `project`: huggingface | |
| - `trackio_space_id`: None | |
| - `trackio_bucket_id`: None | |
| - `trackio_static_space_id`: None | |
| - `per_device_eval_batch_size`: 64 | |
| - `prediction_loss_only`: True | |
| - `eval_on_start`: False | |
| - `eval_do_concat_batches`: True | |
| - `eval_use_gather_object`: False | |
| - `eval_accumulation_steps`: None | |
| - `include_for_metrics`: [] | |
| - `batch_eval_metrics`: False | |
| - `save_only_model`: False | |
| - `save_on_each_node`: False | |
| - `enable_jit_checkpoint`: False | |
| - `push_to_hub`: True | |
| - `hub_private_repo`: None | |
| - `hub_model_id`: davanstrien/fineweb-c-quality-reranker-v1 | |
| - `hub_strategy`: every_save | |
| - `hub_always_push`: False | |
| - `hub_revision`: None | |
| - `load_best_model_at_end`: True | |
| - `ignore_data_skip`: False | |
| - `restore_callback_states_from_checkpoint`: False | |
| - `full_determinism`: False | |
| - `seed`: 12 | |
| - `data_seed`: None | |
| - `use_cpu`: False | |
| - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} | |
| - `parallelism_config`: None | |
| - `dataloader_drop_last`: False | |
| - `dataloader_num_workers`: 0 | |
| - `dataloader_pin_memory`: True | |
| - `dataloader_persistent_workers`: False | |
| - `dataloader_prefetch_factor`: None | |
| - `remove_unused_columns`: True | |
| - `label_names`: None | |
| - `train_sampling_strategy`: random | |
| - `length_column_name`: length | |
| - `ddp_find_unused_parameters`: None | |
| - `ddp_bucket_cap_mb`: None | |
| - `ddp_broadcast_buffers`: False | |
| - `ddp_static_graph`: None | |
| - `ddp_backend`: None | |
| - `ddp_timeout`: 1800 | |
| - `fsdp`: [] | |
| - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} | |
| - `deepspeed`: None | |
| - `debug`: [] | |
| - `skip_memory_metrics`: True | |
| - `do_predict`: False | |
| - `resume_from_checkpoint`: None | |
| - `warmup_ratio`: None | |
| - `local_rank`: -1 | |
| - `prompts`: None | |
| - `batch_sampler`: batch_sampler | |
| - `multi_dataset_batch_sampler`: proportional | |
| - `router_mapping`: {} | |
| - `learning_rate_mapping`: {} | |
| </details> | |
| ### Training Logs | |
| <details><summary>Click to expand</summary> | |
| | Epoch | Step | Training Loss | Validation Loss | fineweb_c_eval_average_precision | | |
| |:------:|:----:|:-------------:|:---------------:|:--------------------------------:| | |
| | -1 | -1 | - | - | 0.1764 | | |
| | 0.0024 | 1 | 2.2351 | - | - | | |
| | 0.0217 | 9 | 2.3781 | - | - | | |
| | 0.0434 | 18 | 1.9385 | - | - | | |
| | 0.0651 | 27 | 1.6345 | - | - | | |
| | 0.0867 | 36 | 1.3797 | - | - | | |
| | 0.1084 | 45 | 1.2646 | - | - | | |
| | 0.1301 | 54 | 1.0532 | - | - | | |
| | 0.1518 | 63 | 1.0319 | - | - | | |
| | 0.1735 | 72 | 1.2607 | - | - | | |
| | 0.1952 | 81 | 1.2275 | - | - | | |
| | 0.2 | 83 | - | 1.3164 | 0.2441 | | |
| | 0.2169 | 90 | 1.1550 | - | - | | |
| | 0.2386 | 99 | 1.1969 | - | - | | |
| | 0.2602 | 108 | 1.2051 | - | - | | |
| | 0.2819 | 117 | 1.1031 | - | - | | |
| | 0.3036 | 126 | 1.1517 | - | - | | |
| | 0.3253 | 135 | 1.1449 | - | - | | |
| | 0.3470 | 144 | 1.0654 | - | - | | |
| | 0.3687 | 153 | 1.0757 | - | - | | |
| | 0.3904 | 162 | 0.9787 | - | - | | |
| | 0.4 | 166 | - | 1.1451 | 0.3509 | | |
| | 0.4120 | 171 | 0.9056 | - | - | | |
| | 0.4337 | 180 | 1.0730 | - | - | | |
| | 0.4554 | 189 | 0.9763 | - | - | | |
| | 0.4771 | 198 | 1.1545 | - | - | | |
| | 0.4988 | 207 | 0.9918 | - | - | | |
| | 0.5205 | 216 | 0.8669 | - | - | | |
| | 0.5422 | 225 | 0.9827 | - | - | | |
| | 0.5639 | 234 | 1.1260 | - | - | | |
| | 0.5855 | 243 | 0.8437 | - | - | | |
| | 0.6 | 249 | - | 0.9002 | 0.5429 | | |
| | 0.6072 | 252 | 0.8078 | - | - | | |
| | 0.6289 | 261 | 0.9380 | - | - | | |
| | 0.6506 | 270 | 0.9621 | - | - | | |
| | 0.6723 | 279 | 1.1365 | - | - | | |
| | 0.6940 | 288 | 0.8865 | - | - | | |
| | 0.7157 | 297 | 0.8093 | - | - | | |
| | 0.7373 | 306 | 0.8601 | - | - | | |
| | 0.7590 | 315 | 0.7863 | - | - | | |
| | 0.7807 | 324 | 0.7712 | - | - | | |
| | 0.8 | 332 | - | 0.8325 | 0.5940 | | |
| | 0.8024 | 333 | 0.8844 | - | - | | |
| | 0.8241 | 342 | 0.8543 | - | - | | |
| | 0.8458 | 351 | 0.9243 | - | - | | |
| | 0.8675 | 360 | 0.8582 | - | - | | |
| | 0.8892 | 369 | 1.0085 | - | - | | |
| | 0.9108 | 378 | 0.7689 | - | - | | |
| | 0.9325 | 387 | 0.7310 | - | - | | |
| | 0.9542 | 396 | 0.6669 | - | - | | |
| | 0.9759 | 405 | 0.7300 | - | - | | |
| | 0.9976 | 414 | 0.7085 | - | - | | |
| | 1.0 | 415 | - | 0.7371 | 0.7089 | | |
| | 1.0193 | 423 | 0.6264 | - | - | | |
| | 1.0410 | 432 | 0.5014 | - | - | | |
| | 1.0627 | 441 | 0.5443 | - | - | | |
| | 1.0843 | 450 | 0.5991 | - | - | | |
| | 1.1060 | 459 | 0.6178 | - | - | | |
| | 1.1277 | 468 | 0.5769 | - | - | | |
| | 1.1494 | 477 | 0.6961 | - | - | | |
| | 1.1711 | 486 | 0.4319 | - | - | | |
| | 1.1928 | 495 | 0.6158 | - | - | | |
| | 1.2 | 498 | - | 0.7237 | 0.7076 | | |
| | 1.2145 | 504 | 0.5085 | - | - | | |
| | 1.2361 | 513 | 0.5467 | - | - | | |
| | 1.2578 | 522 | 0.6480 | - | - | | |
| | 1.2795 | 531 | 0.3993 | - | - | | |
| | 1.3012 | 540 | 0.4223 | - | - | | |
| | 1.3229 | 549 | 0.4549 | - | - | | |
| | 1.3446 | 558 | 0.4909 | - | - | | |
| | 1.3663 | 567 | 0.4309 | - | - | | |
| | 1.3880 | 576 | 0.3778 | - | - | | |
| | 1.4 | 581 | - | 0.7731 | 0.7665 | | |
| | 1.4096 | 585 | 0.3155 | - | - | | |
| | 1.4313 | 594 | 0.4425 | - | - | | |
| | 1.4530 | 603 | 0.4173 | - | - | | |
| | 1.4747 | 612 | 0.5376 | - | - | | |
| | 1.4964 | 621 | 0.4962 | - | - | | |
| | 1.5181 | 630 | 0.3638 | - | - | | |
| | 1.5398 | 639 | 0.4655 | - | - | | |
| | 1.5614 | 648 | 0.4039 | - | - | | |
| | 1.5831 | 657 | 0.3553 | - | - | | |
| | 1.6 | 664 | - | 0.5771 | 0.8063 | | |
| | 1.6048 | 666 | 0.3838 | - | - | | |
| | 1.6265 | 675 | 0.3185 | - | - | | |
| | 1.6482 | 684 | 0.4768 | - | - | | |
| | 1.6699 | 693 | 0.4672 | - | - | | |
| | 1.6916 | 702 | 0.3107 | - | - | | |
| | 1.7133 | 711 | 0.4545 | - | - | | |
| | 1.7349 | 720 | 0.4031 | - | - | | |
| | 1.7566 | 729 | 0.2858 | - | - | | |
| | 1.7783 | 738 | 0.5050 | - | - | | |
| | 1.8 | 747 | 0.5735 | 0.5351 | 0.8144 | | |
| | 1.8217 | 756 | 0.3442 | - | - | | |
| | 1.8434 | 765 | 0.2451 | - | - | | |
| | 1.8651 | 774 | 0.4761 | - | - | | |
| | 1.8867 | 783 | 0.4147 | - | - | | |
| | 1.9084 | 792 | 0.2897 | - | - | | |
| | 1.9301 | 801 | 0.6050 | - | - | | |
| | 1.9518 | 810 | 0.2979 | - | - | | |
| | 1.9735 | 819 | 0.3065 | - | - | | |
| | 1.9952 | 828 | 0.4441 | - | - | | |
| | 2.0 | 830 | - | 0.5603 | 0.8136 | | |
| </details> | |
| ### Training Time | |
| - **Training**: 12.6 minutes | |
| - **Evaluation**: 5.9 minutes | |
| - **Total**: 18.5 minutes | |
| ### Framework Versions | |
| - Python: 3.12.12 | |
| - Sentence Transformers: 5.5.0 | |
| - Transformers: 5.8.1 | |
| - PyTorch: 2.12.0+cu130 | |
| - Accelerate: 1.13.0 | |
| - Datasets: 4.8.5 | |
| - Tokenizers: 0.22.2 | |
| ## Additional Resources | |
| - [Training and Finetuning Reranker Models with Sentence Transformers](https://huggingface.co/blog/train-reranker): the end-to-end guide for training or finetuning Cross Encoder (reranker) models. | |
| - [Multimodal Embedding & Reranker Models with Sentence Transformers](https://huggingface.co/blog/multimodal-sentence-transformers): use text, image, audio, and video reranker models through the same API. | |
| - [Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers](https://huggingface.co/blog/train-multimodal-sentence-transformers): training multimodal Cross Encoders. | |
| ## Citation | |
| ### BibTeX | |
| #### Sentence Transformers | |
| ```bibtex | |
| @inproceedings{reimers-2019-sentence-bert, | |
| title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", | |
| author = "Reimers, Nils and Gurevych, Iryna", | |
| booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", | |
| month = "11", | |
| year = "2019", | |
| publisher = "Association for Computational Linguistics", | |
| url = "https://arxiv.org/abs/1908.10084", | |
| } | |
| ``` | |
| <!-- | |
| ## Glossary | |
| *Clearly define terms in order to be accessible across audiences.* | |
| --> | |
| <!-- | |
| ## Model Card Authors | |
| *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.* | |
| --> | |
| <!-- | |
| ## Model Card Contact | |
| *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.* | |
| --> |