rasyosef's picture
Update README.md
a022750 verified
metadata
language:
  - am
license: mit
tags:
  - sentence-transformers
  - cross-encoder
  - generated_from_trainer
  - dataset_size:491752
  - loss:BinaryCrossEntropyLoss
base_model: rasyosef/roberta-medium-amharic
pipeline_tag: text-ranking
library_name: sentence-transformers
metrics:
  - map
  - mrr@10
  - ndcg@10
model-index:
  - name: roberta-amharic-reranker-medium
    results:
      - task:
          type: cross-encoder-reranking
          name: Cross Encoder Reranking
        dataset:
          name: amh passage retrieval dev
          type: amh-passage-retrieval-dev
        metrics:
          - type: mrr@10
            value: 0.805
            name: Mrr@10
          - type: ndcg@10
            value: 0.835
            name: Ndcg@10
datasets:
  - rasyosef/Amharic-Passage-Retrieval-Dataset-V2

reranker-amharic-medium

This is a Cross Encoder model finetuned from rasyosef/roberta-medium-amharic using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.

Model Details

Model Description

  • Model Type: Cross Encoder
  • Base model: rasyosef/roberta-medium-amharic
  • Maximum Sequence Length: 510 tokens
  • Number of Output Labels: 1 label
  • Language: am
  • License: mit

Model Sources

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("rasyosef/reranker-amharic-medium")
# Get scores for pairs of texts
pairs = [
    ['ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና', 'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል። በዚህ የተነሳም የኢትዮጵያ ቡናና ሻይ ባለሥልጣንን ጨምሮ የሚመላካታቸው ሁሉ ቡና ላኪዎችና አምራቾች ያከማቹትን ቡና በፍጥነት ወደ ዓለም ገበያ እንዲያወጡ ጥሪ እያቀረቡ ነው ።'],
    ['ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና', 'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር። ከፑቲን ጋር ደግሞ ዢ ለሁለቱ አገራት ስልታዊም ሆነ ኢኮኖሚያዊ ጠቀሜታ ረጅም ጊዜ የዘለቀውን አጋርነትን ይበልጥ ማጠናከር ላይ ነበር ትኩረታቸው።']
]
scores = model.predict(pairs)
print(scores.shape)
# (2,)

# Or rank different texts based on similarity to a single text
ranks = model.rank(
    'ለውጭ ገበያ በሚቀርበው የኢትዮጵያ ቡና ላይ የተጋረጠው ፈተና',
    [
        'የኢትዮጵያ ዋነኛ የውጭ ምንዛሬ ምንጭ የሆነው ወደ ውጭ የሚላክ ቡና ዘርፍ በአሁኑ ጊዜ ከፍተኛ ውጥረት ውስጥ ገብቷል። በዚህ የተነሳም የኢትዮጵያ ቡናና ሻይ ባለሥልጣንን ጨምሮ የሚመላካታቸው ሁሉ ቡና ላኪዎችና አምራቾች ያከማቹትን ቡና በፍጥነት ወደ ዓለም ገበያ እንዲያወጡ ጥሪ እያቀረቡ ነው ።',
        'የቻይናው ፕሬዝዳንት ዚ ጂንፒንግ ከትራምፕ ጋር ባደረጉት ጉባኤ ትኩረታቸው በሁለቱ ሀገራት መካከል ለወራት ከተፈጠረ ውጥረት እና የንግድ ጦርነት በኋላ የተረገጋጋ ግንኙነትን ማስቀጠል ነበር። ከፑቲን ጋር ደግሞ ዢ ለሁለቱ አገራት ስልታዊም ሆነ ኢኮኖሚያዊ ጠቀሜታ ረጅም ጊዜ የዘለቀውን አጋርነትን ይበልጥ ማጠናከር ላይ ነበር ትኩረታቸው።',
    ]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]

Evaluation

Metrics

Cross Encoder Reranking

Metric Value
mrr@10 0.805
ndcg@10 0.835

Training Details

Training Dataset

Unnamed Dataset

  • Size: 491,752 training samples
  • Columns: query, passage, and label
  • Approximate statistics based on the first 1000 samples:
    query passage label
    type string string int
    details
    • min: 2 characters
    • mean: 49.94 characters
    • max: 283 characters
    • min: 126 characters
    • mean: 1418.88 characters
    • max: 8678 characters
    • 0: ~87.40%
    • 1: ~12.60%
  • Samples:
    query passage label
    በባሌ፣ ቦረና እና ጉጂ ዞኖች የተከሰተውን የበርሃ አንበጣ ለመከላከል ተጨማሪ አውሮፕላኖች ወደ ስፍራው ይሰማራሉ አዲስ አበባ ፣ ታህሳስ 27 ፣ 2012 (ኤፍ ቢ ሲ) የጃፓኑ ጠቅላይ ሚኒስትር ሺንዞ አቤ በመካከለኛው ምስራቅ ሃይል የማስፈር እቅድ እንዳላቸው በድጋሚ ገለጹ።ጠቅላይ ሚኒስትሩ በአካባቢው የሚንቀሳቀሱ የጃፓን መርከቦችን ደህንነት ለማረጋገጥ በስፍራው ሃይል የማስፈር እቅድ እንዳላቸው ገልጸዋል።ባለፈው ወር ጃፓን ወደ መካከለኛው ምስራቅ የጦር መርከቦችን እና ቃኝ አውሮፕላኖችን እንደምትልክ ገልጻ ነበር።የሃገሪቱ መከላከያ ሚኒስቴርም ቃኝ አውሮፕላኖቹ በተያዘው የፈረንጆቹ ጥር ወር ወደ ስፍራው እንደሚያቀኑ ገልጿል።የካቲት ወር ላይ ደግሞ የጦር መርከቦችን ወደ ስፍራው አንቀሳቅሳለሁ ብሏል።የአሁኑ የቶኪዮ እቅድ በመካከለኛው ምስራቅ የባህር ክልል የሚንቀሳቀሱ የጃፓን መርከቦችን ከጥቃት ለመከላከልና ደህንነታቸውን ለማረጋገጥ ያለመ ነው ተብሏል።አቤ በንግግራቸው በመካከለኛው ምስራቅ ያለው ወቅታዊ ሁኔታ እንዳሳሰባቸው ጠቅሰው፥ ሃገራትም አላስፈላጊ ውጥረትን እንዲያስወግዱ ጥሪ አቅርበዋል።አሜሪካ ባለፈው ዓርብ የኢራን ብሄራዊ አብዮት ዘብ ጠባቂ ሃይል አዛዥን በባግዳድ አውሮፕላን ማረፊያ ከገደለች በኋላ በመካከለኛው ምስራቅ ውጥረት ነግሷል።ኢራን ለአሜሪካ እርምጃ ከባድ አፀፋዊ ምላሽ እሰጣለሁ ስትል፥ የአሜሪካው ፕሬዚዳንት ዶናልድ ትራምፕም አሜሪካ የከፋ እርምጃ እንደምትወስድ አስጠንቅቀዋል።ምንጭ፦ ሬውተርስ 0
    ወጣቱ ምንጫቸው ባልተረጋገጠ የማኅበራዊ ሚዲያ መረጃዎች ላይ በመጠመዱ የንባብ ባህሉ መቀነሱን የእንጅባራ ከተማ ነዋሪዎቸ ተናገሩ፡፡ ባሕር ዳር፡ ግንቦት 21/2012 ዓ.ም (አብመድ) የኮሮና ቫይረስ ወረርሽኝ የትምህርት ተቋማት ተማሪዎቻቸውን እንዲበትኑ አስገድዷቸዋል፡፡ተማሪዎቹን ከትምህርት ገበታቸው ማስተጓጎሉ አሉታዊ ተፅዕኖው የከፋ ቢሆንም ስለወረርሽኑ ግንዘቤ በመፍጠር ረገድ ወደ መልካም ዕድል እየቀየሩት ያሉ አሉ፡፡ወደ ሰሜን ሸዋ ዞን በረኸት ወረዳ ባቀናንበት ወቅት ያገኘናቸው ከተለያዩ የሀገሪቱ አቅጣጫዎች ወደ ቤተሰቦቻቸው የተመለሱ ተማሪዎች እጃቸውን አጣጥፈው አልተቀመጡም፡፡ ተማሪዎቹ ለኅብረተሰቡ ስለኮሮና ቫይረስ ወረርሽኝ የሚያወቁትን እያሳወቁ ነው፡፡ተማሪ ሄኖክ ወርቁ በወላይታ ሶዶ ዩኒቨርሲቲ የሦስተኛ ዓመት የጋዜጠኝነት እና ሥነ ተግባቦት ትምህርት ክፍል ተማሪ ነው፡፡ ሄኖክ ወደ ትውልድ ቀዬው ከተመለሰ ጊዜ ጀምሮ የተለያዩ የመገናኛ ዘዴዎችን በመጠቀም ስለኮሮና ቫይረስ ወረርሽኝ ቅድመ መከላከል ከመንግሥት እና ከጤና ባለሙያዎች የሚወጡ መልእክቶችን ለኅብረተሰቡ እያስገነዘበ ነው፡፡ የግንዛቤ ፈጠራውን በ‘ሚኒ ሚዲያ’፣ በገበያ እና ሰዎች በሚሰባሰቡባቸው ቦታዎች በመገኘት ከጓደኞቹ ጋር እንደሚሠሩም ተናግሯል፡፡ ከግንዛቤ ፈጠራ ጎን ለጎን ደግሞ የዚህ ዓመት ተመራቂ ተማሪ እንደመሆኑ መጠን ጥናታዊ ጽሑፉን እየሠራ ጊዜውን በአግባባቡ እየተጠቀመ እንደሚገኝ ገልጿል፡፡ሌላኛው ያነጋገርነው ተማሪ አብርሃም ገብረኪዳን በወላይታ ሶዶ ዩኒቨርሲቲ ሦስተኛ ዓመት የሕግ ተማሪ ነው፡፡ ኅብረተሰቡ ለኮሮና ቫይረስ ወረርሽኝ እንዳይጋለጥ ሰፈር ለሰፈር፣ በገበያ ቀን ከወረዳው መዲና መተህብላ ከተማ መግቢያና መውጫ አካባቢዎች እጅ እንዲታጠቡ ከማድረግ ጀምሮ የወረርሽኙን ቅድመ መከላከል መልእክቶች በድምጽ ማጉያ (ሞንታርቦ) ተጠቅመው እያስተላለፉ እንደሆነ ተናግሯል፡፡ ተማሪዎቹ በሚያደርጉት የቅስቀሳ ግንዛቤ ማስጨበጫ ሥ... 0
    አዳማ ከተማ ከ ኢትዮጵያ ቡና – ቀጥታ የፅሁፍ ስርጭት ​79′ አዲስ ግደይተጠናቀቀ!ጨዋታው በሲዳማ ቡና አሸናፊነት ተጠናቀቀ፡፡ ሲዳ በድቻ ላይ ያለውን የበላይነት ሲያከብር ዘንድሮ በሜዳው ያለውን 100% ሪኮርድም አስጠብቋል፡፡ተጨማሪ ደቂቃ – 4 ደቂቃቢጫ ካርድ88′ ዳግም በቀለ አዲስ ግደይ ላይ በሰራው  ጥፋት ቢጫ ካርድ ተመልክቷል፡፡ በሁኔታውም ለአለም ብርሃኑ አላስፈላጊ ድርጊት በመፈፀሙ ቢጫ ተመልክቷል፡፡84′ ዳግም በቀለ ከማዕዘን የተሻማውን ኳስ በግንባሩ ገጭቶ ለጥቂት ወጣበት፡፡ የሚያስቆጭ አጋጣሚ !የተጫዋቸ ለውጥ – ሲዳማ ቡና81′ በረከት አዲሱ ወጥቶ ሙጃይድ  መሃመድ ገብቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ አናጋው ባደግ ወጥቶ አብዱልሰመድ አሊ ገብቷል፡፡ጎልልል!!! ሲዳማ ቡና79′ አዲስ ግደይ ከኤሪክ ሙራንዳ የተሻገረለትን ኳስ በግንባሩ ገጭቶ ወደ ግብነት በመቀየር ሲዳማን መሪ አድርጓል፡፡77′ በዛብህ መለዮ ከርቀት በግራ እግሩ መሬት ለመሬት አክርሮ የመታው ኳስ ለጥቂት ወጣ፡፡
    የተጫዋች ለውጥ – ወላይታ ድቻ 71′ ቴዎድሮስ መንገሻ ወጥሆ ዳግም በቀለ ገብቷል፡፡
    የተጫዋች ለውጥ – ሲዳማ ቡና71′ አንተነህ ተስፋዬ በጉዳት ወጥቶ ላኪም ሳኒ ገብቷል፡፡65′ በድጋሚ ከመስመር የተሻገረውን ኳስ ኤሪክ ሙራዳ በግንባሩ ገጭቶ የግቡ አግዳሚ መልሶበታል፡፡ ሲዳማ ቡና ጫና ፈጥሮ በማጥቃት ላይ ይገኛል፡፡63′ ከግራ መስመር ወሰኑ ማዜ ያሻማውን ኳስ አዲስ ግደይ በግንባሩ ገጭቶ የግቡን አግዳሚ ታኮ ወጥቷል፡፡የተጫዋች ለውጥ – ወላይታ ድቻ  60′ አማኑኤል ተሾመ ወጥቶ መሳይ አጪሶ ገብቷል፡፡53′ አናጋው ባደግ ከግራ መስመር ያሻገረውን ኳስ በዛብህ መለዮ አገባው ሲባል በግቡ አናት ሰደደው፡፡ የሚያስቆጭ አጋጣሚ!የተጫዋች ለውጥ – ሲዳማ
    46′ ግሩም አሰፋ ወጥቶ ኤሪክ ሙራንዳ ገብቷል፡፡
    ተጀመረ!
    ሁለተኛው አጋማሽ የጨዋታ...
    0
  • Loss: BinaryCrossEntropyLoss with these parameters:
    {
        "activation_fn": "torch.nn.modules.linear.Identity",
        "pos_weight": 7
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • learning_rate: 4e-05
  • num_train_epochs: 4
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.05
  • fp16: True
  • dataloader_num_workers: 2
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 4e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.05
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 2
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss amh-passage-retrieval-dev_ndcg@10
-1 -1 - 0.0898
1.0 7684 0.4048 0.8289
2.0 15368 0.2366 0.8546
3.0 23052 0.1588 0.8353
4.0 30736 0.1024 0.8551
-1 -1 - 0.8579
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.11.13
  • Sentence Transformers: 4.1.0
  • Transformers: 4.52.4
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.7.0
  • Datasets: 3.6.0
  • Tokenizers: 0.21.1

Citation