SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 1024 tokens
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'พนักงานที่ได้รับการแต่งตั้งตามมาตรา 11 มีอำนาจในการบังคับใช้กฎหมายหรือไม่?',
    '[ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 11\n[ข้อความกฎหมาย:] ให้ผู้บริหารท้องถิ่นมีอำนาจแต่งตั้งพนักงานสำรวจพนักงานประเมินและพนักงานเก็บภาษีเพื่อปฏิบัติการให้เป็นไปตามพระราชบัญญัตินี้ในการปฏิบัติหน้าที่ตามพระราชบัญญัตินี้ให้พนักงานตามวรรคหนึ่งเป็นเจ้าพนักงานตามประมวลกฎหมายอาญา',
    '[ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 21\n[ข้อความกฎหมาย:] ในแต่ละจังหวัดยกเว้นกรุงเทพมหานครให้มีคณะกรรมการคณะหนึ่งเรียกว่า "คณะกรรมการภาษีที่ดินและสิ่งปลูกสร้างประจำจังหวัด" ประกอบด้วยผู้ว่าราชการจังหวัดเป็นประธานกรรมการปลัดจังหวัดเจ้าพนักงานที่ดินจังหวัดธนารักษ์พื้นที่โยธาธิการและผังเมืองจังหวัดสรรพากรพื้นที่ที่ผู้ว่าราชการจังหวัดแต่งตั้งจำนวนหนึ่งคนนายกองค์การบริหารส่วนจังหวัดนายกเทศมนตรีจำนวนห้าคนนายกองค์การบริหารส่วนตำบลจำนวนห้าคนเป็นกรรมการและให้ท้องถิ่นจังหวัดเป็นกรรมการและเลขานุการ ในกรณีที่จังหวัดใดมีผู้บริหารท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นอื่นในจังหวัดให้ผู้บริหารท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นอื่นในจังหวัดนั้นเป็นกรรมการร่วมด้วยจำนวนหนึ่งคนให้นายกเทศมนตรีนายกองค์การบริหารส่วนตำบลและผู้บริหารท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นอื่นในจังหวัดเป็นผู้พิจารณาเลือกนายกเทศมนตรีนายกองค์การบริหารส่วนตำบลหรือผู้บริหารท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นอื่นในจังหวัดตามวรรคหนึ่งและวรรคสองแล้วแต่กรณีทั้งนี้ตามระเบียบที่รัฐมนตรีว่าการกระทรวงมหาดไทยประกาศกำหนดคณะกรรมการภาษีที่ดินและสิ่งปลูกสร้างประจำจังหวัดมีหน้าที่และอำนาจพิจารณาให้ความเห็นชอบอัตราภาษีตามร่างข้อบัญญัติท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นตามมาตรา37วรรคเจ็ดให้ความเห็นชอบการลดภาษีหรือยกเว้นภาษีของผู้บริหารท้องถิ่นตามมาตรา56หรือมาตรา57และให้คำปรึกษาหรือคำแนะนำแก่ผู้บริหารท้องถิ่นเกี่ยวกับการจัดเก็บภาษีขององค์กรปกครองส่วนท้องถิ่นในจังหวัดรวมทั้งปฏิบัติการอื่นตามที่กำหนดในพระราชบัญญัตินี้ เพื่อประโยชน์แห่งมาตรานี้คำว่า"ผู้บริหารท้องถิ่นขององค์กรปกครองส่วนท้องถิ่นอื่นในจังหวัด"ให้หมายความรวมถึงนายกเมืองพัทยาด้วย',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 24,642 training samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 10 tokens
    • mean: 20.81 tokens
    • max: 37 tokens
    • min: 48 tokens
    • mean: 403.73 tokens
    • max: 736 tokens
    • min: 48 tokens
    • mean: 373.05 tokens
    • max: 1640 tokens
  • Samples:
    anchor positive negative
    พระราชบัญญัติที่กล่าวถึงในข้อความนี้มีชื่อว่าอะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 4
    [ข้อความกฎหมาย:] กฎหมาย กฎ ระเบียบและข้อบังคับใดที่ใช้บังคับอยู่ในวันก่อนวันที่พระราชบัญญัตินี้ใช้บังคับที่กล่าวถึงหรืออ้างถึงภาษีโรงเรือนและที่ดินตามกฎหมายว่าด้วยภาษีโรงเรือนและที่ดินหรือภาษีบำรุงท้องที่ตามกฎหมายว่าด้วยภาษีบำรุงท้องที่ ไม่ให้มีความหมายเป็นการกล่าวถึงหรืออ้างถึงภาษีตามพระราชบัญญัตินี้

    กฎหมายใดที่ใช้บังคับอยู่ในวันก่อนวันที่พระราชบัญญัตินี้ใช้บังคับ ซึ่งได้บัญญัติให้ทรัพย์สินของบุคคลใดได้รับยกเว้นภาษีอากรตามกฎหมายโดยมิได้ระบุถึงภาษีอากรประเภทใดประเภทหนึ่งโดยเฉพาะหรือได้รับการยกเว้นภาษีโรงเรือนและที่ดินตามกฎหมายว่าด้วยภาษีโรงเรือนและที่ดินหรือภาษีบำรุงท้องที่ตามกฎหมายว่าด้วยภาษีบำรุงท้องที่ ไม่ให้มีความหมายเป็นการยกเว้นภาษีตามพระราชบัญญัตินี้

    ความในวรรคสองมิให้ใช้บังคับกับการยกเว้นภาษีอากรตามกฎหมายที่ตราขึ้นตามข้อผูกพันที่ประเทศไทยมีอยู่ต่อองค์การสหประชาชาติ หรือตามกฎหมายระหว่างประเทศ หรือตามความตกลงระหว่างประเทศ หรือตามหลักถ้อยทีถ้อยปฏิบัติต่อกันกับนานาประเทศ
    พระราชบัญญัติที่กล่าวถึงในข้อความนี้มีชื่อว่าอะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 คำปรารภ
    [ข้อความกฎหมาย:] "พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562
    สมเด็จพระเจ้าอยู่หัวมหาวชิราลงกรณบดินทรเทพยวรางกูรให้ไว้ณวันที่9มีนาคมพ.ศ.2562เป็นปีที่4ในรัชกาลปัจจุบัน
    สมเด็จพระเจ้าอยู่หัวมหาวชิราลงกรณบดินทรเทพยวรางกูรมีพระราชโองการโปรดเกล้าฯให้ประกาศว่า
    โดยที่เป็นการสมควรปรับปรุงกฎหมายว่าด้วยภาษีโรงเรือนและที่ดินและกฎหมายว่าด้วยภาษีบำรุงท้องที่
    พระราชบัญญัตินี้มีบทบัญญัติบางประการเกี่ยวกับการจำกัดสิทธิและเสรีภาพของบุคคลซึ่งมาตรา26ประกอบกับมาตรา33และมาตรา37ของรัฐธรรมนูญแห่งราชอาณาจักรไทย
    บัญญัตินี้ให้กระทำได้โดยอาศัยอำนาจตามบทบัญญัติแห่งกฎหมาย
    เหตุผลและความจำเป็นในการจำกัดสิทธิและเสรีภาพของบุคคลตามพระราชบัญญัตินี้เพื่อให้การดำเนินการเกี่ยวกับการจัดเก็บภาษีที่ดินและสิ่งปลูกสร้างเป็นไปด้วยความเรียบร้อยและมีประสิทธิภาพอันจะเป็นประโยชน์ในด้านเศรษฐกิจของประเทศซึ่งการตราพระราชบัญญัตินี้สอดคล้องกับเงื่อนไขที่บัญญัติไว้ในมาตรา26ของรัฐธรรมนูญแห่งราชอาณาจักรไทยแล้ว
    จึงทรงพระกรุณาโปรดเกล้าฯให้ตราพระราชบัญญัติขึ้นไว้โดยคำแนะนำและยินยอมของสภานิติบัญญัติแห่งชาติทำหน้าที่รัฐสภาดังต่อไปนี้"
    พระราชบัญญัติที่กล่าวถึงในข้อความนี้มีชื่อว่าอะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 98
    [ข้อความกฎหมาย:] การดำเนินการออกกฎกระทรวงระเบียบและประกาศตามพระราชบัญญัตินี้ให้ดำเนินการให้แล้วเสร็จภายในหนึ่งร้อยยี่สิบวันนับแต่วันที่พระราชบัญญัตินี้มีผลใช้บังคับหากไม่สามารถดำเนินการได้ให้รัฐมนตรีรายงานเหตุผลที่ไม่อาจดำเนินการได้ต่อคณะรัฐมนตรีเพื่อทราบ
    ผู้รับสนองพระราชโองการพลเอกประยุทธ์จันทร์โอชานายกรัฐมนตรี
    หมายเหตุ:->เหตุผลในการประกาศใช้พระราชบัญญัติฉบับนี้คือโดยที่กฎหมายว่าด้วยภาษีโรงเรือนและที่ดินและกฎหมายว่าด้วยภาษีบำรุงท้องที่ได้ใช้บังคับมาเป็นเวลานานแล้วการจัดเก็บภาษีตามกฎหมายทั้งสองฉบับไม่เหมาะสมกับสถานการณ์ในปัจจุบันสมควรยกเลิกกฎหมายทั้งสองฉบับดังกล่าวและให้ใช้กฎหมายว่าด้วยภาษีที่ดินและสิ่งปลูกสร้างแทนโดยมีองค์กรปกครองส่วนท้องถิ่นเป็นผู้รับผิดชอบการจัดเก็บภาษีดังกล่าวจึงจำเป็นต้องตราพระราชบัญญัตินี้
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
        "triplet_margin": 0.3
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 7,060 evaluation samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 10 tokens
    • mean: 21.07 tokens
    • max: 38 tokens
    • min: 48 tokens
    • mean: 293.7 tokens
    • max: 736 tokens
    • min: 49 tokens
    • mean: 298.7 tokens
    • max: 1640 tokens
  • Samples:
    anchor positive negative
    ชื่อของพระราชบัญญัติที่เกี่ยวข้องกับภาษีที่ดินและสิ่งปลูกสร้างตามข้อความนี้คืออะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 98
    [ข้อความกฎหมาย:] การดำเนินการออกกฎกระทรวงระเบียบและประกาศตามพระราชบัญญัตินี้ให้ดำเนินการให้แล้วเสร็จภายในหนึ่งร้อยยี่สิบวันนับแต่วันที่พระราชบัญญัตินี้มีผลใช้บังคับหากไม่สามารถดำเนินการได้ให้รัฐมนตรีรายงานเหตุผลที่ไม่อาจดำเนินการได้ต่อคณะรัฐมนตรีเพื่อทราบ
    ผู้รับสนองพระราชโองการพลเอกประยุทธ์จันทร์โอชานายกรัฐมนตรี
    หมายเหตุ:->เหตุผลในการประกาศใช้พระราชบัญญัติฉบับนี้คือโดยที่กฎหมายว่าด้วยภาษีโรงเรือนและที่ดินและกฎหมายว่าด้วยภาษีบำรุงท้องที่ได้ใช้บังคับมาเป็นเวลานานแล้วการจัดเก็บภาษีตามกฎหมายทั้งสองฉบับไม่เหมาะสมกับสถานการณ์ในปัจจุบันสมควรยกเลิกกฎหมายทั้งสองฉบับดังกล่าวและให้ใช้กฎหมายว่าด้วยภาษีที่ดินและสิ่งปลูกสร้างแทนโดยมีองค์กรปกครองส่วนท้องถิ่นเป็นผู้รับผิดชอบการจัดเก็บภาษีดังกล่าวจึงจำเป็นต้องตราพระราชบัญญัตินี้
    ชื่อของพระราชบัญญัติที่เกี่ยวข้องกับภาษีที่ดินและสิ่งปลูกสร้างตามข้อความนี้คืออะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 5
    [ข้อความกฎหมาย:] ในพระราชบัญญัตินี้
    ภาษีหมายความว่าภาษีที่ดินและสิ่งปลูกสร้าง
    ผู้เสียภาษีหมายความว่าบุคคลธรรมดาหรือนิติบุคคลซึ่งเป็นเจ้าของที่ดินหรือสิ่งปลูกสร้างหรือเป็นผู้ครอบครองหรือทำประโยชน์ในที่ดินหรือสิ่งปลูกสร้างอันเป็นทรัพย์สินของรัฐซึ่งเป็นผู้มีหน้าที่เสียภาษีตามพระราชบัญญัตินี้และให้หมายความรวมถึงผู้มีหน้าที่ชำระภาษีแทนผู้เสียภาษีตามพระราชบัญญัตินี้ด้วย
    ที่ดินหมายความว่าพื้นดินและให้หมายความรวมถึงพื้นที่ที่เป็นภูเขาหรือที่มีน้ำด้วย
    สิ่งปลูกสร้างหมายความว่าโรงเรือนอาคารตึกหรือสิ่งปลูกสร้างอย่างอื่นที่บุคคลอาจเข้าอยู่อาศัยหรือใช้สอยได้หรือที่ใช้เป็นที่เก็บสินค้าหรือประกอบการอุตสาหกรรมหรือพาณิชยกรรมและให้หมายความรวมถึงห้องชุดหรือแพที่บุคคลอาจใช้อยู่อาศัยได้หรือที่มีไว้เพื่อหาผลประโยชน์ด้วย
    ห้องชุดหมายความว่าห้องชุดตามกฎหมายว่าด้วยอาคารชุดที่ได้ออกหนังสือแสดงกรรมสิทธิ์ห้องชุดแล้ว
    องค์กรปกครองส่วนท้องถิ่นหมายความว่าเทศบาลองค์การบริหารส่วนตำบลกรุงเทพมหานครเมืองพัทยาและองค์กรปกครองส่วนท้องถิ่นอื่นตามที่มีกฎหมายจัดตั้งแต่ไม่หมายความรวมถึงองค์การบริหารส่วนจังหวัด
    เขตองค์กรปกครองส่วนท้องถิ่นหมายความว่า
    ->เขตเทศบาล
    ->เขตองค์การบริหารส่วนตำบล
    ->เขตกรุงเทพมหานคร
    ->เขตเมืองพัทยา
    ->เขตองค์กรปกครองส่วนท้องถิ่นอื่นตามที่มีกฎหมายกำหนดแต่ไม่หมายความรวมถึงเขตองค์การบริหารส่วนจังหวัด
    ผู้บริหารท้องถิ่นหมายความว่า
    ->นายกเทศมนตรี
    ->นายกองค์การบริหารส่วนตำบล
    ->ผู้ว่าราชการกรุงเทพมหานคร
    ->นายกเมืองพัทยา
    ->ผู้บริหารท้องถิ่นอื่นตามที่มีกฎหมายกำหนดแต่ไม่หมายความรวมถึงนายกองค์การบริหารส่วนจังหวัด
    "ข้อบัญญัติท้องถิ่น"หมายความว่า
    ->เทศบัญญัติ
    ->ข้อบัญญัติองค์การบริหารส่วนตำบล
    ->ข้อบัญญัติกรุงเทพมหานคร
    ->ข้อบัญญัติเมืองพัทยา
    ->ข้อบัญญัติขององค์กรปกครองส่วนท้องถิ่นอื่นตามที่มีกฎหมายกำหนดแต่ไม่หมายความรวมถึงข้อบัญญัติองค์การบริหารส่วนจังหวัด
    "คณะกรรมการกำหนดราคาประเมินทุนทรัพย์"หมายความว่าคณะกรรมการกำหนดราคาประเมินทุนทรัพย์ตามประมวลกฎหมายที่ดิน
    "คณะอนุกรรมการประจำจังหวัด"หมายความว่าคณะอนุกรรมการประจำจังหวัดตามประมวลกฎหมายที่ดิน
    "คณะกรรมการพิจารณาอุทธรณ์การประเมินภาษี"หมายความว่าคณะกรรมการพิจารณาอุทธรณ์การประเมินภาษีประจำจังหวัดหรือคณะกรรมการพิจารณาอุทธรณ์การประเมินภาษีกรุงเทพมหานครแล้วแต่กรณี
    "พนักงานสำรวจ"หมายความว่าผู้ซึ่งได้รับแต่งตั้งให้มีหน้าที่สำรวจที่ดินและสิ่งปลูกสร้างที่ผู้เสียภาษีเป็นเจ้าของหรือครอบครองอยู่
    "พนักงานประเมิน"หมายความว่าผู้ซึ่งได้รับแต่งตั้งให้มีหน้าที่ประเมินภาษี
    "พนักงานเก็บภาษี"หมายความว่าผู้ซึ่งได้รับแต่งตั้งให้มีหน้าที่รับชำระภาษีและเร่งรัดการชำระภาษี
    "ปี"หมายความว่าปีปฏิทิน
    "รัฐมนตรี"หมายความว่ารัฐมนตรีผู้รักษาการตามพระราชบัญญัตินี้
    ชื่อของพระราชบัญญัติที่เกี่ยวข้องกับภาษีที่ดินและสิ่งปลูกสร้างตามข้อความนี้คืออะไร? [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 มาตรา 1
    [ข้อความกฎหมาย:] พระราชบัญญัตินี้เรียกว่า"พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562"
    [ชื่อกฎหมาย:] พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้าง พ.ศ. 2562 คำปรารภ
    [ข้อความกฎหมาย:] "พระราชบัญญัติภาษีที่ดินและสิ่งปลูกสร้างพ.ศ.2562
    สมเด็จพระเจ้าอยู่หัวมหาวชิราลงกรณบดินทรเทพยวรางกูรให้ไว้ณวันที่9มีนาคมพ.ศ.2562เป็นปีที่4ในรัชกาลปัจจุบัน
    สมเด็จพระเจ้าอยู่หัวมหาวชิราลงกรณบดินทรเทพยวรางกูรมีพระราชโองการโปรดเกล้าฯให้ประกาศว่า
    โดยที่เป็นการสมควรปรับปรุงกฎหมายว่าด้วยภาษีโรงเรือนและที่ดินและกฎหมายว่าด้วยภาษีบำรุงท้องที่
    พระราชบัญญัตินี้มีบทบัญญัติบางประการเกี่ยวกับการจำกัดสิทธิและเสรีภาพของบุคคลซึ่งมาตรา26ประกอบกับมาตรา33และมาตรา37ของรัฐธรรมนูญแห่งราชอาณาจักรไทย
    บัญญัตินี้ให้กระทำได้โดยอาศัยอำนาจตามบทบัญญัติแห่งกฎหมาย
    เหตุผลและความจำเป็นในการจำกัดสิทธิและเสรีภาพของบุคคลตามพระราชบัญญัตินี้เพื่อให้การดำเนินการเกี่ยวกับการจัดเก็บภาษีที่ดินและสิ่งปลูกสร้างเป็นไปด้วยความเรียบร้อยและมีประสิทธิภาพอันจะเป็นประโยชน์ในด้านเศรษฐกิจของประเทศซึ่งการตราพระราชบัญญัตินี้สอดคล้องกับเงื่อนไขที่บัญญัติไว้ในมาตรา26ของรัฐธรรมนูญแห่งราชอาณาจักรไทยแล้ว
    จึงทรงพระกรุณาโปรดเกล้าฯให้ตราพระราชบัญญัติขึ้นไว้โดยคำแนะนำและยินยอมของสภานิติบัญญัติแห่งชาติทำหน้าที่รัฐสภาดังต่อไปนี้"
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
        "triplet_margin": 0.3
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • overwrite_output_dir: True
  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • learning_rate: 2e-05
  • num_train_epochs: 2
  • lr_scheduler_type: cosine
  • warmup_steps: 500
  • bf16: True
  • load_best_model_at_end: True
  • optim: adamw_torch_fused

All Hyperparameters

Click to expand
  • overwrite_output_dir: True
  • do_predict: False
  • prediction_loss_only: True
  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 2
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 500
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss loss
0.0812 1000 0.1627 0.1232
0.1623 2000 0.1068 0.1005
0.2435 3000 0.0925 0.0948
0.3246 4000 0.0825 0.0842
0.4058 5000 0.0774 0.0864
0.4870 6000 0.0742 0.0699
0.5681 7000 0.0682 0.0704
0.6493 8000 0.0626 0.0624
0.7305 9000 0.0547 0.0620
0.8116 10000 0.0516 0.0561
0.8928 11000 0.0518 0.0592
0.9739 12000 0.0491 0.0559
1.0551 13000 0.034 0.0542
1.1363 14000 0.0328 0.0494
1.2174 15000 0.0282 0.0514
1.2986 16000 0.0274 0.0499
1.3798 17000 0.0232 0.0462
1.4609 18000 0.0244 0.0456
1.5421 19000 0.0212 0.0456
1.6232 20000 0.0188 0.0449
1.7044 21000 0.0184 0.0425
1.7856 22000 0.0183 0.0431
1.8667 23000 0.0193 0.0435
1.9479 24000 0.0162 0.0432
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.9
  • Sentence Transformers: 3.0.1
  • Transformers: 4.38.2
  • PyTorch: 2.4.0+cu121
  • Accelerate: 0.32.1
  • Datasets: 2.16.1
  • Tokenizers: 0.15.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

TripletLoss

@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification}, 
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}
Downloads last month
2
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for monoboard/bge-m3-thai-land-tax-legal-retrieval

Base model

BAAI/bge-m3
Finetuned
(429)
this model

Papers for monoboard/bge-m3-thai-land-tax-legal-retrieval