diff --git "a/README.md" "b/README.md" --- "a/README.md" +++ "b/README.md" @@ -5,24 +5,21 @@ tags: - text-classification - generated_from_setfit_trainer widget: -- text: '상품명 : 애견 고양이 펫밀크 반려동물 우유 관절 피모 장건강 10개입 매핑_카테고리1 : (#M)생활/건강>반려동물>고양이 사료>분유/우유 - 매핑_카테고리2 : MP > traverse > Naverstore > 반려동물용품 > 고양이용품 > 사료 옵션명 : ' -- text: '매핑_카테고리2 : MP > Naverstore > 반려동물용품 > 강아지용품 > 건강/관리용품 > 유산균 옵션명 : ▶사은품04_심장 - 30p 상품명 : 종근당 라비벳 강아지 유산균 장건강 심장 30p 매핑_카테고리1 : (#M)생활/건강>반려동물>강아지 건강/관리용품>강아지유산균 ' -- text: '매핑_카테고리2 : Naverstore > marskorea브랜드스토어 > 강아지 사료 상품명 : 시저 홀썸볼 닭 당근 보리 콩 85g - 강아지사료 옵션명 : 매핑_카테고리1 : (#M)홈>강아지 사료>시저 홀썸볼 ' -- text: '매핑_카테고리2 : Naverstore > 반려동물용품 > 고양이용품 > 사료 > 건식 옵션명 : 1EA 매핑_카테고리1 : (#M)홈>생활/건강>반려동물>고양이 - 사료>건식사료 상품명 : 피부모질관리 전연령묘용 고양이사료 5kg 반려식품 ' -- text: '매핑_카테고리2 : Naverstore > 반려동물용품 > 고양이용품 > 사료 > 동결건조 상품명 : [하프클럽/친절한도그씨]생식본능 - LID 토끼 캣 2kg 고양이사료 옵션명 : 매핑_카테고리1 : 생활/건강>반려동물>고양이 사료>동결건조 사료 ' +- text: '상품명 : 틸리전트 강아지 안전문 울타리 펜스 매핑_카테고리2 : T200 > Naverstore > 반려동물용품 > 강아지용품 > + 리빙용품 > 안전문 매핑_카테고리1 : (#M)생활/건강>반려동물>리빙용품>안전문 옵션명 : 단일색상_059-066cm ' +- text: '상품명 : 내추럴발란스 인도어 고양이 포뮬라 1.36kg 옵션명 : 매핑_카테고리1 : 홈>고양이사료;(#M)홈>고양이사료>내추럴발란스 + 매핑_카테고리2 : Naverstore > 반려동물용품 > 고양이용품 > 사료 > 건식 ' +- text: '상품명 : 멸균우유 표준화우유 수입멸균 밀키스마 200ml X 24개 267498 옵션명 : ' +- text: '상품명 : 간식+오가앤리프 유기농 가수분해 강아지사료 눈물 피부 1.8kg 5.6kg 옵션명 : 오리&초록입홍합 1.8kg_불리스틱(초소형) + 2개 ' +- text: '옵션명 : 스테인리스 캠핑앤펫보틀 1.1L_블루실버 상품명 : 캐나다 아소부 강아지물통 산책 물병 ' metrics: - accuracy pipeline_tag: text-classification library_name: setfit inference: true -base_model: intfloat/multilingual-e5-base model-index: -- name: SetFit with intfloat/multilingual-e5-base +- name: SetFit results: - task: type: text-classification @@ -33,13 +30,13 @@ model-index: split: test metrics: - type: accuracy - value: 0.7847983933261239 + value: 0.8503521126760564 name: Accuracy --- -# SetFit with intfloat/multilingual-e5-base +# SetFit -This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification. +This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification. The model has been trained using an efficient few-shot learning technique that involves: @@ -50,7 +47,7 @@ The model has been trained using an efficient few-shot learning technique that i ### Model Description - **Model Type:** SetFit -- **Sentence Transformer body:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) + - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance - **Maximum Sequence Length:** 512 tokens - **Number of Classes:** 124 classes @@ -65,139 +62,139 @@ The model has been trained using an efficient few-shot learning technique that i - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit) ### Model Labels -| Label | Examples | -|:------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| -| 33 | | -| 42 | | -| 99 | | -| 94 | | -| 98 | | -| 30 | | -| 122 | | -| 13 | | -| 50 | | -| 82 | | -| 120 | | -| 63 | | -| 53 | | -| 55 | | -| 97 | | -| 58 | | -| 80 | | -| 46 | | -| 34 | | -| 81 | | -| 105 | | -| 0 | | -| 111 | | -| 47 | | -| 1 | | -| 85 | | -| 40 | | -| 96 | | -| 101 | | -| 67 | | -| 107 | | -| 112 | | -| 49 | | -| 95 | | -| 4 | | -| 60 | | -| 75 | | -| 118 | | -| 108 | | -| 65 | | -| 41 | | -| 115 | | -| 52 | | -| 93 | | -| 22 | | -| 35 | | -| 114 | | -| 48 | | -| 6 | | -| 78 | | -| 26 | | -| 14 | | -| 29 | | -| 59 | | -| 102 | | -| 51 | | -| 79 | | -| 28 | | -| 24 | | -| 66 | | -| 72 | | -| 121 | | -| 62 | | -| 45 | | -| 83 | | -| 77 | | -| 36 | | -| 3 | | -| 5 | | -| 113 | | -| 7 | | -| 87 | | -| 91 | | -| 71 | | -| 89 | | -| 27 | | -| 43 | | -| 117 | | -| 110 | | -| 8 | | -| 103 | | -| 38 | | -| 69 | | -| 39 | | -| 31 | | -| 88 | | -| 57 | | -| 84 | | -| 11 | | -| 109 | | -| 21 | | -| 9 | | -| 10 | | -| 76 | | -| 90 | | -| 37 | | -| 54 | | -| 61 | | -| 56 | | -| 18 | | -| 119 | | -| 25 | | -| 73 | | -| 23 | | -| 106 | | -| 116 | | -| 100 | | -| 86 | | -| 74 | | -| 104 | | -| 32 | | -| 2 | | -| 16 | | -| 64 | | -| 19 | | -| 70 | | -| 44 | | -| 15 | | -| 92 | | -| 123 | | -| 17 | | -| 68 | | -| 20 | | -| 12 | | +| Label | Examples | +|:------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| +| 122 | | +| 6 | | +| 116 | | +| 0 | | +| 24 | | +| 15 | | +| 21 | | +| 52 | | +| 14 | | +| 33 | | +| 53 | | +| 45 | | +| 76 | | +| 65 | | +| 77 | | +| 48 | | +| 71 | | +| 64 | | +| 107 | | +| 117 | | +| 70 | | +| 98 | | +| 44 | | +| 29 | | +| 102 | | +| 88 | | +| 86 | | +| 62 | | +| 30 | | +| 108 | | +| 73 | | +| 22 | | +| 57 | | +| 31 | | +| 23 | | +| 75 | | +| 100 | | +| 95 | | +| 85 | | +| 105 | | +| 96 | | +| 63 | | +| 39 | | +| 69 | | +| 82 | | +| 37 | | +| 47 | | +| 2 | | +| 42 | | +| 58 | | +| 18 | | +| 7 | | +| 81 | | +| 50 | | +| 49 | | +| 87 | | +| 83 | | +| 46 | | +| 60 | | +| 28 | | +| 66 | | +| 84 | | +| 61 | | +| 26 | | +| 109 | | +| 4 | | +| 120 | | +| 104 | | +| 13 | | +| 72 | | +| 59 | | +| 19 | | +| 106 | | +| 51 | | +| 101 | | +| 36 | | +| 91 | | +| 113 | | +| 119 | | +| 112 | | +| 10 | | +| 34 | | +| 78 | | +| 103 | | +| 1 | | +| 89 | | +| 8 | | +| 25 | | +| 110 | | +| 41 | | +| 35 | | +| 94 | | +| 12 | | +| 97 | | +| 90 | | +| 56 | | +| 3 | | +| 93 | | +| 38 | | +| 80 | | +| 43 | | +| 111 | | +| 55 | | +| 118 | | +| 99 | | +| 115 | | +| 16 | | +| 79 | | +| 9 | | +| 27 | | +| 114 | | +| 5 | | +| 74 | | +| 121 | | +| 40 | | +| 20 | | +| 17 | | +| 11 | | +| 92 | | +| 54 | | +| 67 | | +| 32 | | +| 123 | | +| 68 | | ## Evaluation ### Metrics | Label | Accuracy | |:--------|:---------| -| **all** | 0.7848 | +| **all** | 0.8504 | ## Uses @@ -217,7 +214,7 @@ from setfit import SetFitModel # Download from the 🤗 Hub model = SetFitModel.from_pretrained("mini1013/master_item_ps_flat") # Run inference -preds = model("매핑_카테고리2 : Naverstore > marskorea브랜드스토어 > 강아지 사료 상품명 : 시저 홀썸볼 닭 당근 보리 콩 85g 강아지사료 옵션명 : 매핑_카테고리1 : (#M)홈>강아지 사료>시저 홀썸볼 ") +preds = model("상품명 : 멸균우유 표준화우유 수입멸균 밀키스마 200ml X 24개 267498 옵션명 : ") ```