Etamus commited on
Commit
559958f
verified
1 Parent(s): 283ebd7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -8
README.md CHANGED
@@ -40,14 +40,14 @@ Este modelo foi desenvolvido para uso geral e execu莽茫o de tarefas diversas, fo
40
 
41
  O Neve Strata S2 apresenta desempenho s贸lido em benchmarks de conhecimento, racioc铆nio e tarefas gerais:
42
 
43
- | Categoria | Benchmark | Neve Strata S2 | Qwen3.5-9B | Qwen3.5-4B |
44
- | :--- | :--- | :---: | :---: | :---: |
45
- | **Knowledge** | MMLU-Pro | **82.5** | 82.5 | 79.1 |
46
- | **Knowledge** | MMLU-Redux | **91.1** | 91.1 | 88.8 |
47
- | **Reasoning** | GPQA Diamond | **81.7** | 81.7 | 76.2 |
48
- | **Instruction** | IFEval | **91.5** | 91.5 | 89.8 |
49
- | **Long Context** | LongBench v2 | **55.2** | 55.2 | 50.0 |
50
- | **Agent / Tool Use** | TAU2-Bench | 79.1 | 79.1 | **79.9** |
51
 
52
  ---
53
 
 
40
 
41
  O Neve Strata S2 apresenta desempenho s贸lido em benchmarks de conhecimento, racioc铆nio e tarefas gerais:
42
 
43
+ | Categoria | Benchmark | Neve Strata S2 | Qwen3.5-4B |
44
+ | :--- | :--- | :---: | :---: |
45
+ | **Knowledge** | MMLU-Pro | **82.5** | 79.1 |
46
+ | **Knowledge** | MMLU-Redux | **91.1** | 88.8 |
47
+ | **Reasoning** | GPQA Diamond | **81.7** | 76.2 |
48
+ | **Instruction** | IFEval | **91.5** | 89.8 |
49
+ | **Long Context** | LongBench v2 | **55.2** | 50.0 |
50
+ | **Agent / Tool Use** | TAU2-Bench | 79.1 | **79.9** |
51
 
52
  ---
53