Etamus commited on
Commit
f0debc8
·
verified ·
1 Parent(s): 7fe0f41

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +73 -3
README.md CHANGED
@@ -1,3 +1,73 @@
1
- ---
2
- license: mit
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ library_name: transformers
3
+ license: apache-2.0
4
+ license_link: https://huggingface.co/Qwen/Qwen3.5-4B/blob/main/LICENSE
5
+ pipeline_tag: image-text-to-text
6
+ base_model:
7
+ - Qwen/Qwen3.5-4B
8
+ tags:
9
+ - NeveAI
10
+ - Neve
11
+ - StrataS
12
+ ---
13
+
14
+ ![logo](https://cdn-uploads.huggingface.co/production/uploads/68a3ba234a7dfca33d72eee2/X8yT_bs-SBFl26VTGdoIY.png)
15
+
16
+ <h1 align="center">Neve-Strata-S2-4B-GGUF</h1>
17
+
18
+ <div style="display: flex; justify-content: center; gap: 5px; align-items: center; margin-bottom: 20px;">
19
+ <a href="https://github.com/NeveIA">
20
+ <img src="https://img.shields.io/badge/NeveAI-Organization-blue?style=for-the-badge&logo=github" alt="NeveAI GitHub">
21
+ </a>
22
+ </div>
23
+
24
+ ## Introdução
25
+
26
+ O **Neve Strata S2** é um modelo de linguagem de última geração focado em **programação e raciocínio para execução em escala**. Esta versão em formato GGUF foi otimizada pela NeveAI para oferecer o equilíbrio ideal entre precisão lógica e eficiência computacional.
27
+
28
+ ---
29
+
30
+ ## Destaques do Modelo
31
+
32
+ Este modelo foi desenvolvido para uso geral e execução de tarefas diversas, focando em:
33
+
34
+ * **Unified Multimodal Understanding:** Treinamento com fusão antecipada de tokens multimodais, garantindo forte desempenho em tarefas de texto e compreensão visual.
35
+ * **Arquitetura Híbrida Eficiente:** Combinação de Gated Delta Networks com Mixture-of-Experts, proporcionando alta performance com baixa latência.
36
+ * **Raciocínio e Generalização:** Otimizado com técnicas avançadas de reinforcement learning para lidar com tarefas complexas e cenários do mundo real.
37
+ * **Cobertura Multilíngue Global:** Suporte expandido para múltiplos idiomas, garantindo aplicação ampla em diferentes contextos culturais e linguísticos.
38
+
39
+ ## Benchmark de Performance
40
+
41
+ O Neve Strata S2 apresenta desempenho sólido em benchmarks de conhecimento, raciocínio e tarefas gerais:
42
+
43
+ | Categoria | Benchmark | Neve Strata S2 | Qwen3.5-9B | Qwen3.5-4B |
44
+ | :--- | :--- | :---: | :---: | :---: |
45
+ | **Knowledge** | MMLU-Pro | **82.5** | 82.5 | 79.1 |
46
+ | **Knowledge** | MMLU-Redux | **91.1** | 91.1 | 88.8 |
47
+ | **Reasoning** | GPQA Diamond | **81.7** | 81.7 | 76.2 |
48
+ | **Instruction** | IFEval | **91.5** | 91.5 | 89.8 |
49
+ | **Long Context** | LongBench v2 | **55.2** | 55.2 | 50.0 |
50
+ | **Agent / Tool Use** | TAU2-Bench | 79.1 | 79.1 | **79.9** |
51
+
52
+ ---
53
+
54
+ ## Detalhes da Arquitetura
55
+
56
+ - **Arquitetura:** Gated DeltaNet + Mixture of Experts (MoE).
57
+ - **Parâmetros:** ~4B parâmetros.
58
+ - **Janela de Contexto:** 262.144 tokens nativos (extensível até ~1M).
59
+ - **Camadas:** 32 camadas com estrutura híbrida intercalando DeltaNet e Attention.
60
+ - **Multimodalidade:** Suporte a texto e visão com encoder integrado.
61
+
62
+ ## Como utilizar (GGUF)
63
+
64
+ Este modelo é compatível com `llama.cpp`, `Ollama`, `LM Studio` e outras ferramentas que suportam o formato GGUF.
65
+ Foco direcionado ao uso do modelo na plataforma autoral da organização [NeveAI](https://github.com/Etamus/NeveAI)
66
+
67
+ ## Licença
68
+
69
+ Este repositório e os pesos do modelo estão licenciados sob a [Licença Apache 2.0](LICENSE).
70
+
71
+ ## Contato
72
+
73
+ Se tiver qualquer dúvida, por favor, levante um issue ou entre em contato conosco em [NeveIA](https://github.com/NeveIA).