Instructions to use SemplificaAI/gliner2-multi-v1-onnx with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- GLiNER
How to use SemplificaAI/gliner2-multi-v1-onnx with GLiNER:
from gliner import GLiNER model = GLiNER.from_pretrained("SemplificaAI/gliner2-multi-v1-onnx") - Notebooks
- Google Colab
- Kaggle
File size: 981 Bytes
cd16a9a | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | # GLiNER2-multi-v1 (FP16 ONNX)
## Modello Base
Questo folder contiene i frammenti ONNX esportati dal modello base originale **`fastino/gliner2-multi-v1`**.
Il modello è stato convertito in precisione dimezzata (**FP16**) per ottimizzare l'uso della memoria e massimizzare le prestazioni di inferenza su NPU (Qualcomm) e GPU (CUDA).
## Struttura dei Frammenti
Data la natura dinamica di GLiNER2, il modello è suddiviso in 5 componenti indipendenti per aggirare i limiti del grafo statico ONNX:
1. `encoder_fp16.onnx`: Encoder contestuale (DeBERTa-v3-base).
2. `span_rep_fp16.onnx`: Layer per la rappresentazione degli span estratti.
3. `count_pred_fp16.onnx`: Predizione del conteggio delle entità.
4. `count_lstm_fp16.onnx`: Rete ricorrente (LSTM) per l'allineamento dei prompt.
5. `classifier_fp16.onnx`: Rete feed-forward finale per il calcolo della similarità.
## Compatibilità
Questi pesi sono testati e compatibili al 100% con il motore nativo in Rust (`gliner2-rs`).
|