BERT Colombiano v1

Este modelo es una versi贸n de BERT (Beto/Bert-base-spanish-cased) ajustada (fine-tuned) sobre un corpus masivo de Twitter Colombia para tareas de dialectometr铆a computacional y an谩lisis socioling眉铆stico.

Descripci贸n del Modelo

Fue entrenado para capturar las variaciones l茅xicas y sem谩nticas de las diferentes regiones de Colombia, permitiendo la extracci贸n de embeddings con alta sensibilidad dialectal.

Uso en Dialectometr铆a

Utilizado comercialmente en el pipeline de exp_dialec para la generaci贸n de centroides sem谩nticos por localidad.

Citaci贸n

Si utilizas este modelo en tu investigaci贸n, por favor cita el trabajo correspondiente de Johnatan E. Bonilla.

Downloads last month
2
Safetensors
Model size
0.1B params
Tensor type
F32
Inference Providers NEW
This model isn't deployed by any Inference Provider. 馃檵 Ask for provider support