ptbr-biblical-embedding

O primeiro modelo de embeddings semânticos para busca bíblica em português brasileiro. 🇧🇷 Desenvolvido por PLVictor (plvictor.com) como parte de uma pesquisa aplicada em IA e vida espiritual cristã. 🙏🏼


O problema que resolve

Buscas bíblicas tradicionais funcionam por palavras-chave. Mas quando alguém digita "não aguento mais" ou "sinto que Deus me esqueceu", nenhuma palavra-chave encontra o versículo certo.

Este modelo entende a intenção emocional e espiritual por trás da pergunta. ⁉️

Resultados

Query Versículo encontrado
"sinto que Deus me abandonou" Isaías 49:14
"não consigo parar de pecar" Romanos 7:24-25
"quero desistir de tudo" Jonas 2:6
"minhas dívidas me sufocando" Salmo 34:17

Como usar

from sentence_transformers import SentenceTransformer

model = SentenceTransformer("plvictor/theo-biblical-embedding")
embeddings = model.encode(["sinto que Deus me abandonou"])

Quer usar sem hospedar nada?

Lançamos uma API mais completa que já está no ar, basta pegar seu TOKEN em plvictor.com/api/docs e usar — ela retorna o versículo, versículos secundários e uma justificativa teológica contextualizada, tudo em uma chamada só:

curl -X POST https://plvictor.com/api/embed/search \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer SEU_TOKEN" \
  -d '{"text": "sinto que Deus me abandonou", "top_k": 3}'

Resposta:

{
  "query": "sinto que Deus me abandonou",
  "results": [
    {
      "reference": "Isaías 49:14",
      "text": "Mas Sião diz: Já me desamparou o Senhor, e o meu Senhor se esqueceu de mim.",
      "translation": "ARC",
      "theological_justification": "O povo de Israel, no exílio, achou que Deus os tinha esquecido...",
      "secondary_verses": [
        {
          "reference": "Hebreus 13:5",
          "text": "Não te deixarei, nem te desampararei.",
          "translation": "ARC"
        }
      ]
    }
  ]
}

BÔNUS: Versão otimizada para RK3588 (Orange Pi / Rock 5)

Convertemos o modelo para rodar na NPU do OrangePi, o arquivo é o theo-biblical-embedding.rknn que já está no repositório — pronto para rodar com rknn-toolkit-lite2==2.3.2 sem precisar converter. 😊

Detalhes do treinamento

  • Base: jmbrito/ptbr-similarity-e5-small
  • Dataset: ~9.000 pares query-versículo em PT-BR com justificativa teológica
  • Loss: MultipleNegativesRankingLoss
  • Epochs: 3
  • Hardware: NVIDIA GPU (Kaggle)

Licença

Apache 2.0

Downloads last month
5
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for plvictor/ptbr-biblical-embedding

Finetuned
(1)
this model