ptbr-biblical-embedding
O primeiro modelo de embeddings semânticos para busca bíblica em português brasileiro. 🇧🇷 Desenvolvido por PLVictor (plvictor.com) como parte de uma pesquisa aplicada em IA e vida espiritual cristã. 🙏🏼
O problema que resolve
Buscas bíblicas tradicionais funcionam por palavras-chave. Mas quando alguém digita "não aguento mais" ou "sinto que Deus me esqueceu", nenhuma palavra-chave encontra o versículo certo.
Este modelo entende a intenção emocional e espiritual por trás da pergunta. ⁉️
Resultados
| Query | Versículo encontrado |
|---|---|
| "sinto que Deus me abandonou" | Isaías 49:14 |
| "não consigo parar de pecar" | Romanos 7:24-25 |
| "quero desistir de tudo" | Jonas 2:6 |
| "minhas dívidas me sufocando" | Salmo 34:17 |
Como usar
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("plvictor/theo-biblical-embedding")
embeddings = model.encode(["sinto que Deus me abandonou"])
Quer usar sem hospedar nada?
Lançamos uma API mais completa que já está no ar, basta pegar seu TOKEN em plvictor.com/api/docs e usar — ela retorna o versículo, versículos secundários e uma justificativa teológica contextualizada, tudo em uma chamada só:
curl -X POST https://plvictor.com/api/embed/search \
-H "Content-Type: application/json" \
-H "Authorization: Bearer SEU_TOKEN" \
-d '{"text": "sinto que Deus me abandonou", "top_k": 3}'
Resposta:
{
"query": "sinto que Deus me abandonou",
"results": [
{
"reference": "Isaías 49:14",
"text": "Mas Sião diz: Já me desamparou o Senhor, e o meu Senhor se esqueceu de mim.",
"translation": "ARC",
"theological_justification": "O povo de Israel, no exílio, achou que Deus os tinha esquecido...",
"secondary_verses": [
{
"reference": "Hebreus 13:5",
"text": "Não te deixarei, nem te desampararei.",
"translation": "ARC"
}
]
}
]
}
BÔNUS: Versão otimizada para RK3588 (Orange Pi / Rock 5)
Convertemos o modelo para rodar na NPU do OrangePi, o arquivo é o theo-biblical-embedding.rknn que já está no repositório — pronto para rodar com rknn-toolkit-lite2==2.3.2 sem precisar converter. 😊
Detalhes do treinamento
- Base:
jmbrito/ptbr-similarity-e5-small - Dataset: ~9.000 pares query-versículo em PT-BR com justificativa teológica
- Loss: MultipleNegativesRankingLoss
- Epochs: 3
- Hardware: NVIDIA GPU (Kaggle)
Licença
Apache 2.0
- Downloads last month
- 5
Model tree for plvictor/ptbr-biblical-embedding
Base model
jmbrito/ptbr-similarity-e5-small