Jelena Mitrović's picture

Jelena Mitrović

Jecovit

·

https://ca-roll.github.io/

AI & ML interests

NLP, LLMs

Recent Activity

upvoted an article 8 days ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a dataset 15 days ago

mteb/WebFAQRetrieval

upvoted an article 9 months ago

Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval

View all activity

Organizations

upvoted an article 8 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

Jan 30, 2025

•

293

upvoted an article 9 months ago

Article

Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval

+1

Mar 22, 2024

•

130