Ajinkya Kolhe's picture

Ajinkya Kolhe

ajinkyakolhe112

·

ajinkyakolhe112

AI & ML interests

None yet

Organizations

None yet

upvoted 4 papers 9 months ago

Lets keep it simple, Using simple architectures to outperform deeper and more complex architectures

Paper • 1608.06037 • Published Aug 22, 2016 • 1

CIFAR10 to Compare Visual Recognition Performance between Deep Neural Networks and Humans

Paper • 1811.07270 • Published Nov 18, 2018 • 1

MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published Jul 4, 2025 • 166

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17, 2025 • 263

upvoted a paper 10 months ago

Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning

Paper • 2506.07044 • Published Jun 8, 2025 • 114

upvoted an article 11 months ago

Article

Vision Language Models (Better, faster, stronger)

+3

May 12, 2025

•

606

upvoted a paper 11 months ago

The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale

Paper • 2406.17557 • Published Jun 25, 2024 • 102

upvoted 13 papers 12 months ago

Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model

Paper • 2503.07703 • Published Mar 10, 2025 • 37

Scaling Vision Pre-Training to 4K Resolution

Paper • 2503.19903 • Published Mar 25, 2025 • 41

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published Mar 2, 2025 • 64

The Curse of Depth in Large Language Models

Paper • 2502.05795 • Published Feb 9, 2025 • 40

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published Feb 19, 2025 • 69

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published Feb 10, 2025 • 153

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published Jan 14, 2025 • 62

Humanity's Last Exam

Paper • 2501.14249 • Published Jan 24, 2025 • 77

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published Jan 9, 2025 • 98

TinyLLaVA: A Framework of Small-scale Large Multimodal Models

Paper • 2402.14289 • Published Feb 22, 2024 • 20

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4, 2024 • 95

A Survey on Transformer Compression

Paper • 2402.05964 • Published Feb 5, 2024 • 1

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17, 2025 • 115