Grassroots Science

community

https://grassroots.science

grassroots-science

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

ljvmiranda921 authored a paper 4 days ago

ljvmiranda921 authored a paper 4 days ago

Polyglot Teachers: Evaluating Language Models for Multilingual Synthetic Data Generation

ljvmiranda921 submitted a paper 4 days ago

Polyglot Teachers: Evaluating Language Models for Multilingual Synthetic Data Generation

View all activity

authored 2 papers 4 days ago

Olmo 3

Paper • 2512.13961 • Published Dec 15, 2025 • 32

Polyglot Teachers: Evaluating Language Models for Multilingual Synthetic Data Generation

Paper • 2604.11290 • Published 5 days ago • 2

submitted a paper to Daily Papers 4 days ago

Polyglot Teachers: Evaluating Language Models for Multilingual Synthetic Data Generation

Paper • 2604.11290 • Published 5 days ago • 2

authored a paper 3 months ago

PingPong: A Natural Benchmark for Multi-Turn Code-Switching Dialogues

Paper • 2601.17277 • Published Jan 24 • 6

authored a paper 3 months ago

PingPong: A Natural Benchmark for Multi-Turn Code-Switching Dialogues

Paper • 2601.17277 • Published Jan 24 • 6

authored a paper 6 months ago

FilBench: Can LLMs Understand and Generate Filipino?

Paper • 2508.03523 • Published Aug 5, 2025 • 1

authored a paper 8 months ago

Predicting the Order of Upcoming Tokens Improves Language Modeling

Paper • 2508.19228 • Published Aug 26, 2025 • 23

authored a paper 10 months ago

Language Surgery in Multilingual Large Language Models

Paper • 2506.12450 • Published Jun 14, 2025 • 16

authored a paper 11 months ago

R3: Robust Rubric-Agnostic Reward Models

Paper • 2505.13388 • Published May 19, 2025 • 11

authored a paper 11 months ago

Crosslingual Reasoning through Test-Time Scaling

Paper • 2505.05408 • Published May 8, 2025 • 8

authored a paper 11 months ago

Crosslingual Reasoning through Test-Time Scaling

Paper • 2505.05408 • Published May 8, 2025 • 8

authored 4 papers 11 months ago

SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages

Paper • 2406.10118 • Published Jun 14, 2024 • 32

Humanity's Last Exam

Paper • 2501.14249 • Published Jan 24, 2025 • 77

Towards Understanding the Fragility of Multilingual LLMs against Fine-Tuning Attacks

Paper • 2410.18210 • Published Oct 23, 2024

Crosslingual Reasoning through Test-Time Scaling

Paper • 2505.05408 • Published May 8, 2025 • 8

authored a paper 12 months ago

Softpick: No Attention Sink, No Massive Activations with Rectified Softmax

Paper • 2504.20966 • Published Apr 29, 2025 • 31

authored 2 papers about 1 year ago

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published Feb 19, 2025 • 48

Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia

Paper • 2503.07920 • Published Mar 10, 2025 • 101

authored a paper about 1 year ago

Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia

Paper • 2503.07920 • Published Mar 10, 2025 • 101

authored a paper about 1 year ago

Sailor2: Sailing in South-East Asia with Inclusive Multilingual LLMs

Paper • 2502.12982 • Published Feb 18, 2025 • 19