2 245 92

Raja Biswas

rbiswasfc

AI & ML interests

NLP, Generative AI

Recent Activity

upvoted a paper 3 days ago

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

upvoted a paper 3 days ago

AI Can Learn Scientific Taste

upvoted a paper 3 days ago

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

View all activity

Organizations

upvoted 5 papers 3 days ago

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Paper • 2602.05400 • Published Feb 5 • 352

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 16 days ago • 347

liked a Space 4 days ago

DeepResearch Bench

🔍

Explore deep research model rankings

upvoted a paper 8 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 26 days ago • 94

upvoted a paper 11 days ago

BrowseComp-V^3: A Visual, Vertical, and Verifiable Benchmark for Multimodal Browsing Agents

Paper • 2602.12876 • Published Feb 13 • 12

upvoted an article 12 days ago

Article

Liberate your OpenClaw

17 days ago

•

upvoted an article 19 days ago

Article

Build an Agent That Thinks Like a Data Scientist: How We Hit #1 on DABStep with Reusable Tool Generation

about 1 month ago

•

upvoted a paper 19 days ago

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published Feb 2 • 52

upvoted an article about 1 month ago

Article

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

Mar 12

•

upvoted 4 papers 2 months ago

TokSuite: Measuring the Impact of Tokenizer Choice on Language Model Behavior

Paper • 2512.20757 • Published Dec 23, 2025 • 18

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

LongCat-Flash-Thinking-2601 Technical Report

Paper • 2601.16725 • Published Jan 23 • 180

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 215

liked a dataset 3 months ago

ScaleAI/researchrubrics

Viewer • Updated Nov 12, 2025 • 101 • 350 • 18

upvoted 3 papers 3 months ago

General Agentic Memory Via Deep Research

Paper • 2511.18423 • Published Nov 23, 2025 • 170

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 230

mHC: Manifold-Constrained Hyper-Connections

Paper • 2512.24880 • Published Dec 31, 2025 • 321

Raja Biswas

AI & ML interests

Recent Activity

Organizations

rbiswasfc's activity

DeepResearch Bench

Liberate your OpenClaw

Build an Agent That Thinks Like a Data Scientist: How We Hit #1 on DABStep with Reusable Tool Generation

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II