STEM & Non-STEM Q&A Datasets for LLM Training

InfoBayAI 's Collections

Healthcare AI Datasets for Clinical & LLM Training

Dual Channel Global Customer-Agent Interaction Datasets

Podcast Speech & Conversational Audio Datasets

UGC and STEM Video Datasets

Academic Textbook Corpora for LLM Training

STEM & Non-STEM Q&A Datasets for LLM Training

Computer Vision & Multimodal Datasets

STEM & Non-STEM Q&A Datasets for LLM Training

updated 20 days ago

Sample datasets from a 6.5M+ enterprise-grade Q&A corpus across STEM and Non-STEM domains, built for LLM training, instruction tuning, and evaluation.

Upvote

InfoBayAI/Hindi_STEM_Question_Answering_MCQA_Dataset

Viewer • Updated 17 days ago • 200 • 15
InfoBayAI/English_STEM_Question_Answering_MCQA_Dataset

Viewer • Updated 17 days ago • 200 • 15
InfoBayAI/English-Non-STEM-Question-Answering-MCQA-Dataset

Viewer • Updated 17 days ago • 5 • 9
InfoBayAI/Arabic-STEM-Question-Answering-MCQA-Dataset

Viewer • Updated 17 days ago • 49 • 9
InfoBayAI/Arabic-Non-STEM-Question-Answering-MCQA-Dataset

Viewer • Updated 17 days ago • 44 • 12

Upvote

Collection guide
Browse collections