Han Wang's picture

Han Wang

rookiehabc

·

AI & ML interests

None yet

Recent Activity

submitted a paper 16 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

authored a paper 16 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

upvoted a paper 17 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

View all activity

Organizations

submitted a paper to Daily Papers 16 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

Paper • 2603.28590 • Published 18 days ago • 22

authored a paper 16 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

Paper • 2603.28590 • Published 18 days ago • 22

upvoted a paper 17 days ago

MonitorBench: A Comprehensive Benchmark for Chain-of-Thought Monitorability in Large Language Models

Paper • 2603.28590 • Published 18 days ago • 22

updated 5 models 6 months ago

LRM-Conta-Detection-Arena/sft-conta-deepseek-distill-llama3-8b

Text Generation • 8B • Updated Oct 9, 2025 • 3

LRM-Conta-Detection-Arena/sft-conta-qwen2.5-7b-no-rl

Text Generation • 8B • Updated Oct 9, 2025 • 42

LRM-Conta-Detection-Arena/sft-conta-deepseek-distill-qwen2.5-7b

Text Generation • 8B • Updated Oct 9, 2025 • 3

LRM-Conta-Detection-Arena/sft-conta-llama3-8b-no-rl

Text Generation • 8B • Updated Oct 13, 2025 • 2

LRM-Conta-Detection-Arena/sft-conta-llama3-8b-gpro-step64

Text Generation • 8B • Updated Oct 9, 2025 • 2