Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2601.15621

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
PaperBanana: Automating Academic Illustration for AI Scientists

Paper • 2601.23265 • Published Jan 30 • 224
Moonshine: Speech Recognition for Live Transcription and Voice Commands

Paper • 2410.15608 • Published Oct 21, 2024 • 12
PersonaLive! Expressive Portrait Image Animation for Live Streaming

Paper • 2512.11253 • Published Dec 12, 2025 • 40

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195
Perception Encoder: The best visual embeddings are not at the output of the network

Paper • 2504.13181 • Published Apr 17, 2025 • 36

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
UltraRAG: A Modular and Automated Toolkit for Adaptive Retrieval-Augmented Generation

Paper • 2504.08761 • Published Mar 31, 2025 • 7

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published Jan 22 • 92
LLM-in-Sandbox Elicits General Agentic Intelligence

Paper • 2601.16206 • Published Jan 22 • 86
Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
Learning to Discover at Test Time

Paper • 2601.16175 • Published Jan 22 • 44

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published Jul 4, 2025 • 166
Self-Supervised Prompt Optimization

Paper • 2502.06855 • Published Feb 7, 2025 • 18
A decoder-only foundation model for time-series forecasting

Paper • 2310.10688 • Published Oct 14, 2023 • 28

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Here Where I train all LLM for OpenSource conf

Full-Duplex-Bench: A Benchmark to Evaluate Full-duplex Spoken Dialogue Models on Turn-taking Capabilities

Paper • 2503.04721 • Published Mar 6, 2025 • 4
Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • 2B • Updated Jan 29 • 1.53M • 1.43k
openbmb/AgentCPM-Report

Text Generation • 8B • Updated Feb 11 • 384 • 298

Realtime Voice Calling stuff

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published Jul 4, 2025 • 166
Self-Supervised Prompt Optimization

Paper • 2502.06855 • Published Feb 7, 2025 • 18
A decoder-only foundation model for time-series forecasting

Paper • 2310.10688 • Published Oct 14, 2023 • 28

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
PaperBanana: Automating Academic Illustration for AI Scientists

Paper • 2601.23265 • Published Jan 30 • 224
Moonshine: Speech Recognition for Live Transcription and Voice Commands

Paper • 2410.15608 • Published Oct 21, 2024 • 12
PersonaLive! Expressive Portrait Image Animation for Live Streaming

Paper • 2512.11253 • Published Dec 12, 2025 • 40

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published Jan 14 • 195
Perception Encoder: The best visual embeddings are not at the output of the network

Paper • 2504.13181 • Published Apr 17, 2025 • 36

Here Where I train all LLM for OpenSource conf

Full-Duplex-Bench: A Benchmark to Evaluate Full-duplex Spoken Dialogue Models on Turn-taking Capabilities

Paper • 2503.04721 • Published Mar 6, 2025 • 4
Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • 2B • Updated Jan 29 • 1.53M • 1.43k
openbmb/AgentCPM-Report

Text Generation • 8B • Updated Feb 11 • 384 • 298

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
UltraRAG: A Modular and Automated Toolkit for Adaptive Retrieval-Augmented Generation

Paper • 2504.08761 • Published Mar 31, 2025 • 7

Realtime Voice Calling stuff

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published Jan 22 • 92
LLM-in-Sandbox Elicits General Agentic Intelligence

Paper • 2601.16206 • Published Jan 22 • 86
Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74
Learning to Discover at Test Time

Paper • 2601.16175 • Published Jan 22 • 44

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Previous
1
2
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs