Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2404.05829

Rho-1: Not All Tokens Are What You Need

Paper • 2404.07965 • Published Apr 11, 2024 • 94
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

Paper • 2404.10667 • Published Apr 16, 2024 • 24
Instruction-tuned Language Models are Better Knowledge Learners

Paper • 2402.12847 • Published Feb 20, 2024 • 26
DoRA: Weight-Decomposed Low-Rank Adaptation

Paper • 2402.09353 • Published Feb 14, 2024 • 32

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

Expert models that adapt Llama2 to a diverse set of languages from around the world.

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13
sambanovasystems/SambaLingo-Arabic-Chat

Text Generation • 7B • Updated Apr 16, 2024 • 35 • 64
sambanovasystems/SambaLingo-Arabic-Base

Text Generation • 7B • Updated May 14, 2024 • 29 • 37
sambanovasystems/SambaLingo-Arabic-Base-70B

Text Generation • 69B • Updated May 14, 2024 • 17 • 1

multi-lingual llms

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

CulturaX: A Cleaned, Enormous, and Multilingual Dataset for Large Language Models in 167 Languages

Paper • 2309.09400 • Published Sep 17, 2023 • 87
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages

Paper • 2401.05811 • Published Jan 11, 2024 • 9
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis

Paper • 2409.20059 • Published Sep 30, 2024 • 16
Are Character-level Translations Worth the Wait? Comparing Character- and Subword-level Models for Machine Translation

Paper • 2302.14220 • Published Feb 28, 2023

Rho-1: Not All Tokens Are What You Need

Paper • 2404.07965 • Published Apr 11, 2024 • 94
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

Paper • 2404.10667 • Published Apr 16, 2024 • 24
Instruction-tuned Language Models are Better Knowledge Learners

Paper • 2402.12847 • Published Feb 20, 2024 • 26
DoRA: Weight-Decomposed Low-Rank Adaptation

Paper • 2402.09353 • Published Feb 14, 2024 • 32

multi-lingual llms

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13

Expert models that adapt Llama2 to a diverse set of languages from around the world.

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8, 2024 • 13
sambanovasystems/SambaLingo-Arabic-Chat

Text Generation • 7B • Updated Apr 16, 2024 • 35 • 64
sambanovasystems/SambaLingo-Arabic-Base

Text Generation • 7B • Updated May 14, 2024 • 29 • 37
sambanovasystems/SambaLingo-Arabic-Base-70B

Text Generation • 69B • Updated May 14, 2024 • 17 • 1

CulturaX: A Cleaned, Enormous, and Multilingual Dataset for Large Language Models in 167 Languages

Paper • 2309.09400 • Published Sep 17, 2023 • 87
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages

Paper • 2401.05811 • Published Jan 11, 2024 • 9
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis

Paper • 2409.20059 • Published Sep 30, 2024 • 16
Are Character-level Translations Worth the Wait? Comparing Character- and Subword-level Models for Machine Translation

Paper • 2302.14220 • Published Feb 28, 2023

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs