AI modelning ishlash tezligini oshirish kerak
Assalomu alaykum, siz yozgan AI modelingiz ajoyib, faqat ishlash tezligini biroz yaxshiroq va real timedan yanayam zo'r ishlaydigan qilish kerak. o'ylaymanki buni iloji bor albatta
Balki menga sekin tuyilgandir, oddiyroq compyuterdan ishlatib ko'rganim uchun, hozirda boshqa turdagi ovozlar ham bormi
@xsuan129831 Qwen3-TTS arxitekturasi-dan kelib chiqadi sekinligi. Sifatni tushirmasdan tezlashtirib bo'lmadi tekshirganimda. Real-time uchun emas, offline holatda, batch (32-64ta sample) qilib birdaniga bersangiz tekstlarni, bir xil vaqt ketadi 1ta tekst bergan bilan. Parallelize qilib tezlashtirsangiz bo'ladi. O'zingiz ham urinib ko'rsangiz bo'ladi tezlashtirishga modelni. O'xshasa, community bilan ulashsangiz bo'ladi.
Boshqa ovozlar ham bor, lekin bepul emas; Literal, Realistic, Dialect, Robotic
https://sayro.uz
https://sayro.uz/ lekin negadir men saytga kira olmayapman, har safar kirmoqchi bo'lsam loading bo'lib qoladi, saytga kirmaydi!, yoki hali to'liq bitkazilmaganmi
@xsuan129831 Model release kunlari qo'shib turgandik saytni demo sifatida. GPU arenda bo'lganligi uchun hozir o'chirilgan turibdi.
Qisqacha xulosa:
Model sifati yaxshi β buzilish, distorsiya yo'q
Ortiqcha jimliklar trim_silence.py bilan ~40% qisqarib, nutq tabiiy eshitiladigan bo'ldi
Hech qanday qo'shimcha kutubxona o'rnatmasdan, faqat Python stdlib bilan ishladi
Natijalar juda yaxshi! Asosiy ko'rsatkichlar:
Davomiylik β jami 46.8s β 31.1s, 34% qisqardi. Eng ko'p tejam: 03-Tavsif (20.4s β 12.8s, -7.6s) va 05-Sokin (6.7s β 3.7s, -45%).
Jimlik ulushi β barcha fayllar ~50% β ~20% gacha tushdi. Bu ideal diapazon β nutq tabiiy eshitiladi, so'zlar orasida nafas olish uchun pauza qoldi.
Peak amplitude o'zgarmadi β ovoz sifati buzilmadi, faqat jimlik qisqardi.