Arabi32 commited on
Commit
054f40a
·
verified ·
1 Parent(s): 4e82faa

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +17 -7
README.md CHANGED
@@ -1,14 +1,24 @@
1
  ---
2
- title: ERNIE Image
3
- emoji: 👁
4
- colorFrom: yellow
5
  colorTo: purple
6
  sdk: gradio
7
- sdk_version: 6.11.0
8
  app_file: app.py
9
  pinned: false
10
- license: apache-2.0
11
- short_description: ERNIE-Image Demo
12
  ---
13
 
14
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ title: AI Voice Studio
3
+ emoji: 🎙️
4
+ colorFrom: blue
5
  colorTo: purple
6
  sdk: gradio
7
+ sdk_version: 4.0.0
8
  app_file: app.py
9
  pinned: false
 
 
10
  ---
11
 
12
+ # 🎙️ Advanced AI Voice Studio (CPU Version)
13
+
14
+ هذا التطبيق هو نظام استنساخ ودمج صوتي متقدم، مصمم ليعمل على البيئة المجانية (CPU) الخاصة بـ Hugging Face Spaces.
15
+
16
+ ## ⚙️ كيف يعمل على Hugging Face؟
17
+ 1. **التهيئة:** عند تشغيل الـ Space لأول مرة، سيقوم النظام بتحميل أوزان نموذج `XTTS-v2` (حوالي 1.8 جيجابايت) وتخزينها في الـ Cache المخصص للمساحة.
18
+ 2. **قائمة الانتظار (Queue):** تم تفعيل نظام الـ Queue في `app.py` لمنع تعطل السيرفر المجاني في حال قام أكثر من مستخدم بتوليد الصوت في نفس الوقت.
19
+ 3. **المعالجة:** لكون المعالجة تتم على CPU، يقوم الكود بتفكيك النص إلى فونيمات (Text Processing Layer) ثم يمررها لنموذج الـ Vocoder لإنتاج الصوت خطوة بخطوة.
20
+
21
+ ## 💡 نصائح للحصول على أفضل أداء (على CPU)
22
+ * **قِصَر النص:** المعالجة على الـ CPU بطيئة مقارنة بالـ GPU. للحصول على نتيجة في وقت معقول (من دقيقة إلى 3 دقائق)، **استخدم نصوصاً لا تتجاوز 10 إلى 15 كلمة** في المحاولة الواحدة.
23
+ * **جودة العينة (Reference Audio):** للحصول على استنساخ احترافي، ارفع مقطعاً صوتياً مدته بين 3 إلى 5 ثوانٍ، خالي من الضوضاء الخلفية والموسيقى.
24
+ * **نسبة الدمج:** عند استخدام ميزة دمج الأصوات، ابدأ بنسبة `0.5` لتأخذ 50% من الصوت الأول و 50% من الصوت الثاني، ثم قم بتعديلها تدريجياً.