davidguzmanr commited on
Commit
6917a5c
·
verified ·
1 Parent(s): 7a6d5cf

Add config/everyvoice-shared-text.yaml for Assamese

Browse files
Files changed (1) hide show
  1. config/everyvoice-shared-text.yaml +48 -0
config/everyvoice-shared-text.yaml ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
2
+ g2p_engines: {}
3
+ symbols:
4
+ open-bible-assamese_characters: [‌, +, '0', '1', '2', '3', '4', '5', '6', '7', '8',
5
+ '9', ˮ, ।, অ, অঁ, অং, অা, আ, আঁ, আঃ, ই, ইং, ঈ, উ, উ‌‌, ঊ, ঋ, এ, এঁ, ঐ, ও, ওঁ,
6
+ ঔ, ক, কঁ, কা, কাঁ, কাং, কি, কিং, কী, কু, কুঁ, কূ, কৃ, কে, কেঁ, কৈ, কো, কোঁ, কৌ,
7
+ ক্, ক্‌, খ, খঁ, খং, খা, খাঃ, খি, খী, খু, খুঁ, খূ, খূঁ, খে, খেঁ, খো, খোঁ, খ্, গ,
8
+ গঁ, গা, গাঁ, গি, গী, গু, গুঁ, গূ, গৃ, গে, গৈ, গো, গোঁ, গৌ, গ্, ঘ, ঘঁ, ঘা, ঘাঁ,
9
+ ঘি, ঘু, ঘূ, ঘৃ, ঘে, ঘেঁ, ঘৈ, ঘো, ঘোঁ, ঘ্, ঙ, ঙা, ঙি, ঙী, ঙু, ঙে, ঙো, ঙ্, চ, চঁ,
10
+ চা, চাঁ, চাং, চি, চিঁ, চী, চু, চুঁ, চূ, চে, চেঁ, চৈ, চো, চোঁ, চৌ, চ্, চ্‌, ছ,
11
+ ছা, ছাঁ, ছি, ছী, ছু, ছৃ, ছে, ছো, ছোঁ, জ, জঁ, জং, জা, জাঁ, জি, জী, জু, জুঁ, জূ,
12
+ জে, জৈ, জো, জোঁ, জ্, ঝা, ঞ, ঞঁ, ঞা, ঞ্, ট, টা, টি, টিং, টী, টু, টূ, টে, টো, টৌ,
13
+ ট্, ট্‌, ঠ, ঠা, ঠি, ঠী, ঠু, ঠে, ঠেং, ঠো, ঠ্, ড, ড়, ড়া, ড়ি, ড়ী, ড়ু, ড়ে, ড়ো,
14
+ ডা, ডাঁ, ডাং, ডি, ডু, ডে, ডো, ড্, ঢ, ঢ়, ঢ়া, ঢ়ি, ঢ়ী, ঢ়ে, ঢ়ৈ, ঢ়ো, ঢ়োঁ, ঢা,
15
+ ঢি, ঢু, ঢে, ঢো, ঢোঁ, ঢৌ, ণ, ণঃ, ণা, ণি, ণী, ণু, ণে, ণো, ণ্, ত, তং, তঃ, তা, তাঁ,
16
+ তি, তিঁ, তী, তু, তুঁ, তূ, তৃ, তৃ্, তে, তেঁ, তৈ, তো, তোঁ, তৌ, ত্, ত্‌, থ, থা, থি,
17
+ থী, থু, থুঁ, থূ, থে, থৈ, থো, থ্, থ্‌, দ, দং, দঃ, দা, দাঁ, দাং, দি, দী, দু, দুঃ,
18
+ দু্, দূ, দূঃ, দৃ, দৃ্, দে, দৈ, দো, দোঁ, দৌ, দ্, দ্‌, ধ, ধং, ধঃ, ধা, ধি, ধী, ধু,
19
+ ধুঁ, ধূ, ধূঁ, ধে, ধৈ, ধো, ধোঁ, ধৌ, ধ্, ন, নঃ, না, নি, নিঃ, নী, নু, নু্, নূ, নৃ,
20
+ নে, নৈ, নো, নোঁ, নৌ, ন্, প, পঁ, পা, পাঁ, পি, পিঁ, পী, পু, পুঁ, পুং, পু্, পূ, পূ্,
21
+ পৃ, পে, পৈ, পো, পোঁ, পৌ, প্, ফ, ফঃ, ফা, ফাঁ, ফি, ফী, ফু, ফুঁ, ফূ, ফে, ফেঁ, ফৈ,
22
+ ফো, ফোঁ, ফৌ, ফ্, ব, বঁ, বং, বা, বাঁ, বি, বিং, বী, বু, বূ, বৃ, বৃ্, বে, বেঁ, বৈ,
23
+ বো, বৌ, ব্, ব্‌, ভ, ভঁ, ভং, ভা, ভাঁ, ভি, ভী, ভু, ভুঁ, ভূ, ভূঁ, ভৃ, ভে, ভেঁ, ভৈ,
24
+ ভো, ভোঁ, ভৌ, ভ্, ম, মঁ, মং, মঃ, মা, মাং, মি, মী, মু, মু্‌, মূ, মৃ, মে, মৈ, মো,
25
+ মৌ, ম্, ম্‌, য, যঁ, য়, য়ঁ, য়ং, য়া, য়াঁ, য়ি, য়ী, য়ু, য়ূ, য়ে, য়ো, য়‍,
26
+ যা, যাঁ, যি, যী, যু, যুঁ, যু়, যে, যো, যোঁ, যৌ, য্, র, রা, রি, রী, রু, রূ, রে,
27
+ রো, র্, ল, লং, লঃ, লা, লি, লী, লু, লূ, লে, লৈ, লো, লোঁ, লোঁঁ, লৌ, ল্, ল্‌, শ,
28
+ শং, শঃ, শা, শি, শিং, শী, শু, শূ, শৃ, শৃং, শে, শো, শৌ, শ্, ষ, ষা, ষাঁ, ষি, ষী,
29
+ ষু, ষে, ষো, ষ্, স, সঁ, সং, সা, সাঁ, সাং, সি, সিঁ, সিং, সী, সু, সুঁ, সূ, সূঁ, সৃ,
30
+ সৃ্, সে, সৈ, সো, সোঁ, সৌ, স্, হ, হঁ, হং, হঃ, হা, হাঁ, হি, হিঁ, হিং, হী, হু, হুঁ,
31
+ হূ, হৃ, হে, হেঁ, হৈ, হৈ‌, হো, হোঁ, হ্, ৎ, ৰ, ৰঁ, ৰং, ৰা, ৰাঁ, ৰাং, ৰি, ৰিং, ৰী,
32
+ ৰু, ৰূ, ৰে, ৰেং, ৰৈ, ৰো, ৰোঁ, ৰৌ, ৰ্, ৰ্‌, ৱ, ৱঁ, ৱা, ৱাঁ, ৱি, ৱী, ৱে, ৱেঁ, ৱৈ,
33
+ ৱো, ৱোঁ, ৷, –, ‘, ’]
34
+ open-bible-assamese_phones: [a, b, d, e, h, i, j, k, l, m, n, o, p, r, s, t, t͡ʃ,
35
+ u, ɡ, ʒ, ʔ]
36
+ punctuation:
37
+ colons: [':']
38
+ commas: [',']
39
+ ellipses: […]
40
+ exclamations: ['!', ¡]
41
+ hyphens: ['-', —, '*']
42
+ parentheses: [(, ), '[', ']', '{', '}']
43
+ periods: [.]
44
+ question_symbols: ['?', ¿]
45
+ quotemarks: ['"', '''', “, ”, «, »]
46
+ semi_colons: [;]
47
+ silence: [<SIL>]
48
+ to_replace: {}