Add config/everyvoice-shared-text.yaml for Assamese
Browse files
config/everyvoice-shared-text.yaml
ADDED
|
@@ -0,0 +1,48 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
|
| 2 |
+
g2p_engines: {}
|
| 3 |
+
symbols:
|
| 4 |
+
open-bible-assamese_characters: [, +, '0', '1', '2', '3', '4', '5', '6', '7', '8',
|
| 5 |
+
'9', ˮ, ।, অ, অঁ, অং, অা, আ, আঁ, আঃ, ই, ইং, ঈ, উ, উ, ঊ, ঋ, এ, এঁ, ঐ, ও, ওঁ,
|
| 6 |
+
ঔ, ক, কঁ, কা, কাঁ, কাং, কি, কিং, কী, কু, কুঁ, কূ, কৃ, কে, কেঁ, কৈ, কো, কোঁ, কৌ,
|
| 7 |
+
ক্, ক্, খ, খঁ, খং, খা, খাঃ, খি, খী, খু, খুঁ, খূ, খূঁ, খে, খেঁ, খো, খোঁ, খ্, গ,
|
| 8 |
+
গঁ, গা, গাঁ, গি, গী, গু, গুঁ, গূ, গৃ, গে, গৈ, গো, গোঁ, গৌ, গ্, ঘ, ঘঁ, ঘা, ঘাঁ,
|
| 9 |
+
ঘি, ঘু, ঘূ, ঘৃ, ঘে, ঘেঁ, ঘৈ, ঘো, ঘোঁ, ঘ্, ঙ, ঙা, ঙি, ঙী, ঙু, ঙে, ঙো, ঙ্, চ, চঁ,
|
| 10 |
+
চা, চাঁ, চাং, চি, চিঁ, চী, চু, চুঁ, চূ, চে, চেঁ, চৈ, চো, চোঁ, চৌ, চ্, চ্, ছ,
|
| 11 |
+
ছা, ছাঁ, ছি, ছী, ছু, ছৃ, ছে, ছো, ছোঁ, জ, জঁ, জং, জা, জাঁ, জি, জী, জু, জুঁ, জূ,
|
| 12 |
+
জে, জৈ, জো, জোঁ, জ্, ঝা, ঞ, ঞঁ, ঞা, ঞ্, ট, টা, টি, টিং, টী, টু, টূ, টে, টো, টৌ,
|
| 13 |
+
ট্, ট্, ঠ, ঠা, ঠি, ঠী, ঠু, ঠে, ঠেং, ঠো, ঠ্, ড, ড়, ড়া, ড়ি, ড়ী, ড়ু, ড়ে, ড়ো,
|
| 14 |
+
ডা, ডাঁ, ডাং, ডি, ডু, ডে, ডো, ড্, ঢ, ঢ়, ঢ়া, ঢ়ি, ঢ়ী, ঢ়ে, ঢ়ৈ, ঢ়ো, ঢ়োঁ, ঢা,
|
| 15 |
+
ঢি, ঢু, ঢে, ঢো, ঢোঁ, ঢৌ, ণ, ণঃ, ণা, ণি, ণী, ণু, ণে, ণো, ণ্, ত, তং, তঃ, তা, তাঁ,
|
| 16 |
+
তি, তিঁ, তী, তু, তুঁ, তূ, তৃ, তৃ্, তে, তেঁ, তৈ, তো, তোঁ, তৌ, ত্, ত্, থ, থা, থি,
|
| 17 |
+
থী, থু, থুঁ, থূ, থে, থৈ, থো, থ্, থ্, দ, দং, দঃ, দা, দাঁ, দাং, দি, দী, দু, দুঃ,
|
| 18 |
+
দু্, দূ, দূঃ, দৃ, দৃ্, দে, দৈ, দো, দোঁ, দৌ, দ্, দ্, ধ, ধং, ধঃ, ধা, ধি, ধী, ধু,
|
| 19 |
+
ধুঁ, ধূ, ধূঁ, ধে, ধৈ, ধো, ধোঁ, ধৌ, ধ্, ন, নঃ, না, নি, নিঃ, নী, নু, নু্, নূ, নৃ,
|
| 20 |
+
নে, নৈ, নো, নোঁ, নৌ, ন্, প, পঁ, পা, পাঁ, পি, পিঁ, পী, পু, পুঁ, পুং, পু্, পূ, পূ্,
|
| 21 |
+
পৃ, পে, পৈ, পো, পোঁ, পৌ, প্, ফ, ফঃ, ফা, ফাঁ, ফি, ফী, ফু, ফুঁ, ফূ, ফে, ফেঁ, ফৈ,
|
| 22 |
+
ফো, ফোঁ, ফৌ, ফ্, ব, বঁ, বং, বা, বাঁ, বি, বিং, বী, বু, বূ, বৃ, বৃ্, বে, বেঁ, বৈ,
|
| 23 |
+
বো, বৌ, ব্, ব্, ভ, ভঁ, ভং, ভা, ভাঁ, ভি, ভী, ভু, ভুঁ, ভূ, ভূঁ, ভৃ, ভে, ভেঁ, ভৈ,
|
| 24 |
+
ভো, ভোঁ, ভৌ, ভ্, ম, মঁ, মং, মঃ, মা, মাং, মি, মী, মু, মু্, মূ, মৃ, মে, মৈ, মো,
|
| 25 |
+
মৌ, ম্, ম্, য, যঁ, য়, য়ঁ, য়ং, য়া, য়াঁ, য়ি, য়ী, য়ু, য়ূ, য়ে, য়ো, য়,
|
| 26 |
+
যা, যাঁ, যি, যী, যু, যুঁ, যু়, যে, যো, যোঁ, যৌ, য্, র, রা, রি, রী, রু, রূ, রে,
|
| 27 |
+
রো, র্, ল, লং, লঃ, লা, লি, লী, লু, লূ, লে, লৈ, লো, লোঁ, লোঁঁ, লৌ, ল্, ল্, শ,
|
| 28 |
+
শং, শঃ, শা, শি, শিং, শী, শু, শূ, শৃ, শৃং, শে, শো, শৌ, শ্, ষ, ষা, ষাঁ, ষি, ষী,
|
| 29 |
+
ষু, ষে, ষো, ষ্, স, সঁ, সং, সা, সাঁ, সাং, সি, সিঁ, সিং, সী, সু, সুঁ, সূ, সূঁ, সৃ,
|
| 30 |
+
সৃ্, সে, সৈ, সো, সোঁ, সৌ, স্, হ, হঁ, হং, হঃ, হা, হাঁ, হি, হিঁ, হিং, হী, হু, হুঁ,
|
| 31 |
+
হূ, হৃ, হে, হেঁ, হৈ, হৈ, হো, হোঁ, হ্, ৎ, ৰ, ৰঁ, ৰং, ৰা, ৰাঁ, ৰাং, ৰি, ৰিং, ৰী,
|
| 32 |
+
ৰু, ৰূ, ৰে, ৰেং, ৰৈ, ৰো, ৰোঁ, ৰৌ, ৰ্, ৰ্, ৱ, ৱঁ, ৱা, ৱাঁ, ৱি, ৱী, ৱে, ৱেঁ, ৱৈ,
|
| 33 |
+
ৱো, ৱোঁ, ৷, –, ‘, ’]
|
| 34 |
+
open-bible-assamese_phones: [a, b, d, e, h, i, j, k, l, m, n, o, p, r, s, t, t͡ʃ,
|
| 35 |
+
u, ɡ, ʒ, ʔ]
|
| 36 |
+
punctuation:
|
| 37 |
+
colons: [':']
|
| 38 |
+
commas: [',']
|
| 39 |
+
ellipses: […]
|
| 40 |
+
exclamations: ['!', ¡]
|
| 41 |
+
hyphens: ['-', —, '*']
|
| 42 |
+
parentheses: [(, ), '[', ']', '{', '}']
|
| 43 |
+
periods: [.]
|
| 44 |
+
question_symbols: ['?', ¿]
|
| 45 |
+
quotemarks: ['"', '''', “, ”, «, »]
|
| 46 |
+
semi_colons: [;]
|
| 47 |
+
silence: [<SIL>]
|
| 48 |
+
to_replace: {}
|