Add config/everyvoice-shared-text.yaml for Marathi
Browse files
config/everyvoice-shared-text.yaml
ADDED
|
@@ -0,0 +1,49 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
|
| 2 |
+
g2p_engines: {}
|
| 3 |
+
symbols:
|
| 4 |
+
open-bible-marathi_characters: [+, '0', '1', '2', '3', '4', '5', '6', '7', '8',
|
| 5 |
+
'9', "\x90", अ, अं, आ, आं, इ, इं, ई, ईं, उ, उं, ऊ, ऋ, ए, ऐ, ऐं, ओ, ओं, औ, क, कं,
|
| 6 |
+
का, कां, कि, किं, की, कीः, कु, कुं, कू, कृ, के, कै, कॉ, को, कों, कौ, क्, ख, खं,
|
| 7 |
+
खः, खा, खां, खि, खिं, खी, खु, खुं, खू, खे, खो, ख्, ग, गं, गा, गां, गाः, गि, गी,
|
| 8 |
+
गु, गुं, गू, गृ, गे, गै, गो, गों, गौ, ग्, घ, घं, घा, घां, घि, घी, घीं, घु, घुं,
|
| 9 |
+
घू, घृ, घे, घो, घों, घ्, च, चं, चा, चां, चि, चिं, ची, चु, चुं, चू, चे, चें, चै,
|
| 10 |
+
चो, चौ, च्, छ, छं, छा, छां, छि, छी, छु, छे, छो, ज, जं, जा, जां, जि, जिं, जी, जीं,
|
| 11 |
+
जु, जुं, जू, जूं, जे, जेः, जै, जो, ज्, झ, झं, झा, झां, झि, झिं, झी, झु, झुं, झू,
|
| 12 |
+
झे, झें, झो, झों, झ्, ञ, ञा, ञां, ञे, ट, टं, टा, टां, टि, टी, टीं, टुं, टू, टूं,
|
| 13 |
+
टृ, टे, टें, टो, ट्, ठ, ठा, ठां, ठि, ठिं, ठी, ठीं, ठू, ठे, ठें, ठो, ठ्, ड, डं,
|
| 14 |
+
डा, डां, डि, डी, डीं, डु, डुं, डू, डे, डो, डों, डौ, ड्, ड्, ढ, ढा, ढां, ढि, ढी,
|
| 15 |
+
ढू, ढे, ढो, ढों, ढ्, ण, णा, णां, णाः, णि, णी, णीं, णीः, णु, णू, णूं, णे, णें,
|
| 16 |
+
णेः, णो, ण्, त, तं, तः, ता, तां, ति, ती, तीं, तीः, तु, तुं, तू, तूं, तृ, ते, तेः,
|
| 17 |
+
तै, तो, तों, तोः, त्, थ, थं, था, थां, थि, थी, थीं, थु, थुं, थू, थे, थें, थै, थो,
|
| 18 |
+
थ्, द, दं, दा, दां, दि, दी, दीं, दु, दुः, दू, दृ, दे, दै, दो, दौ, द्, ध, धं, धः,
|
| 19 |
+
धा, धां, धि, धी, धीं, धु, धुं, धू, धूं, धे, धै, धो, धों, ध्, न, नं, नः, ना, नां,
|
| 20 |
+
नाः, नि, निं, निः, नी, नीं, नु, नुं, नू, नृ, ने, नें, नै, नो, नों, नौ, न्, प,
|
| 21 |
+
पं, पा, पां, पि, पिं, पी, पु, पुं, पू, पृ, पे, पें, पै, पैं, पो, पौ, प्, फ, फं,
|
| 22 |
+
फा, फां, फि, फी, फु, फुं, फू, फे, फै, फो, फौ, फ्, ब, बं, बा, बां, बि, बिं, बि,
|
| 23 |
+
बी, बीं, बु, बुं, बू, बूं, बे, बें, बै, बो, बों, बौ, ब्, भ, भं, भा, भां, भि, भिं,
|
| 24 |
+
भी, भीं, भु, भुं, भू, भूं, भे, भो, भों, भौ, भ्, म, मं, मा, मां, मा, मि, मिं,
|
| 25 |
+
मी, मीं, मु, मुं, मू, मृ, मे, में, मै, मो, मौ, म्, य, यं, या, यां, यि, यी, यीं,
|
| 26 |
+
यीः, यु, यू, ये, यो, य्, य, र, रं, रः, रा, रां, राः, रि, रिं, री, रीं, रु, रुं,
|
| 27 |
+
रू, रूं, रे, रें, रो, रों, रौ, र्, र्, ऱ्, ल, लं, लः, ला, लां, लाः, लि, लिं,
|
| 28 |
+
ली, लीं, लीः, लु, लुं, लू, ले, लेः, लै, लैं, लो, लों, लौ, ल्, ळ, ळं, ळा, ळां,
|
| 29 |
+
ळि, ळिं, ळी, ळीं, ळु, ळुं, ळू, ळूं, ळे, ळेः, ळो, ळ्, व, वं, वा, वां, वि, विं,
|
| 30 |
+
वी, वीं, वीः, वु, वू, वृ, वे, वेः, वै, वो, व्, श, शं, शा, शां, शि, शिं, शी, शीं,
|
| 31 |
+
शीः, शु, शुं, शू, शूं, शृं, शे, शें, शेः, शो, शौ, श्, ष, षं, षः, षा, षां, षि,
|
| 32 |
+
षी, षीं, षु, षू, षे, षो, ष्, स, सं, सा, सां, साः, सि, सिं, सी, सीं, सु, सुं, सू,
|
| 33 |
+
सृ, से, सें, सेः, सै, सो, सों, सौ, सौं, स्, ह, हं, हा, हां, हि, हिं, हि, ही,
|
| 34 |
+
हीं, हीः, हु, हुं, हू, हूं, हृ, हे, हें, हेः, है, हो, हों, हौ, ह्, ‘, ’]
|
| 35 |
+
open-bible-marathi_phones: [a, b, d, e, h, i, j, k, l, m, n, o, p, r, s, t, t͡ʃ,
|
| 36 |
+
u, v, ɡ, ʒ, ʔ]
|
| 37 |
+
punctuation:
|
| 38 |
+
colons: [':']
|
| 39 |
+
commas: [',']
|
| 40 |
+
ellipses: […]
|
| 41 |
+
exclamations: ['!', ¡]
|
| 42 |
+
hyphens: ['-', —, '*']
|
| 43 |
+
parentheses: [(, ), '[', ']', '{', '}']
|
| 44 |
+
periods: [.]
|
| 45 |
+
question_symbols: ['?', ¿]
|
| 46 |
+
quotemarks: ['"', '''', “, ”, «, »]
|
| 47 |
+
semi_colons: [;]
|
| 48 |
+
silence: [<SIL>]
|
| 49 |
+
to_replace: {}
|