Add config/everyvoice-shared-text.yaml for Tamil
Browse files
config/everyvoice-shared-text.yaml
ADDED
|
@@ -0,0 +1,31 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
cleaners: [everyvoice.utils.collapse_whitespace, everyvoice.utils.strip_text]
|
| 2 |
+
g2p_engines: {}
|
| 3 |
+
symbols:
|
| 4 |
+
open-bible-tamil_characters: [+, /, '0', '1', '2', '3', '4', '5', '6', '7', '8',
|
| 5 |
+
'9', அ, ஆ, இ, ஈ, உ, ஊ, எ, ஏ, ஐ, ஒ, ஓ, க, கா, கி, கீ, கு, கூ, கெ, கே, கை, கொ, கோ,
|
| 6 |
+
க், ங், ச, சா, சி, சீ, சு, சூ, செ, சே, சை, சொ, சோ, சௌ, ச், ஜ, ஜா, ஜி, ஜீ, ஜூ,
|
| 7 |
+
ஜெ, ஜை, ஜோ, ஜ், ஞ, ஞா, ஞ், ட, டா, டி, டீ, டு, டூ, டெ, டே, டை, டொ, டோ, ட், ண, ணா,
|
| 8 |
+
ணி, ணீ, ணு, ணூ, ணெ, ணே, ணை, ணோ, ண், த, தா, தி, தீ, து, தூ, தெ, தே, தை, தொ, தோ,
|
| 9 |
+
த், ந, நா, நி, நீ, நு, நூ, நெ, நே, நை, நொ, நோ, ந், ன, னா, னி, னீ, னு, னூ, னெ,
|
| 10 |
+
னே, னை, னொ, னோ, ன், ன், ப, பா, பி, பீ, பு, பூ, பெ, பே, பை, பொ, போ, ப், ம, மா,
|
| 11 |
+
மி, மீ, மு, மூ, மெ, மே, மை, மொ, மோ, மௌ, ம், ய, யா, யி, யீ, யு, யூ, யெ, யே, யை,
|
| 12 |
+
யொ, யோ, ய், ர, ரா, ரி, ரீ, ரு, ரூ, ரெ, ரே, ரை, ரொ, ரோ, ர், ற, றா, றி, றீ, று,
|
| 13 |
+
றெ, றே, றை, றொ, றோ, ற், ல, லா, லி, லீ, லு, லூ, லெ, லே, லை, லொ, லோ, ல், ள, ளா,
|
| 14 |
+
ளி, ளு, ளெ, ளே, ளை, ளொ, ளோ, ள், ழ, ழா, ழி, ழு, ழெ, ழே, ழை, ழோ, ழ், வ, வா, வி,
|
| 15 |
+
வீ, வு, வூ, வெ, வே, வை, வொ, வோ, வௌ, வ், ஷ, ஷா, ஷி, ஷீ, ஷூ, ஷெ, ஷே, ஷை, ஷொ, ஷோ,
|
| 16 |
+
ஷ், ஸ, ஸி, ஸு, ஸே, ஸை, ஸ், ஹி, ஹெ, ‘, ’]
|
| 17 |
+
open-bible-tamil_phones: [a, e, h, i, j, k, l, m, n, o, p, r, s, t, t͡ʃ, u, v, ɡ,
|
| 18 |
+
ʒ, ʔ]
|
| 19 |
+
punctuation:
|
| 20 |
+
colons: [':']
|
| 21 |
+
commas: [',']
|
| 22 |
+
ellipses: […]
|
| 23 |
+
exclamations: ['!', ¡]
|
| 24 |
+
hyphens: ['-', —, '*']
|
| 25 |
+
parentheses: [(, ), '[', ']', '{', '}']
|
| 26 |
+
periods: [.]
|
| 27 |
+
question_symbols: ['?', ¿]
|
| 28 |
+
quotemarks: ['"', '''', “, ”, «, »]
|
| 29 |
+
semi_colons: [;]
|
| 30 |
+
silence: [<SIL>]
|
| 31 |
+
to_replace: {}
|