File size: 3,237 Bytes
f52e5d4 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 | {
"add_prefix_space": false,
"backend": "tokenizers",
"bos_token": "<|endoftext|>",
"clean_up_tokenization_spaces": true,
"eos_token": "<|endoftext|>",
"errors": "replace",
"extra_special_tokens": {
"<|endoftext|>": "<|endoftext|>",
"<|startoftranscript|>": "<|startoftranscript|>",
"<|en|>": "<|en|>",
"<|zh|>": "<|zh|>",
"<|de|>": "<|de|>",
"<|es|>": "<|es|>",
"<|ru|>": "<|ru|>",
"<|ko|>": "<|ko|>",
"<|fr|>": "<|fr|>",
"<|ja|>": "<|ja|>",
"<|pt|>": "<|pt|>",
"<|tr|>": "<|tr|>",
"<|pl|>": "<|pl|>",
"<|ca|>": "<|ca|>",
"<|nl|>": "<|nl|>",
"<|ar|>": "<|ar|>",
"<|sv|>": "<|sv|>",
"<|it|>": "<|it|>",
"<|id|>": "<|id|>",
"<|hi|>": "<|hi|>",
"<|fi|>": "<|fi|>",
"<|vi|>": "<|vi|>",
"<|he|>": "<|he|>",
"<|uk|>": "<|uk|>",
"<|el|>": "<|el|>",
"<|ms|>": "<|ms|>",
"<|cs|>": "<|cs|>",
"<|ro|>": "<|ro|>",
"<|da|>": "<|da|>",
"<|hu|>": "<|hu|>",
"<|ta|>": "<|ta|>",
"<|no|>": "<|no|>",
"<|th|>": "<|th|>",
"<|ur|>": "<|ur|>",
"<|hr|>": "<|hr|>",
"<|bg|>": "<|bg|>",
"<|lt|>": "<|lt|>",
"<|la|>": "<|la|>",
"<|mi|>": "<|mi|>",
"<|ml|>": "<|ml|>",
"<|cy|>": "<|cy|>",
"<|sk|>": "<|sk|>",
"<|te|>": "<|te|>",
"<|fa|>": "<|fa|>",
"<|lv|>": "<|lv|>",
"<|bn|>": "<|bn|>",
"<|sr|>": "<|sr|>",
"<|az|>": "<|az|>",
"<|sl|>": "<|sl|>",
"<|kn|>": "<|kn|>",
"<|et|>": "<|et|>",
"<|mk|>": "<|mk|>",
"<|br|>": "<|br|>",
"<|eu|>": "<|eu|>",
"<|is|>": "<|is|>",
"<|hy|>": "<|hy|>",
"<|ne|>": "<|ne|>",
"<|mn|>": "<|mn|>",
"<|bs|>": "<|bs|>",
"<|kk|>": "<|kk|>",
"<|sq|>": "<|sq|>",
"<|sw|>": "<|sw|>",
"<|gl|>": "<|gl|>",
"<|mr|>": "<|mr|>",
"<|pa|>": "<|pa|>",
"<|si|>": "<|si|>",
"<|km|>": "<|km|>",
"<|sn|>": "<|sn|>",
"<|yo|>": "<|yo|>",
"<|so|>": "<|so|>",
"<|af|>": "<|af|>",
"<|oc|>": "<|oc|>",
"<|ka|>": "<|ka|>",
"<|be|>": "<|be|>",
"<|tg|>": "<|tg|>",
"<|sd|>": "<|sd|>",
"<|gu|>": "<|gu|>",
"<|am|>": "<|am|>",
"<|yi|>": "<|yi|>",
"<|lo|>": "<|lo|>",
"<|uz|>": "<|uz|>",
"<|fo|>": "<|fo|>",
"<|ht|>": "<|ht|>",
"<|ps|>": "<|ps|>",
"<|tk|>": "<|tk|>",
"<|nn|>": "<|nn|>",
"<|mt|>": "<|mt|>",
"<|sa|>": "<|sa|>",
"<|lb|>": "<|lb|>",
"<|my|>": "<|my|>",
"<|bo|>": "<|bo|>",
"<|tl|>": "<|tl|>",
"<|mg|>": "<|mg|>",
"<|as|>": "<|as|>",
"<|tt|>": "<|tt|>",
"<|haw|>": "<|haw|>",
"<|ln|>": "<|ln|>",
"<|ha|>": "<|ha|>",
"<|ba|>": "<|ba|>",
"<|jw|>": "<|jw|>",
"<|su|>": "<|su|>",
"<|translate|>": "<|translate|>",
"<|transcribe|>": "<|transcribe|>",
"<|startoflm|>": "<|startoflm|>",
"<|startofprev|>": "<|startofprev|>",
"<|nocaptions|>": "<|nocaptions|>",
"<|notimestamps|>": "<|notimestamps|>"
},
"is_local": true,
"language": "english",
"model_max_length": 1024,
"pad_token": "<|endoftext|>",
"predict_timestamps": false,
"processor_class": "WhisperProcessor",
"return_attention_mask": false,
"task": "transcribe",
"tokenizer_class": "WhisperTokenizer",
"unk_token": "<|endoftext|>"
} |