File size: 3,237 Bytes
f52e5d4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
{
  "add_prefix_space": false,
  "backend": "tokenizers",
  "bos_token": "<|endoftext|>",
  "clean_up_tokenization_spaces": true,
  "eos_token": "<|endoftext|>",
  "errors": "replace",
  "extra_special_tokens": {
    "<|endoftext|>": "<|endoftext|>",
    "<|startoftranscript|>": "<|startoftranscript|>",
    "<|en|>": "<|en|>",
    "<|zh|>": "<|zh|>",
    "<|de|>": "<|de|>",
    "<|es|>": "<|es|>",
    "<|ru|>": "<|ru|>",
    "<|ko|>": "<|ko|>",
    "<|fr|>": "<|fr|>",
    "<|ja|>": "<|ja|>",
    "<|pt|>": "<|pt|>",
    "<|tr|>": "<|tr|>",
    "<|pl|>": "<|pl|>",
    "<|ca|>": "<|ca|>",
    "<|nl|>": "<|nl|>",
    "<|ar|>": "<|ar|>",
    "<|sv|>": "<|sv|>",
    "<|it|>": "<|it|>",
    "<|id|>": "<|id|>",
    "<|hi|>": "<|hi|>",
    "<|fi|>": "<|fi|>",
    "<|vi|>": "<|vi|>",
    "<|he|>": "<|he|>",
    "<|uk|>": "<|uk|>",
    "<|el|>": "<|el|>",
    "<|ms|>": "<|ms|>",
    "<|cs|>": "<|cs|>",
    "<|ro|>": "<|ro|>",
    "<|da|>": "<|da|>",
    "<|hu|>": "<|hu|>",
    "<|ta|>": "<|ta|>",
    "<|no|>": "<|no|>",
    "<|th|>": "<|th|>",
    "<|ur|>": "<|ur|>",
    "<|hr|>": "<|hr|>",
    "<|bg|>": "<|bg|>",
    "<|lt|>": "<|lt|>",
    "<|la|>": "<|la|>",
    "<|mi|>": "<|mi|>",
    "<|ml|>": "<|ml|>",
    "<|cy|>": "<|cy|>",
    "<|sk|>": "<|sk|>",
    "<|te|>": "<|te|>",
    "<|fa|>": "<|fa|>",
    "<|lv|>": "<|lv|>",
    "<|bn|>": "<|bn|>",
    "<|sr|>": "<|sr|>",
    "<|az|>": "<|az|>",
    "<|sl|>": "<|sl|>",
    "<|kn|>": "<|kn|>",
    "<|et|>": "<|et|>",
    "<|mk|>": "<|mk|>",
    "<|br|>": "<|br|>",
    "<|eu|>": "<|eu|>",
    "<|is|>": "<|is|>",
    "<|hy|>": "<|hy|>",
    "<|ne|>": "<|ne|>",
    "<|mn|>": "<|mn|>",
    "<|bs|>": "<|bs|>",
    "<|kk|>": "<|kk|>",
    "<|sq|>": "<|sq|>",
    "<|sw|>": "<|sw|>",
    "<|gl|>": "<|gl|>",
    "<|mr|>": "<|mr|>",
    "<|pa|>": "<|pa|>",
    "<|si|>": "<|si|>",
    "<|km|>": "<|km|>",
    "<|sn|>": "<|sn|>",
    "<|yo|>": "<|yo|>",
    "<|so|>": "<|so|>",
    "<|af|>": "<|af|>",
    "<|oc|>": "<|oc|>",
    "<|ka|>": "<|ka|>",
    "<|be|>": "<|be|>",
    "<|tg|>": "<|tg|>",
    "<|sd|>": "<|sd|>",
    "<|gu|>": "<|gu|>",
    "<|am|>": "<|am|>",
    "<|yi|>": "<|yi|>",
    "<|lo|>": "<|lo|>",
    "<|uz|>": "<|uz|>",
    "<|fo|>": "<|fo|>",
    "<|ht|>": "<|ht|>",
    "<|ps|>": "<|ps|>",
    "<|tk|>": "<|tk|>",
    "<|nn|>": "<|nn|>",
    "<|mt|>": "<|mt|>",
    "<|sa|>": "<|sa|>",
    "<|lb|>": "<|lb|>",
    "<|my|>": "<|my|>",
    "<|bo|>": "<|bo|>",
    "<|tl|>": "<|tl|>",
    "<|mg|>": "<|mg|>",
    "<|as|>": "<|as|>",
    "<|tt|>": "<|tt|>",
    "<|haw|>": "<|haw|>",
    "<|ln|>": "<|ln|>",
    "<|ha|>": "<|ha|>",
    "<|ba|>": "<|ba|>",
    "<|jw|>": "<|jw|>",
    "<|su|>": "<|su|>",
    "<|translate|>": "<|translate|>",
    "<|transcribe|>": "<|transcribe|>",
    "<|startoflm|>": "<|startoflm|>",
    "<|startofprev|>": "<|startofprev|>",
    "<|nocaptions|>": "<|nocaptions|>",
    "<|notimestamps|>": "<|notimestamps|>"
  },
  "is_local": true,
  "language": "english",
  "model_max_length": 1024,
  "pad_token": "<|endoftext|>",
  "predict_timestamps": false,
  "processor_class": "WhisperProcessor",
  "return_attention_mask": false,
  "task": "transcribe",
  "tokenizer_class": "WhisperTokenizer",
  "unk_token": "<|endoftext|>"
}