Spaces:

ydqmkkx
/

GibbsTTS

Running on Zero

ydqmkkx commited on 4 days ago

Commit

ca68ef2

1 Parent(s): b841749

update

Files changed (1) hide show

models/__init__.py CHANGED Viewed

@@ -59,6 +59,9 @@ class GibbsTTS(nn.Module):
         prompt_wav, sr = torchaudio.load(prompt_audio)
         prompt_wav = self.resampler(prompt_wav.to(self.device), sr).unsqueeze(0)
         prompt_token = self.codec.encode(prompt_wav)
         ratio = prompt_token.shape[1] / len(prompt_phone)

         prompt_wav, sr = torchaudio.load(prompt_audio)
         prompt_wav = self.resampler(prompt_wav.to(self.device), sr).unsqueeze(0)
+        if prompt_wav.shape[1] > 1:
+            prompt_wav = prompt_wav.mean(dim=1, keepdim=True)
         prompt_token = self.codec.encode(prompt_wav)
         ratio = prompt_token.shape[1] / len(prompt_phone)