speech-to-speech-translation

Runtime error

mahimairaja commited on Aug 28, 2023

Commit

99cd85b

•

1 Parent(s): 035309a

Update app.py (#3)

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,21 +27,22 @@ embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validat
 speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)
 def translate(audio):
     outputs = asr_pipe(audio, max_new_tokens=256, generate_kwargs={"task": "translate"})
     english =  outputs["text"]
-    src = "en"  # source language
-    trg = "fr"  # target language
-    model_name = f"Helsinki-NLP/opus-mt-{src}-{trg}"
-    model = TFMarianMTModel.from_pretrained(model_name)
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
     batch = tokenizer([english], return_tensors="tf")
-    gen = model.generate(**batch)
     return tokenizer.batch_decode(gen, skip_special_tokens=True)[0]

 speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)
+src = "en"  # source language
+trg = "fr"  # target language
+model_name = f"Helsinki-NLP/opus-mt-{src}-{trg}"
+model_tranlator = TFMarianMTModel.from_pretrained(model_name)
+tokenizer = AutoTokenizer.from_pretrained(model_name)
 def translate(audio):
     outputs = asr_pipe(audio, max_new_tokens=256, generate_kwargs={"task": "translate"})
     english =  outputs["text"]
     batch = tokenizer([english], return_tensors="tf")
+    gen = model_tranlator.generate(**batch)
     return tokenizer.batch_decode(gen, skip_special_tokens=True)[0]