Spaces:

CVMX-jaca-tonos
/

Spanish-Audio-Transcriptions-to-Nahuatl-Translation

Runtime error

DrishtiSharma commited on May 4, 2022

Commit

cf1be34

•

1 Parent(s): 4fdac5b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,6 +22,7 @@ asr = pipeline("automatic-speech-recognition", model="jonatasgrosman/wav2vec2-la
 model = AutoModelForSeq2SeqLM.from_pretrained('hackathon-pln-es/t5-small-spanish-nahuatl')
 tokenizer = AutoTokenizer.from_pretrained('hackathon-pln-es/t5-small-spanish-nahuatl')
 def predict_and_ctc_lm_decode(input_file):
     speech = load_and_fix_data(input_file, sampling_rate)
@@ -30,7 +31,7 @@ def predict_and_ctc_lm_decode(input_file):
     input_ids = tokenizer('translate Spanish to Nahuatl: ' + transcribed_text, return_tensors='pt').input_ids
     outputs = model.generate(input_ids, max_length=512)
     outputs = tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]
-    return f"Spanish Audio Transcription: {transcribed_text}  & the corresponding Nahuatl Translation is :{outputs}"
 gr.Interface(

 model = AutoModelForSeq2SeqLM.from_pretrained('hackathon-pln-es/t5-small-spanish-nahuatl')
 tokenizer = AutoTokenizer.from_pretrained('hackathon-pln-es/t5-small-spanish-nahuatl')
+new_line = '\n'
 def predict_and_ctc_lm_decode(input_file):
     speech = load_and_fix_data(input_file, sampling_rate)
     input_ids = tokenizer('translate Spanish to Nahuatl: ' + transcribed_text, return_tensors='pt').input_ids
     outputs = model.generate(input_ids, max_length=512)
     outputs = tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]
+    return f"Spanish Audio Transcription: {transcribed_text}  {new_line} The corresponding Nahuatl Translation is :{outputs}"
 gr.Interface(