Getting wrong transcriptions
#7
by
DevOG
- opened
Tried running the inference using the model on common voice dataset 11 was getting very weird trasncriptions with spacing and (matra) problems in hindi language , but still getting a decent WER of 10.
Any suggestions? (adding a few samples below)
First line is the transcription by the model and second line is the actual sentence from the dataset
नरदर म द क व र ध म स ह स नह और च ह न
नरेंद्र मोदी के विरोध में सिंह, सिन्हा और चौहान
र क गई अमरन थ य तर क ब द कशम र स ल टन लग ह त रथय तर
रोकी गई अमरनाथ यात्रा, एडवाइजरी के बाद कश्मीर से लौटने लगे हैं तीर्थयात्री
च धर व रदर स ह ब जप म श म ल हए
चौधरी बिरेंदर सिंह बीजेपी में शामिल हुए
म सटर व ल क उमम द सच न उठ त रहग ज ममद र
'मिस्टर वॉल' को उम्मीद सचिन उठाते रहेंगे जिम्मेदारी
बरफ कह ह
बर्फ कहाँ है?