Yehor Smoliakov commited on
Commit
aa45081
1 Parent(s): 8d1424e

Add workable demo

Browse files
examples.csv ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ path,text
2
+ files/example_1.wav,тема про яку не люблять говорити офіційні джерела у генштабі і міноборони це хімічна зброя окупанти вже тривалий час використовують хімічну зброю заборонену
3
+ files/example_2.wav,всіма конвенціями якщо спочатку це були гранати з дронів то тепер фіксують випадки застосування
4
+ files/example_3.wav,хімічних снарядів причому склад отруйної речовони різний а отже й наслідки для наших військових теж різні
5
+ files/example_4.wav,використовує на фронті все що має і хімічна зброя не вийняток тож з чим маємо справу розбиралася марія моганисян
6
+ files/example_5.wav,двох тисяч випадків застосування росіянами боєприпасів споряджених небезпечними хімічними речовинами
7
+ files/example_6.wav,на всі писані норми марія моганисян олександр моторний спецкор марафон єдині новини
files/example_1.wav ADDED
Binary file (273 kB). View file
 
files/example_2.wav ADDED
Binary file (200 kB). View file
 
files/example_3.wav ADDED
Binary file (193 kB). View file
 
files/example_4.wav ADDED
Binary file (241 kB). View file
 
files/example_5.wav ADDED
Binary file (193 kB). View file
 
files/example_6.wav ADDED
Binary file (186 kB). View file
 
requirements.txt CHANGED
@@ -5,3 +5,6 @@ soundfile
5
 
6
  transformers
7
  accelerate
 
 
 
 
5
 
6
  transformers
7
  accelerate
8
+ evaluate
9
+
10
+ jiwer
run_demo.py CHANGED
@@ -7,13 +7,13 @@ import evaluate
7
 
8
  from transformers import HubertForCTC, Wav2Vec2Processor
9
 
10
- batch_size = 8
11
- device = "cuda:0" # or cpu
12
  torch_dtype = torch.float16
13
  sampling_rate = 16_000
14
 
15
- model_name = "/home/yehor/ext-ml-disk/asr/hubert-training/models/final-85500"
16
- testset_file = "/home/yehor/ext-ml-disk/asr/w2v2-bert-training/eval/rows_no_defis.csv"
17
 
18
  # Load the test dataset
19
  with open(testset_file) as f:
 
7
 
8
  from transformers import HubertForCTC, Wav2Vec2Processor
9
 
10
+ batch_size = 1
11
+ device = "cuda:0" # cuda:0, or cpu
12
  torch_dtype = torch.float16
13
  sampling_rate = 16_000
14
 
15
+ model_name = "Yehor/mHuBERT-147-uk"
16
+ testset_file = "examples.csv"
17
 
18
  # Load the test dataset
19
  with open(testset_file) as f: