Spaces:

jhj0517
/

Whisper-WebUI

Running

App Files Files Community

Jhjoon05 commited on Mar 6, 2023

Commit

f9abd83

•

1 Parent(s): d289953

added attributes to whisper inference and changed variable names

Browse files

Files changed (2) hide show

app.py +11 -12
modules/model_Inference.py +3 -1

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import gradio as gr
-from modules.model_Inference import ModelInference
-import whisper
 import os
 from ui.htmls import CSS,MARKDOWN
 from modules.youtube_manager import get_ytmetas
@@ -12,7 +11,7 @@ def open_output_folder():
     else:
         print(f"The folder {folder_path} does not exist.")
-inf = ModelInference()
 block = gr.Blocks(css=CSS).queue(api_open=False)
 with block:
@@ -24,8 +23,8 @@ with block:
             with gr.Row():
                 input_file = gr.File(type="file", label="Upload File here")
             with gr.Row():
-                dd_model = gr.Dropdown(choices=whisper.available_models(),value="large-v2",label="Model")
-                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+sorted(list(whisper.tokenizer.LANGUAGES.values())),value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
@@ -35,7 +34,7 @@ with block:
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
-            btn_run.click(fn=inf.transcribe_file,inputs=[input_file,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
         with gr.TabItem("Youtube"): # tab2
@@ -48,8 +47,8 @@ with block:
                     tb_title = gr.Label(label="Youtube Title")
                     tb_description = gr.Textbox(label="Youtube Description",max_lines=15)
             with gr.Row():
-                dd_model = gr.Dropdown(choices=whisper.available_models(),value="large-v2",label="Model")
-                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+sorted(list(whisper.tokenizer.LANGUAGES.values())),value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(choices=["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
@@ -59,7 +58,7 @@ with block:
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
-            btn_run.click(fn=inf.transcribe_youtube,inputs=[tb_youtubelink,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             tb_youtubelink.change(get_ytmetas,inputs=[tb_youtubelink],outputs=[img_thumbnail,tb_title,tb_description])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
@@ -67,8 +66,8 @@ with block:
             with gr.Row():
                 mic_input = gr.Microphone(label="Record with Mic",type="filepath",interactive=True)
             with gr.Row():
-                dd_model = gr.Dropdown(choices=whisper.available_models(),value="large-v2",label="Model")
-                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+sorted(list(whisper.tokenizer.LANGUAGES.values())),value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
@@ -78,7 +77,7 @@ with block:
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
-            btn_run.click(fn=inf.transcribe_mic,inputs=[mic_input,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
 block.launch()

 import gradio as gr
+from modules.model_Inference import WhisperInference
 import os
 from ui.htmls import CSS,MARKDOWN
 from modules.youtube_manager import get_ytmetas
     else:
         print(f"The folder {folder_path} does not exist.")
+whisper_inf = WhisperInference()
 block = gr.Blocks(css=CSS).queue(api_open=False)
 with block:
             with gr.Row():
                 input_file = gr.File(type="file", label="Upload File here")
             with gr.Row():
+                dd_model = gr.Dropdown(choices=whisper_inf.available_models,value="large-v2",label="Model")
+                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+whisper_inf.available_langs,value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
+            btn_run.click(fn=whisper_inf.transcribe_file,inputs=[input_file,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
         with gr.TabItem("Youtube"): # tab2
                     tb_title = gr.Label(label="Youtube Title")
                     tb_description = gr.Textbox(label="Youtube Description",max_lines=15)
             with gr.Row():
+                dd_model = gr.Dropdown(choices=whisper_inf.available_models,value="large-v2",label="Model")
+                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+whisper_inf.available_langs,value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(choices=["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
+            btn_run.click(fn=whisper_inf.transcribe_youtube,inputs=[tb_youtubelink,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             tb_youtubelink.change(get_ytmetas,inputs=[tb_youtubelink],outputs=[img_thumbnail,tb_title,tb_description])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
             with gr.Row():
                 mic_input = gr.Microphone(label="Record with Mic",type="filepath",interactive=True)
             with gr.Row():
+                dd_model = gr.Dropdown(choices=whisper_inf.available_models,value="large-v2",label="Model")
+                dd_lang = gr.Dropdown(choices=["Automatic Detection"]+whisper_inf.available_langs,value="Automatic Detection",label="Language")
                 dd_subformat = gr.Dropdown(["SRT","WebVTT"],value="SRT",label="Subtitle Format")
             with gr.Row():
                 cb_translate = gr.Checkbox(value=False,label="Translate to English?",interactive=True)
                 tb_indicator = gr.Textbox(label="Output")
                 btn_openfolder = gr.Button('📂').style(full_width=False)
+            btn_run.click(fn=whisper_inf.transcribe_mic,inputs=[mic_input,dd_model,dd_lang,dd_subformat,cb_translate],outputs=[tb_indicator])
             btn_openfolder.click(fn=open_output_folder,inputs=[],outputs=[])
 block.launch()

modules/model_Inference.py CHANGED Viewed

@@ -5,11 +5,13 @@ import gradio as gr
 import os
 from datetime import datetime
-class ModelInference():
     def __init__(self):
         print("\nInitializing Model..\n")
         self.current_model_size = "large-v2"
         self.model = whisper.load_model(self.current_model_size)
     def transcribe_file(self,fileobj
                         ,model_size,lang,subformat,istranslate,

 import os
 from datetime import datetime
+class WhisperInference():
     def __init__(self):
         print("\nInitializing Model..\n")
         self.current_model_size = "large-v2"
         self.model = whisper.load_model(self.current_model_size)
+        self.available_models = whisper.available_models()
+        self.available_langs = sorted(list(whisper.tokenizer.LANGUAGES.values()))
     def transcribe_file(self,fileobj
                         ,model_size,lang,subformat,istranslate,