MakiAi commited on
Commit
db1910e
1 Parent(s): 6075b24

[refactor] GitHub Actions設定とapp.pyファイルの更新

Browse files

プロジェクトの自動デプロイ設定とアプリケーションのUIを更新しました。具体的な変更内容は以下の通りです:

### .github/workflows/run.yamlの更新
- GitHub Actionsのスクリプト内のデプロイメントコマンドを更新しました。Hugging Face Spacesのリポジトリを `HarmonAI_II` から `KotobaTranscriber` へ変更しました。これにより、最新のリポジトリ設定に基づいた自動デプロイが可能となります。

### app.pyの大幅な更新
- **画像配置の変更**: アプリケーションの説明部分で使用される画像のHTMLタグを更新し、画像を中央に配置し、サイズを70%に調整しました。
- **テーマのカスタマイズ**: Gradioのテーマをカスタマイズし、プライマリカラーをグレーに設定しました。カラーコードも新しいスキームに基づいて更新されています。
- **インターフェースの定義更新**: `Interface` の定義を更新し、タイトルを `Speech-to-Text App` から `KotobaTranscriber` に変更しました。これにより、アプリケーションのブランディングが強化されます。

これらの変更により、プロジェクトのデプロイメントプロセスとユーザーインターフェースが最新のプロジェクト要件に適合し、より効率的かつ魅力的なものとなりました。

Files changed (4) hide show
  1. .SourceSageignore +2 -1
  2. .github/workflows/run.yaml +1 -1
  3. README.md +28 -36
  4. app.py +13 -3
.SourceSageignore CHANGED
@@ -22,4 +22,5 @@ modules\__pycache__
22
  sourcesage.egg-info
23
  .pytest_cache
24
  dist
25
- build
 
 
22
  sourcesage.egg-info
23
  .pytest_cache
24
  dist
25
+ build
26
+ .cache
.github/workflows/run.yaml CHANGED
@@ -16,4 +16,4 @@ jobs:
16
  - name: Push to hub
17
  env:
18
  HF_TOKEN: ${{ secrets.HF_TOKEN }}
19
- run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/HarmonAI_II main
 
16
  - name: Push to hub
17
  env:
18
  HF_TOKEN: ${{ secrets.HF_TOKEN }}
19
+ run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main
README.md CHANGED
@@ -32,76 +32,68 @@ pinned: false
32
  >[!IMPORTANT]
33
  >このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
34
 
 
35
 
36
- ## 🌟 Introduction
37
 
38
- HarmonAI IIは、AIとの調和と無限の可能性を追求するプロジェクトです。このリポジトリは、HarmonAI IIの開発テンプレートとして機能します。
39
 
40
- ## 🎥 Demo
41
 
42
- HarmonAI IIのデモアプリケーションは、GitHub Actionsと連携し、自動的にデプロイされています。デモアプリを体験することで、HarmonAI IIの機能を直感的に理解することができます。
43
 
44
  [![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
45
 
46
- ## 🚀 Getting Started
47
 
48
- ### Installation
49
 
50
- HarmonAI IIのインストール手順は以下の通りです:
51
 
52
  1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
53
  2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
54
 
55
- ### Usage
56
 
57
- HarmonAI IIの使用方法は以下の通りです:
58
 
59
- ```bash
60
- git lfs install
61
- git lfs track "*.png"
62
- git lfs track "*.gif"
63
- git lfs track "*.jpeg"
64
- git lfs track "*.jpg"
65
- git lfs track "*.mp4"
66
- ```
67
 
68
- リポジトリ名を適切に変更してください:
69
 
70
  ```bash
71
- run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main
72
  ```
73
 
74
- ### Customization
75
-
76
- HarmonAI IIは、ユーザーのニーズに合わせてカスタマイズ可能です。設定ファイルを編集することで、プロジェクトの動作を柔軟に調整できます。
77
-
78
- ## 📝 Updates
79
 
80
  - v1.1.0 (2024-04-24):
81
  - フロントページの作成
82
  - READMEの全体的な改善
83
  - GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
84
- - .gitignoreと.SourceSageignoreの更新
85
  - プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
86
  - v1.0.0 (2024-04-20):
87
  - 初回リリース
88
- - 基本的な機能を実装
89
-
90
 
91
- ## 🤝 Contributing
92
 
93
- HarmonAI IIへのご協力は大歓迎です!バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
94
 
95
- ## 📄 License
96
 
97
- HarmonAI IIは[MIT License](LICENSE)の下でリリースされています。
98
 
99
- ## 🙏 Acknowledgements
100
 
101
- HarmonAI IIの開発にあたり、以下の方々に感謝いたします:
102
 
103
  - [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
104
- - [SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)プロジェクト
105
- - [claude.ai](https://claude.ai/)チーム
106
 
107
- 引き続き、HarmonAI IIプロジェクトをよろしくお願いいたします!
 
32
  >[!IMPORTANT]
33
  >このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
34
 
35
+ ## 🌟 イントロダクション
36
 
37
+ KotobaTranscriberは、日本語音声をテキストに変換するための最先端のソリューションです。最新の機械学習モデルを活用し、高精度な文字起こしを実現します。
38
 
39
+ 音声ファイルをアップロードするだけで、KotobaTranscriberが自動的に音声を認識し、テキストに変換します。ビジネスミーティングや講義、インタビューなど、あらゆるシーンで活躍します。
40
 
41
+ ## 🎥 デモ
42
 
43
+ KotobaTranscriberのデモアプリケーションをHugging Face Spacesで公開しています。ぜひ、実際に体験してみてください。
44
 
45
  [![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
46
 
47
+ ## 🚀 はじめに
48
 
49
+ ### インストール
50
 
51
+ KotobaTranscriberのインストール手順は以下の通りです:
52
 
53
  1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
54
  2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
55
 
56
+ ### 使用方法
57
 
58
+ KotobaTranscriberの基本的な使用方法は以下の通りです:
59
 
60
+ 1. `app.py`を実行します: `python app.py`
61
+ 2. ブラウザで`http://localhost:7860`にアクセスします
62
+ 3. 音声ファイルをアップロードします
63
+ 4. 文字起こし結果が表示されます
64
+
65
+ 詳細な使用方法については、[ドキュメント](https://github.com/Sunwood-ai-labs/KotobaTranscriber/wiki)をご参照ください。
 
 
66
 
 
67
 
68
  ```bash
69
+ docker-compose up
70
  ```
71
 
72
+ ## 📝 アップデート
 
 
 
 
73
 
74
  - v1.1.0 (2024-04-24):
75
  - フロントページの作成
76
  - READMEの全体的な改善
77
  - GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
78
+ - .gitignoreと.gitattributesの更新
79
  - プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
80
  - v1.0.0 (2024-04-20):
81
  - 初回リリース
82
+ - 基本的な文字起こし機能を実装
 
83
 
84
+ ## 🤝 コントリビューション
85
 
86
+ KotobaTranscriberへのご協力は大歓迎です!バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
87
 
88
+ ## 📄 ライセンス
89
 
90
+ KotobaTranscriberは[MIT License](LICENSE)の下でリリースされています。
91
 
92
+ ## 🙏 謝辞
93
 
94
+ KotobaTranscriberの開発にあたり、以下の方々に感謝いたします:
95
 
96
  - [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
97
+ - [kotoba-tech/kotoba-whisper-v1.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v1.0)モデルの開発者の方々
 
98
 
99
+ 引き続き、KotobaTranscriberプロジェクトをよろしくお願いいたします!
app.py CHANGED
@@ -34,17 +34,27 @@ def transcribe(audio_file):
34
  return result["text"]
35
 
36
  description = """
37
- <img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width=200px>
 
 
 
38
  """
39
 
 
 
 
 
 
 
40
  # Gradioインターフェースの定義
41
  iface = gr.Interface(
42
  fn=transcribe,
 
43
  inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
44
  outputs="text",
45
- title="Speech-to-Text App",
46
  description=description,
47
- theme=gr.themes.Soft(),
48
  )
49
  # アプリの起動
50
  iface.launch(server_name="0.0.0.0", server_port=7860, share=True)
 
34
  return result["text"]
35
 
36
  description = """
37
+ <p align="center">
38
+ <img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width="70%">
39
+ <br>
40
+ </p>
41
  """
42
 
43
+ theme = gr.themes.Soft(
44
+ # neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#6b7280", c600="#4b5563", c700="#374151", c800="#1f2937", c900="#1E2D2F", c950="#1E2D2F"),
45
+ primary_hue="gray",
46
+ neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#1E2D2F", c600="#1E2D2F", c700="#374151", c800="#1f2937", c900="#111827", c950="#0b0f19"),
47
+ )
48
+
49
  # Gradioインターフェースの定義
50
  iface = gr.Interface(
51
  fn=transcribe,
52
+ # fn=None,
53
  inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
54
  outputs="text",
55
+ title="KotobaTranscriber",
56
  description=description,
57
+ theme=theme,
58
  )
59
  # アプリの起動
60
  iface.launch(server_name="0.0.0.0", server_port=7860, share=True)