Spaces:
Sleeping
Sleeping
[refactor] GitHub Actions設定とapp.pyファイルの更新
Browse filesプロジェクトの自動デプロイ設定とアプリケーションのUIを更新しました。具体的な変更内容は以下の通りです:
### .github/workflows/run.yamlの更新
- GitHub Actionsのスクリプト内のデプロイメントコマンドを更新しました。Hugging Face Spacesのリポジトリを `HarmonAI_II` から `KotobaTranscriber` へ変更しました。これにより、最新のリポジトリ設定に基づいた自動デプロイが可能となります。
### app.pyの大幅な更新
- **画像配置の変更**: アプリケーションの説明部分で使用される画像のHTMLタグを更新し、画像を中央に配置し、サイズを70%に調整しました。
- **テーマのカスタマイズ**: Gradioのテーマをカスタマイズし、プライマリカラーをグレーに設定しました。カラーコードも新しいスキームに基づいて更新されています。
- **インターフェースの定義更新**: `Interface` の定義を更新し、タイトルを `Speech-to-Text App` から `KotobaTranscriber` に変更しました。これにより、アプリケーションのブランディングが強化されます。
これらの変更により、プロジェクトのデプロイメントプロセスとユーザーインターフェースが最新のプロジェクト要件に適合し、より効率的かつ魅力的なものとなりました。
- .SourceSageignore +2 -1
- .github/workflows/run.yaml +1 -1
- README.md +28 -36
- app.py +13 -3
.SourceSageignore
CHANGED
@@ -22,4 +22,5 @@ modules\__pycache__
|
|
22 |
sourcesage.egg-info
|
23 |
.pytest_cache
|
24 |
dist
|
25 |
-
build
|
|
|
|
22 |
sourcesage.egg-info
|
23 |
.pytest_cache
|
24 |
dist
|
25 |
+
build
|
26 |
+
.cache
|
.github/workflows/run.yaml
CHANGED
@@ -16,4 +16,4 @@ jobs:
|
|
16 |
- name: Push to hub
|
17 |
env:
|
18 |
HF_TOKEN: ${{ secrets.HF_TOKEN }}
|
19 |
-
run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/
|
|
|
16 |
- name: Push to hub
|
17 |
env:
|
18 |
HF_TOKEN: ${{ secrets.HF_TOKEN }}
|
19 |
+
run: git push --force https://MakiAi:[email protected]/spaces/MakiAi/KotobaTranscriber main
|
README.md
CHANGED
@@ -32,76 +32,68 @@ pinned: false
|
|
32 |
>[!IMPORTANT]
|
33 |
>このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
|
34 |
|
|
|
35 |
|
36 |
-
|
37 |
|
38 |
-
|
39 |
|
40 |
-
## 🎥
|
41 |
|
42 |
-
|
43 |
|
44 |
[![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
|
45 |
|
46 |
-
## 🚀
|
47 |
|
48 |
-
###
|
49 |
|
50 |
-
|
51 |
|
52 |
1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
|
53 |
2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
|
54 |
|
55 |
-
###
|
56 |
|
57 |
-
|
58 |
|
59 |
-
|
60 |
-
|
61 |
-
|
62 |
-
|
63 |
-
|
64 |
-
|
65 |
-
git lfs track "*.mp4"
|
66 |
-
```
|
67 |
|
68 |
-
リポジトリ名を適切に変更してください:
|
69 |
|
70 |
```bash
|
71 |
-
|
72 |
```
|
73 |
|
74 |
-
|
75 |
-
|
76 |
-
HarmonAI IIは、ユーザーのニーズに合わせてカスタマイズ可能です。設定ファイルを編集することで、プロジェクトの動作を柔軟に調整できます。
|
77 |
-
|
78 |
-
## 📝 Updates
|
79 |
|
80 |
- v1.1.0 (2024-04-24):
|
81 |
- フロントページの作成
|
82 |
- READMEの全体的な改善
|
83 |
- GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
|
84 |
-
- .gitignoreと.
|
85 |
- プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
|
86 |
- v1.0.0 (2024-04-20):
|
87 |
- 初回リリース
|
88 |
-
-
|
89 |
-
|
90 |
|
91 |
-
## 🤝
|
92 |
|
93 |
-
|
94 |
|
95 |
-
## 📄
|
96 |
|
97 |
-
|
98 |
|
99 |
-
## 🙏
|
100 |
|
101 |
-
|
102 |
|
103 |
- [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
|
104 |
-
- [
|
105 |
-
- [claude.ai](https://claude.ai/)チーム
|
106 |
|
107 |
-
引き続き、
|
|
|
32 |
>[!IMPORTANT]
|
33 |
>このリポジトリは[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage)を活用しており、リリースノートやREADME、コミットメッセージの9割は[SourceSage](https://github.com/Sunwood-ai-labs/SourceSage) + [claude.ai](https://claude.ai/)で生成しています。
|
34 |
|
35 |
+
## 🌟 イントロダクション
|
36 |
|
37 |
+
KotobaTranscriberは、日本語音声をテキストに変換するための最先端のソリューションです。最新の機械学習モデルを活用し、高精度な文字起こしを実現します。
|
38 |
|
39 |
+
音声ファイルをアップロードするだけで、KotobaTranscriberが自動的に音声を認識し、テキストに変換します。ビジネスミーティングや講義、インタビューなど、あらゆるシーンで活躍します。
|
40 |
|
41 |
+
## 🎥 デモ
|
42 |
|
43 |
+
KotobaTranscriberのデモアプリケーションをHugging Face Spacesで公開しています。ぜひ、実際に体験してみてください。
|
44 |
|
45 |
[![Hugging Face Spaces](https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue)](https://huggingface.co/spaces/Sunwood-ai-labs/KotobaTranscriber)
|
46 |
|
47 |
+
## 🚀 はじめに
|
48 |
|
49 |
+
### インストール
|
50 |
|
51 |
+
KotobaTranscriberのインストール手順は以下の通りです:
|
52 |
|
53 |
1. リポジトリをクローンします: `git clone https://github.com/Sunwood-ai-labs/KotobaTranscriber.git`
|
54 |
2. 必要な依存関係をインストールします: `pip install -r requirements.txt`
|
55 |
|
56 |
+
### 使用方法
|
57 |
|
58 |
+
KotobaTranscriberの基本的な使用方法は以下の通りです:
|
59 |
|
60 |
+
1. `app.py`を実行します: `python app.py`
|
61 |
+
2. ブラウザで`http://localhost:7860`にアクセスします
|
62 |
+
3. 音声ファイルをアップロードします
|
63 |
+
4. 文字起こし結果が表示されます
|
64 |
+
|
65 |
+
詳細な使用方法については、[ドキュメント](https://github.com/Sunwood-ai-labs/KotobaTranscriber/wiki)をご参照ください。
|
|
|
|
|
66 |
|
|
|
67 |
|
68 |
```bash
|
69 |
+
docker-compose up
|
70 |
```
|
71 |
|
72 |
+
## 📝 アップデート
|
|
|
|
|
|
|
|
|
73 |
|
74 |
- v1.1.0 (2024-04-24):
|
75 |
- フロントページの作成
|
76 |
- READMEの全体的な改善
|
77 |
- GitHub Actionsを使用したHuggingFace hubへの自動シンク機能の追加
|
78 |
+
- .gitignoreと.gitattributesの更新
|
79 |
- プロジェクト名を「HarmonAI」から「KotobaTranscriber」に変更
|
80 |
- v1.0.0 (2024-04-20):
|
81 |
- 初回リリース
|
82 |
+
- 基本的な文字起こし機能を実装
|
|
|
83 |
|
84 |
+
## 🤝 コントリビューション
|
85 |
|
86 |
+
KotobaTranscriberへのご協力は大歓迎です!バグ報告、機能要求、プルリクエストなどを通じて、プロジェクトの改善にご協力ください。詳細は[CONTRIBUTING.md](CONTRIBUTING.md)をご覧ください。
|
87 |
|
88 |
+
## 📄 ライセンス
|
89 |
|
90 |
+
KotobaTranscriberは[MIT License](LICENSE)の下でリリースされています。
|
91 |
|
92 |
+
## 🙏 謝辞
|
93 |
|
94 |
+
KotobaTranscriberの開発にあたり、以下の方々に感謝いたします:
|
95 |
|
96 |
- [Sunwood-ai-labs](https://github.com/Sunwood-ai-labs)チームのメンバー
|
97 |
+
- [kotoba-tech/kotoba-whisper-v1.0](https://huggingface.co/kotoba-tech/kotoba-whisper-v1.0)モデルの開発者の方々
|
|
|
98 |
|
99 |
+
引き続き、KotobaTranscriberプロジェクトをよろしくお願いいたします!
|
app.py
CHANGED
@@ -34,17 +34,27 @@ def transcribe(audio_file):
|
|
34 |
return result["text"]
|
35 |
|
36 |
description = """
|
37 |
-
<
|
|
|
|
|
|
|
38 |
"""
|
39 |
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
# Gradioインターフェースの定義
|
41 |
iface = gr.Interface(
|
42 |
fn=transcribe,
|
|
|
43 |
inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
|
44 |
outputs="text",
|
45 |
-
title="
|
46 |
description=description,
|
47 |
-
theme=
|
48 |
)
|
49 |
# アプリの起動
|
50 |
iface.launch(server_name="0.0.0.0", server_port=7860, share=True)
|
|
|
34 |
return result["text"]
|
35 |
|
36 |
description = """
|
37 |
+
<p align="center">
|
38 |
+
<img src="https://media.githubusercontent.com/media/Sunwood-ai-labs/KotobaTranscriber/main/docs/ship2.gif" width="70%">
|
39 |
+
<br>
|
40 |
+
</p>
|
41 |
"""
|
42 |
|
43 |
+
theme = gr.themes.Soft(
|
44 |
+
# neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#6b7280", c600="#4b5563", c700="#374151", c800="#1f2937", c900="#1E2D2F", c950="#1E2D2F"),
|
45 |
+
primary_hue="gray",
|
46 |
+
neutral_hue=gr.themes.Color(c100="#f3f4f6", c200="#e5e7eb", c300="#d1d5db", c400="#9ca3af", c50="#ecf1e8", c500="#1E2D2F", c600="#1E2D2F", c700="#374151", c800="#1f2937", c900="#111827", c950="#0b0f19"),
|
47 |
+
)
|
48 |
+
|
49 |
# Gradioインターフェースの定義
|
50 |
iface = gr.Interface(
|
51 |
fn=transcribe,
|
52 |
+
# fn=None,
|
53 |
inputs=gr.Audio(type="filepath", label="Upload Audio (MP3 or MP4)"),
|
54 |
outputs="text",
|
55 |
+
title="KotobaTranscriber",
|
56 |
description=description,
|
57 |
+
theme=theme,
|
58 |
)
|
59 |
# アプリの起動
|
60 |
iface.launch(server_name="0.0.0.0", server_port=7860, share=True)
|