任意の動画からAIが字幕ファイルを生成する他言語対応OSS・「Subtitle」

Ads

Subtitle

任意の動画からAIが字幕ファイルを生成する他言語対応OSS・「Subtitle」
Subtitleは任意の動画からAIが字幕ファイルを生成する他言語対応OSSです。

AIにはWhisper ASRモデルを採用しており、高精度な音声認識が可能です。利用の際にはFFmpegをインストールする必要があるみたいです。

スクリプトの実行は以下の要領で行います。

python subtitle.py <filepath | video_url> [--model <modelname>]

subtitle.pyの実行、対象となる動画ファイルの指定、Whisperのモデル指定、という感じです。例えばbaseモデルなら

python subtitle.py video.mp4 --model base

という感じで実行します。詳細等は開発者のブログをご覧ください。

モデルの指定法もリポジトリに記載されているのでそちらも参考にしてください。ライセンスはMIT。

Subtitle