OpenAI Whisperを使って任意の動画の字幕を自動生成するOSS・「Captune AI」

Ads

Captune AI

OpenAI Whisperを使って任意の動画の字幕を自動生成するOSS・「Captune AI」
Captune AIはOpenAI Whisperを使って任意の動画の字幕を自動生成するOSSです。処理はクライアントサイドで行われるそうです。

ご存知、OpenAIが開発、公開している音声認識AIであるWhisperを使って任意の動画の自動文字起こしと翻訳を行い、字幕を生成する、というもの。

構成はNext.jsをベースに、スタイリングにTailwindおよびRadix UI、認証にNextAuth.js、バックエンドにMongoDB、動画処理にFFmpegなどが採用されています。

今では特に珍しいというわけではないものになりましたが、選択肢が多い事は悪い事ではないですね。詳しい構造やインスト手順など詳細はリポジトリでご確認ください。

Captune AI