あらゆる言語に対応の、AIによる音声書き起こしが可能なオープンソースのデスクトップアプリ・「Vibe」

Ads

Vibe

あらゆる言語に対応の、AIによる音声書き起こしが可能なオープンソースのデスクトップアプリ・「Vibe」
Vibeはあらゆる言語に対応の、AIによる音声書き起こしが可能なオープンソースのデスクトップアプリです。音声文字起こしのAIモデルとしてwhisperが採用されています。各OS対応、Tauri(Rust)及びWhisper.cppなどで構成されています。

オフラインで動作し、データは送信されない仕様、SRT、VTTフォーマットのサポート、音声ファイルおよび動画の音声文字書き起こしが可能となっています。さらに今後の予定としてリアルタイム音声文字起こし対応、別言語に翻訳、文字起こしを行った文章の要約、他アプリの音声文字起こし対応、ポッドキャストの文字起こしサポートなどがロードマップに組み込まれています。

大事な授業を欠席した友人に頼まれて開発したそうです。個人的にはそう遠くない未来にキーボードが多くの方にとって不要になり、単純なテキスト入力なら音声が一般化するんじゃないかと思っています。並行して声が漏れないマスクのニーズが高くなるかなぁ、とか。

生成AIはまだまだ解決すべき問題が山のようにありますが、より良い方向に向かってくれるよう祈っています。ライセンスはMITとの事です。

Vibe