Warid
Waridは録音した音声をAIが文字起こしや翻訳してくれるオープンソースのデスクトップSTTアプリです。いわゆるAI文字起こしアプリ(STT=Speech-to-Text)ですが、普段使いしやすいよう設計されています。
WisperではなくGeminiをモデルに採用したSTTアプリで、マイクから録音するか音声ファイルを読み込ませる事で任意の国の言語に翻訳した状態で文字起こしをしてくれる、というもの。
1語ずつ表示されるストリーミング出力、文字起こしが完了すると自動コピー、ショトカで直ぐに録音開始可能、バックグラウンドでも機能、SQLiteに保存・検索可能な履歴システムなど目立たないUIで自然にマシンでSTTが使えるようになります。
利用にあたりGeminiのAPIキーを取得する必要がありますが、無料枠でも利用できるそうです。Tauriベースで構築、Windows、MacOS、Linuxの各OSがサポートされています。
