任意の動画内のシーン等を分析してテキストで検索可能にするOSS・「Edit Mind」

Ads

Edit Mind

任意の動画内のシーン等を分析してテキストで検索可能にするOSS・「Edit Mind」

Edit Mindは任意の動画内のシーン等を分析してテキストで検索可能にするOSSです。プライバシーファースト、ローカルファーストな設計でクラウドも不要との事。

動画の中のシーンやオブジェクト、セリフなどを検索できる、というもの。仕組みとしては、生成AIを使って音声の文字起こし、各フレームを分析して人物の顔や情報、映り込んでいるオブジェクト、文字などを分析し、これらをインデックスにしてDBに保存、検索できるようにしています。

現在の所はApple Silicon Mac向けに設計、或いはNVIDIA GPUを搭載したWindowsでもCUDA経由で利用可能だそうです。今のところサポートしている動画フォーマットは.mp4、.mov、.avi、.mkv、.mxfのみですが、今後拡大予定との事。もちろん外付けドライブやNAS上の動画も利用出来ます。尚、ローカルAIモデルには最低でも10GBの容量が必要です。

利用環境は選びますが動画を編集する業務の方はかなり作業効率が上がりそうですね。詳細は以下をご参照ください。

Edit MindGithub