OmniParse
OmniParse画像や動画、ドキュメント等、様々な非構造化データを取り込んで解析し、GenAI (LLM) アプリ用に構造化データとして変換するOSSです。
あらゆるデータを生成AI向けに構造化するデータ変換のための解析プラットフォームとして提供されています。任意のドキュメント、表、画像、動画、音声ファイル、Webページなどをクリーンなデータに構造化し、RAGや微調整に対応できるよう変換してくれる、というもの。
外部API不要の完全ローカルで動作、ドキュメントやWebページはMarkdownに、表の抽出、画像へのキャプション付け、動画や音声の文字起こしなどを行います。また、今後の開発予定としてLlamaIndexやLangchain、Haystackなどとの統合、より簡単にデータ化するためのAPIの提供、動的モデルの選択と外部APIのサポート、複数ファイルの同時処理機能などを追加予定だそうです。
自社モデルの開発を行っているけどデータの構造化で苦戦している、という開発チームの方は導入を検討されてみては如何でしょうか。ライセンスはGPL。