OCRやComputer Visionを用いて画像内のテーブルやテキストから構造化データを抽出するOSS・「Table Transformer」

Ads

Table Transformer

OCRやComputer Visionを用いて画像内のテーブルやテキストから構造化データを抽出するOSS・「Table Transformer」
Table TransformerはOCRやComputer Visionを用いて画像内のテーブルやテキストから構造化データを抽出するOSSです。Conda/Pythonで書かれておりMITライセンスの元でソースコードが公開されています。

表題の通りでOCRとCV技術を用いて任意の画像内のテーブルや文章を検出及び抽出し、組み合わせ、HTMLやCSVなどにデータとしてエクスポートする、というもの。

資料として画像化されたデータは非常に多いですので欲しかった方も少なく無いのではないでしょうか。LLMの前処理やデータ分析などに利用して欲しいとの事です。

Table Transformer