OCRやComputer Visionを用いて画像内のテーブルやテキストから構造化データを抽出するOSS・「Table Transformer」

Ads

2025.02.24

Table Transformer

Table TransformerはOCRやComputer Visionを用いて画像内のテーブルやテキストから構造化データを抽出するOSSです。Conda/Pythonで書かれておりMITライセンスの元でソースコードが公開されています。

表題の通りでOCRとCV技術を用いて任意の画像内のテーブルや文章を検出及び抽出し、組み合わせ、HTMLやCSVなどにデータとしてエクスポートする、というもの。

資料として画像化されたデータは非常に多いですので欲しかった方も少なく無いのではないでしょうか。LLMの前処理やデータ分析などに利用して欲しいとの事です。

Table Transformer

Resources & Tools

Resource全記事 →

OSS

OSS全記事 →

AI

AI全記事 →

CSS snippet

CSS全記事 →

JavaScript snippet

JavaScript全記事 →

WordPress Code

WordPress全記事 →