画像やドキュメントファイルからAIでテキストを抽出するオープンソースのOCRツール・「EasyOCR」

Ads

EasyOCR


EasyOCRは画像やドキュメントファイルからAIでテキストを抽出するオープンソースのAI-OCR(Optical Character Recognition)ツールです。80ヵ国以上の言語がサポートされています。もちろん日本語も含まれています。

身近なものだとGoogleドライブにもOCR機能が付いていますね。同じように、任意の画像やドキュメントからテキストをアップロードし、抽出したい言語を指定(英語ならen、日本語ならja)するだけでテキストに変換してくれます。

また、回数を重ねる事で学習し、より高い精度になっていくよう設計されているそうです。pythonで書かれています。ブラウザで動作確認もできますので精度をお試しになってみてはいかがでしょう。ライセンスはApache-2.0との事。

EasyOCR