自然言語によるスクレイピングが可能なオープンソースのAI駆動スクレイピングアプリ・「Constellix AI」

Ads

Constellix AI

自然言語によるスクレイピングが可能なオープンソースのAI駆動スクレイピングアプリ・「Constellix AI」
Constellix AIは自然言語によるスクレイピングが可能なオープンソースのAI駆動スクレイピングアプリです。複雑な設定や操作不要でプロンプトによるオートスクレイピングを可能にする、というもの。

PlaywrightまたはPuppeteerといったブラウザ自動化ライブラリとシームレスに統合、LLMにはGeminiを採用、MCPサーバーを備えたスクレイピング特化のAIエージェントとして機能する事で、簡単な自然言語による自動スクレイピングを実行する事が出来ます。また、構造化されたクエリでも同様の結果を得る事が出来ます。

例えば「製品価格と詳細を教えて」といったプロンプトを元に任意の製品紹介のWebページで以下のようなデータを抽出してくれます。

{
"products": [
{
"name": "商品1",
"price": 12,000,
"description": "Adidasの2025年モデルのシューズ。カラーはレッド。"
},
{
"name": "商品2",
"price": 23,400,
"description": "NIKEの1万足限定スニーカー。ブラックカラー。"
}
]
}

セルフホスト可能な完全OSSとなっており、必要な経費はGeminiのAPIキーのコストくらいなので予算も手間も省けますね。

また、playgroundも用意(要Gemini APIキー)されており、導入前に性能を試す事が出来ます。気になる方は是非。ライセンスはMIT。

Constellix AIGithub