GPT-4 Visionを使って任意の写真が世界のどこで撮られたかをAIが推測するオープンソースのWebアプリ・「LocGuessr」

Ads

LocGuessr


LocGuessrはGPT-4 Visionを使って任意の写真が世界のどこで撮られたかをAIが推測するオープンソースのWebアプリです。OpenAIの画像解析モデルと言えば今はgpt-4-vision-previewだと思いますが、これを元に、任意の写真を解析し、場所を特定する、というものになります。

何度かテストしたところ、写真に写っているオブジェクトによって精度が変わる様で、例えば水路とゴンドラが映っていればヴェネチアである事を当ててくれました。ただ、単なる海とヤシの木だけの写真でグアムを当てたり、南米かな?くらいにしか分からないような写真(上記サンプル)でもペルーのクスコと街の名まで当てたので精度はかなり高いと感じました。一応名のある名所の近くの広場(場所はここ)の写真ではありますが、どこにもありそうと言えばありそうなものなので、解析能力は結構なものですね。尚、試した写真は全て自分の撮った写真でWebにあげたことも無いものを使いました。

情報が少なければ国名のみの推測をするようですが、それでも結構な精度を確認出来ました。ただ、当然ですが、例えば日本国内のテーマパークなどで欧州様式を真似た建築物などの写真を解析させると日本のテーマパークだと認識できず欧州の国だと答えます。これも学習が重ねられれば答えられるようになるかもしれませんね。アプリは回数制限と画像のサイズ制限がありますが、OSSなので自身の管理するAPIキーを使ってセルフホストすれば制限を取って自由に試せますね。

LocGuessrGithub

タイトルとURLをコピーしました