移動経路を用いた旅行アルバム自動作成システム

奥山 幸也

2011年 2月4日

1 はじめに

1.1 背景

近年,GPS機能とカメラ機能を持った端末の普及によって, 写真撮影時にその撮影位置の位置情報を記録することが容易になっている. 同時に,Web上の写真共有サービスである Flickr1や Panoramio2なども位置情報付きの画像に対応し,地図上に撮影 位置を表示することが可能となっている.そのため,Web上には位置情報付きの 画像が増大してきており, そのような画像を対象とした研究は盛んになっている.また, 撮影位置の遷移からユーザの移動軌跡が分かるため,その移動のログを利用した 研究も増えてきている.

1.2 目的

そこで本研究では,Web上の多数のユーザが撮影した画像の位置軌跡のパターンを利用した 旅行支援のシステム開発を行う.

旅行写真の研究において位置情報は重要である.それは,その場所に特有の被写 体,建物やモニュメントがあるということから,多くの写真が撮影される場所は多くの人が興味を持っている建物やモニュメント,風景などの被写体が存在するということであり,そうした情報が多数の位置情報付き画像を収集することによって明らかになる.そのことから多くの研究 がある.

本研究では,写真の撮影場所を単なる「点」として捉えるのではなく,撮影者の移動した軌跡を利用し「線」として捉えることで,より有用な旅行支援システムの実現を目指す.

具体的には次のよ うな機能を持ったシステムを提案する.

観光ルート推薦
旅行前の支援のために,いくつかの観光地を選択すると,それを含むルートを提案する.
旅行記録の整理
ルートが決まった,もしくは旅行から帰ってから利用し,そのルートの整理と近隣の観光地の提示を行う.

1.3 軌跡の利用とその利点

有名なランドマークがいくつかある中でどういう順に回るのがいいのか,という事は 時間的な効率や意味的な回る順序が重要なことであり,人気の観光地の場所だけ が分かっても解けない問題である.一方,軌跡を使うことでそれぞれの観光地間 のつながりや,順序が測れるという利点がある.

GPSログデータと比較すると,精度やデータの細かさでは劣るものの,位置情報付き画像に比べてデータ量が不足しているという問題と,写 真ならでは利点もある.写真を撮影するという事は撮影者は何かしらの興味を引 かれたということである.つまり撮影が多くされた場所というものにはそれだけ で観光地としてのポテンシャルがあることが分かる.

2 関連研究

X.Luらの研究[1]では観光予定のルート生成に位置情報付き画像を利用している. 複数のユーザの撮影軌跡を組み合わせて観光地での滞在時間を考慮したルートを生成する.画像を利用をしていない,観光地内のランド マークや観光名所に関する情報がない,軌跡をクラスタリングせずに扱 うなどの点で本研究とは異なる.

Y.Araseらの研究[2]ではユーザのある一連の写真集をイベント分類し て,そのイベントをクエリにして旅行を推薦している.しかし, 広い規模での旅行を推薦しており,都市の中でのラ ンドマーク間の細かいルートを提示するという事はできない点,ルートを結合し ない点で本研究とは異なっ ている.

3 手法説明

3.1 データ収集

FlickrのWeb APIを利用しデータを集める.余計なデータやノイズになるデータ を除去する.除去するものは精度が低いとされているもの,違う時間に撮られていながら全く同 じ位置のもの,一日に一枚しか取られなかったものである.

3.2 撮影位置のクラスタリング

撮影位置のクラスタリングは,以下に示す階層的クラスタリング手法によって行う.
  1. すべての写撮影位置のそれぞれをクラスタの位置とする.
  2. もっとも距離の近い二つのクラスタをまとめて新たなクラスタとする.新たなクラスタの位置はクラスタに含まれる撮影位置の重心 とする.
  3. クラスタをまとめる作業をもっとも近い距離がある閾値以下になっ たところでクラスタリングを終了する.

3.3 観光地クラスタの解析

3.3.1 テキストタグによる観光地情報の抽出

テキストタグはそのものを具体的に表現するものもあれば抽象的 なものや大雑把なものもある. そこで次のようなスコアづけを行いクラスタ特有のテキストタグを抽出する.

あるクラスタ$c$内でのテキストタグ$t$の スコア$score_{c,t}$は次のように定義する.


\begin{displaymath}
score_{c,t} = \frac{クラスタc内のテキストタグt
の出現数}{全体のテキストタグtの出現数}\end{displaymath}

3.3.2 クラスタの代表画像の抽出

3.3.2.1 Speeded Up Robust Features

画像の特徴としてSURF(Speeded Up Robust Features)[3]を用いる. 物体認識に用いる特徴点を求める画像処理のアルゴリズムで,特徴点を類似 する特徴点検出よりも高速に求めることができ,照明変化,スケール変化,回転 に対して頑健な64次元の特徴量である.


3.3.2.2 代表画像の選出方法

クラスタ内の各画像間における特徴点マッチングの投票で代表画像を決定する.

各画像においてSURFを抽出し,画像それぞれに対して特徴点同士の特徴量がマッ チした分だけ投票を行う. 他の画像とも投票を行い総得票数がもっとも高いものがクラスタの代表画像とな る.

3.4 軌跡の抽出とモデル化

3.4.1 軌跡の抽出

FlickrAPIを利用することで写真のアップロード者IDや撮影日時,緯度経度情報,位置情報の精度などが得られる.その情報から,あるユーザのある一日に撮影された写真の撮影位置を時系列順に結ぶことで,そのユーザ の一日の移動の軌跡を求めることができる.この移動軌跡の一つの単位のことを「ト リップ」と表す.

3.5 軌跡のモデル化

「トリップ」のままでは他の「トリップ」との比較や結合がしづらく,狭い範囲 で多く写真を撮られた場合,移動の履歴が煩雑になってしまう. そこで「トリップ」中の各撮影位置を観光地クラスタに割り当てることで「トリッ プ」の モデル化を行う.このモデルを「トリップモデル」と呼ぶこととする.もしも,連 続する撮影位置が同じ観光地クラスタに割り当てられた場合は,その場所に留まっ ているとし,その移動は無効として扱う.

3.5.1 仮想的なトリップモデルの生成

すでにある「トリップモ デル」を基にその組み合わせで新しい「トリップモデル」を作成 する.

その手法を以下に示し,図1で例を示す.

図 1: 新しい「トリップモデル」の生成例

そのルートを通ってきた人は何らかの意図があった可 能性を考慮し,時系列を守り生成している.

4 システムの動作実験

4.1 データセット

Flickrから200万枚の画像を収集した.京都付近の写真をアップロードしていた162人のユーザ,1,805ヶ所の撮影位置 を閾値400mでクラスタリングを行い,154の観光地クラスタを得られた.仮想的な「トリッ プモデル」の生成を行い,合計18,752の重複のないルートを導出した.

4.2 観光ルート推薦

以下のステップで動作する.例を図2に示す.
  1. 代表画像の表示とユーザの観光地選択
  2. 候補「トリップモデル」の検索
  3. 候補経路の表示
図 2: 観光ルート推薦例
\includegraphics[width=0.45\textwidth]{rei1.eps}

1では推薦された観光地をランダムに回る場合と本手法が推薦するルートでの平均距離の比較を示した.これにより同じ観光地を巡る場合,ランダムに行くより,本手法を利用することで移動距離が短くなることが期待できる.

表 1: 経路の距離比較
手法 観光地間の距離の平均(km)
ランダム 3.810
本手法 2.512

4.3 旅行記録の整理

以下のステップで動作する.例を図3に示す.
  1. ユーザの移動軌跡を読み込む
  2. 作成した観光地クラスタ間の移動に置き換える.クラスタの代表画像をユーザ移動先の情報として付加する.
  3. ユーザの通ったとされる観光地クラスタに隣接する(トリップモデルで 隣り合う)観光地クラスタを発見して表示する.

図 3: 旅行記録の整理例
\includegraphics[width=0.45\textwidth]{rei2.eps}

5 おわりに

本研究では,位置情報付き写真の撮影位置の軌跡を利用することで旅行の支援を するシステムを開発した.

今後の課題として,現在は「京都」のデータしか扱っていないので,他の観光地 域のデータも扱うこと,経路検索の際に様々な要求を与えられるよう なシステムに機能を追加できる.例えば,出発地点やゴール地点を設定す ることや,巡る観光スポットの制限,移動距離,旅行時間による制限を行うこと, Web APIをさらに利用し観光クラスタの情報の強化や経路表示,表示の 改良を行うこと,実際に利用するユーザの使い勝手や,その推薦経路の妥当性や 有効性,その経路で旅行がしたいかという主観的な印象などの評価のために被験 者によるシステム評価の必要がある.

文献目録

1
X. Lu, C. Wang, J.M. Yang, Y. Pang, and L. Zhang.
Photo2trip: Generating travel routes from geo-tagged photos for trip planning.
In Proc.of ACM International Conference Multimedia, 2010.

2
Y. Arase, X. Xie, T. Hara, and S. Nishio.
Mining people's trips from large scale geo-tagged photos.
In Proc.of ACM International Conference Multimedia, 2010.

3
B. Herbert, E. Andreas, T. Tinne, and G. Luc.
Surf: Speeded up robust features.
Computer Vision and Image Understanding, pp. 346-359, 2008.




脚注

... Flickr1
http://www.flickr.com/
... Panoramio2
http://www.panoramio.com/