YANAI Lab.電気通信大学 総合情報学科/大学院 総合情報学専攻 メディア情報学コース 柳井研究室 |
電気通信大学 > 情報工学科 > コンピュータ学講座 > 柳井研究室 > 研究紹介 |
モバイルデバイスでの画像認識を利用した料理レシピ推薦システム丸山 拓馬
1 はじめに近年、画像認識技術の進歩がめざましく、特に対象の見え 方に違いがある一般物体を対象にした研究分野ではBag-of-Features 手法を始めとして認識率の大幅な改善を促す画期的 な手法が提案されている。またスマートフォンを始めとして モバイルデバイスで計算処理能力が向上しており、画像認識 をモバイル上で行う研究に関心が集まっている。 本研究では特に料理レシピ推薦をテーマにあげ、画像認識を用いることでユーザに直感的な操 作で料理レシピを推薦できるシステムを提案する。
2 関連研究食材認識を用いた研究として、京都大学・美濃研究室のス マートキッチンプロジェクト(ユーザ主導型調理支援システ ム)[1]がある。 これは調理過程を設置したカメラでトラッキングして、ユー ザに次の調理動作を自動支援することを目標としている。ス マートキッチンを実現するための研究は意欲的に継続されて おり、[2]をはじまりとして、調理者の手の動きを時間制約 とした食材追跡[3]などがある。 また食材の料理レシピ推薦方法としての余剰食材の使い切りを 考慮した料理レシピセットの提案に関する研究[4]、冷蔵庫の食 材を考慮した料理レシピセットの推薦[5]などの研究が存在する。このように食材の画像認識、レシピ推薦は それぞれ多くの研究が存在するものの、モバイルデバイスでの画像認識と レシピ推薦を組み合わせた研究は今まで存在していない。
3 提案システム提案システムでは画像認識もしくは手動により食材カテゴ リを決定して、COOKPAD[6]より得られた料理レシピリストを 表示、料理レシピを選択して詳細の表示をおこなう。 その手順を次に示す。まずスマートフォンを食材にかざすと、食材画像を認識し て左側が上位認識結果となる食材候補リストに反映する(図 2:右上赤枠)。この時、1 位に分類された食材はその食材名 をクエリとしてレシピリストを取得してレシピ情報が即座に レシピリストに表示される(図2:左側緑枠)。2 位以下の食 材は画面タッチすることでレシピリストに反映ができる。最 後にレシピリストから目的のレシピをタッチするとそのレシ ピの情報の詳細が表示される。また比較用に手動選択によっ て食材の種類を選び、次に食材名をタッチすることでレシピ 表示することも可能である(図2:右側青枠)。
4 画像認識手法提案システムで採用している画像認識手法を説明する。1 画像特徴画像特徴としてカラーヒストグラムとSURF を利用して いる。カラーヒストグラムは画像を1212 分割した各部分 画像について、各色次元を4 分割した計64 次元のヒストグ ラムを抽出する。色空間にはRGB、HSV、La*b*を採用し ている。SURF は通常のキーポイント検出と、 のマルチスケールグリッド検出の2 種類 を利用する。
2 Bag-of-Features 手法Bag-of-Features 手法によって画像特徴を量子化して、1000 次元のコードブックを作成する( = 1000)。分類時にはKD- tree を構築してのコードワードを比較するだけで 判別できるように高速化している。
3 マルチフレーム認識認識に動画を使う場合に通常は1 フレームごとに特徴を 抽出してそれを分類するが、マルチフレーム認識では複数 フレームの特徴を抽出したあとにその特徴を統合して分類 する。システムでは連続フレームを対象にフレーム数を で採用している。
4 線形SVM分類には線形SVM を用いている。ここで式1のように変 形して、サポートベクトルと重みの計算を事前にしておくこ とで、計算の回数をから に減らして高速な計 算を実装している。
5 実験ここではシステムの評価として、実際に販売されている食材とその認識結果の例を示す。 代表的な特徴量とその手法の食材の認識精度を図3に、上 位k 個までを考慮した際の認識精度を図4に示す。レシピリストには最上位の結果が反映されるが、実験の結 果からSURF とRGB カラーヒストグラムを3frame で組み 合わせた場合に最も高い44.9% の精度を達成した。また食材 候補上位6 位まで考慮した際に84.1% の精度が得られるこ とがわかった。 SURF+color と colorの認識精度に大きな差がなかったので、 高速化のためにデモシステムではではcolor のみを用 いた。SURFの有無で精度に大きな差がなかった原因としては、 食材の認識には色が重要な手がかりであることと、単純なカラー ヒストグラムではなく、局所パッチのカラーヒストグラムをベクト ル量子化して、BoF表現にして利用していることが考えられる。 30食材を対象にカラーヒストグラム特徴のみで一回の分類に 要する時間はGalaxy S2(Android2.2、1GHz Dual Core)で0.17秒、HTC Desire HD(1GHz)で0.39秒であった。
6 まとめスマートフォンをかざすことで、30 種類の食材を認識して レシピを提示するシステムを提案した。 画像認識の評価では1 位の結 果では44.9% の精度、上位6 位まで考慮した際に84.1% の 精度で食材を認識できることを確認した。 今後は画像認識部分では色以外の特徴で安定的な認識をできるよ うにして1 位で70%、6 位までに90% を達成したい。またシ ステム部分では以下の3 点の改良を行いたいと考えている。
なお、デモアプリケーションは以下のURLからダウンロードすることが可能である。 http://mm.cs.uec.ac.jp/maruyama/recipe/
文献目録
|