ようこそゲストさん

Yanal-Lab News

2015/06/11(木) インタラクティブセッション2_柿森

IS2-03
ウォークスルー型指静脈認証技術の開発 松田ら(日立)

P6110275.JPG

駅や空港などで本人確認の混雑を解消するために、歩きながら手のひらをかざす指静脈認証技術を提案している。
通常の静脈認証では手首を台の上に置いて固定し、環境光が入らないように認証を行っている。
本研究では改札でSuicaをタッチするように、手のひらをかざすことで認証を行う。
最大で1分あたり70回認識できる。
60fpsで認証しているので、一瞬手のひらを止める必要があるが、足を止めずに認証を行え、EER=0.0018%という精度を出している。

EER=0.0018%が静脈認証として安全なのか、改良の余地がある数字なのか聞いたところ、一般の静脈認証の精度が分からないと言われた。
ただ、空港で利用することを考えた時に、もう少し改善しなければならないという回答であった。



IS2-19
人とのインタラクションに着目した物体認識に関する基礎検討 石島ら(秋田県立大)

P6110277.JPGP6110278.JPG

鉛筆や箸など見分けにくいものを物体認識で見分ける方法として、人のインタラクションン(例えば「摘む」、「書く」など)を利用することで精度を高めようという試み。
同じ棒状のものが検出されても人が「書く」という動作をしていれば鉛筆と判定すべきであるということ。

しかし、ポスターで発表されていた内容は、それを行う前段階として、手が映り込んでいた時の認識精度の低下についてと、手を画像から消した時の認識率向上に関しての発表であり、目的までまだまだ遠い道のりだと感じた。
さらに、摘むという動作の認識方法(認識させるのかすらわからない)や、その情報をどのように物体認識に利用するのか具体案も出ていない状況だった。
もう少し研究が進んでいないとポスターでの議論もできないという印象を受けた。



IS2-21
画像検索における不正確なタグ付けの排除 植木ら(早稲田大)

P6110276.JPG

物体認識などで大量のデータを集める際に、google検索などではノイズが混じることがある。
それらの不正確なタグがついた画像を学習データから排除する手法を提案している。

手法はいたってシンプルであり、ノイズ入りの学習データで学習し、クロスバリデーションを行い、学習データ内で異なる結果が出た画像を排除する。(Pの学習データからNが出たらそれを削除。逆も同じ)
学習モデルはAlexNetの第6層を利用し、ロジスティック回帰で分類している。

こちらからの質問をいくつかしたので、それを載せる。
Q「ノイズが多いと破たんする気がするがどうなのか。」A「はい」
Q「タグが不一致だが似ている(車とバイク)などでは本手法は難しい気がする。」A「試していないが、そんな気がする。」
Q「不正確なタグがついた画像に引っ張られる危険性は無いのか。」A「少量であれば大丈夫。おそらくロジスティック回帰がそのあたりを回避していると思われるが、ほかの手法(SVMやDCNNで最後までやる)は試していないので分からない。」

1: Williamevorm 2024年04月23日(火) 午後10時34分

https://www.bagssjp.com スーパーコピー 時計
https://www.bagssjp.com/menu/menu_pinpai-55.html ロレックス 時計スーパーコピー

2: DavidMix 2024年04月23日(火) 午後11時22分

https://www.bagtojapan.com/ ブランドコピー
https://www.bagtojapan.com/category/46.htm ロレックス 偽物
https://www.bagtojapan.com/category/47.htm ウブロ スーパーコピー 自動巻き

3: DwayneBlore 2024年04月23日(火) 午後11時58分

https://www.copysale.net スーパーコピーブランド専門店
https://www.copysale.net/wallet-news.htm スーパーコピー財布
https://www.copysale.net/ROLEX-Fake.htm ロレックス偽物激安


名前:  非公開コメント   

  • TB-URL  http://mm.cs.uec.ac.jp/adiary/adiary.cgi/yanailab/015/tb/

2015/06/11(木) インタラクティブセッション1_柿森

IS1-10
偏光情報の画像認識処理への応用 笠原ら(RICOH)

P6110258.JPG
P6110257.JPG

光の偏光情報はRGBとは別の物理量であり、偏光情報とRGB情報の二つを同時に用いることで、認識精度を上昇させた。
例えば、自動車が路面や白線、対向車の認識を行うとき、認識精度は太陽などに大きな影響を受けてしまう。
車の認識では偏光情報を用いることで、ガラス部分に大きな特徴が現れることが分かった。

認識はSVMを用いているがDCNNの入力として偏光情報を用いることもできるのではないかと考えられる。



IS1-35
注視誘導技術に基づく誘目性を考慮したセールス・プロモーションツールのデザイン支援システム 滝本ら(岡山県立大学)

P6110267.JPGP6110268.JPG

店頭ディスプレイやPOP広告などを作成する場合、人の視線を引き付ける配色を考慮したデザイン支援システムを提案している。
例えば、コーヒーの広告を載せる場合、ユーザは茶色を想像する。その茶色をもとに、顕著性マップから目立つ色を強調することで、広告を目立たせる。
色の調和性なども考慮しており、ムーン・スペンサーモデルや色彩調和性モデルを利用している。
評価実験では、デザイン学部の学生にデザインしてもらった物と比較実験を行い、似た色を提示できたことで、有用性を示せた。

しかし、問題点として、店頭ディスプレイは果たして目立つだけでよいのか。最終的に購買に繋がらなければ意味がないのではないか。
また、周囲の環境と調和した色を選ばなければ周囲から浮いた広告になってしまう。
これらの問題はまだ残っていると語っていた。

名前:  非公開コメント   

  • TB-URL  http://mm.cs.uec.ac.jp/adiary/adiary.cgi/yanailab/013/tb/

2015/06/11(木) インタラクティブセッション2 岡元

IS2-17 CT画像向け放射状特徴点サンプリングによる位置合わせ手法の開発

DSCN3329.JPG

柳井研OBの松田さんの名前が入っている発表
(残念ながらポスターではお会いできず…)

今までは年々変化する腫瘍を見つけるためには医師が
手動で何枚もの画像を参照し探し出さなければならなかったが
それを自動で行う研究

腫瘍は変化するので鍵として使うことはできないが
周辺の血管や肺の壁などから特徴を抽出
その特徴をマッチングさせていき
最もマッチする個所を探す

特徴には速度を考慮しBRIEF特徴量を使用している
今までは30秒近くかかっていた作業が4~5程度で自動で
行われるので医師の負担軽減が期待される

IS2-13 Deep Convolutional Neural Networkによる顔器官検出における最適なミニバッチ作成方法

DSCN3328.JPG

DCNNに与えるサンプルの増加方法についての考察

方法は3つ提案されている
学習サンプルに変化を与え、そのサンプルを繰り返し使用する方法
学習サンプルからセットを決めそれに対して毎回異なる変化を与え繰り返し使用する方法
学習サンプルからランダムにセットを決めランダムに変化を与える方法

著者らも一番下のものが結果がよくなると考えていたが結果はそうではなく
一番上の手法が最も性能が良かった

これは決まった点を決めるタスクでは様々な変化を与えて学習を行うよりも
決まった同じ画像で学習を繰り返し確実に器官を検出できた方が良かった

これはこのようなタスクなのでこのような結果になったが
一般物体認識などでは同様な結果が出るとは限らない

名前:  非公開コメント   

  • TB-URL  http://mm.cs.uec.ac.jp/adiary/adiary.cgi/yanailab/014/tb/

2015/06/11(木) インタラクティブセッション1 岡元

IS1-20 複数カメラを用いた外観が類似する複数物体のリアルタイム3次元復元

DSCN3307.JPG

Track-Graph,MAP-EMという手法を用いる
ターゲット形状に基づき前景領域がターゲットと混同するのを防ぎ、
非常に高速で精度のよい3D復元と物体追跡を実現している。

デモとしておもちゃのサッカーゲームの人形を最大8個までも
正確で高速に追跡できていた。
処理はGPU,CPUで並列に行い30fpsでサクサク実行できていた。


IS1-34 指振りによる簡易な複数機器操作手法の構築

DSCN3312.JPG

4台のカメラが設置されている部屋内で動作によって
複数の家電を操作する。
この時の動作とは非常に小さく、ユーザの負担が小さく恥ずかしかったりしない
複数のカメラで撮影を行っているので3D復元が可能であり
人の形状を復元、その体を中心に座標系を作成する
このおかげでたとえ寝ていても同様に動作で家電を操作することができる。
認識は1~2秒程度で実行され小さい動作でも検出できている。

名前:  非公開コメント   

  • TB-URL  http://mm.cs.uec.ac.jp/adiary/adiary.cgi/yanailab/012/tb/

2015/06/11(木) オーガナイズドセッション1 「産業界で今まさに成長期に入った画像認識」

OS-01混雑環境の安心安全を実現する群集行動解析

概要:監視カメラを用いて立ち入り禁止個所への監視や人ごみの状態把握を行う
人ごみでの人数推定にCNNを用いている
しかしCNNを用いるためには多数のデータセットが必要
そこで人工データセットを作成 精度はほとんど変わらない

以下スライド概要
監視カメラでの撮影を行い、近づいてはいけない個所や普段人がいない位置に人がいることを警告してくれるシステムは存在している
実際にアルゼンチンでは街に800台ものカメラを設置し街を守っている

現在では人の流れや、取り囲みといった細かい環境にも適応できるようにする

施設全体の混雑状況も把握し、異変などにもすぐに対応できるようにしている

混雑検出には人物検出ベースと非人物検知ベースの2種類存在している
人物は混雑時に少し弱い
非人物は混雑時でも可能だが少し精度が低い

CNNで人数推定を行う

プライバシーの問題で実際の混雑映像を撮影するのは難しい
また大体日常風景、非日常はない
なので人工的に学習データを作る
背景データと人物データをそれぞれ作成しそれを組み合わせ学習データを増やす
合成画像でも実環境に負けてない

実用化には様々な環境下に対応しなければならない
背景の影響を受けるので背景を切り落としたりする

群集行動の把握
実用化に向けての工夫


OS1-02自動車の安全運転支援のための画像認識プロセッサ

概要:近年では衝突を回避するようなシステムが求められている
しかしPCを乗せるわけにもいかないので専用のチップを開発する 「Visconti」
CoHoGなどを用いて歩行者・車の検出を行う
中々開発費用が貰えなかった話や今後の自社が生き残れるかどうかなど少し企業よりなお話でした

以下スライド概要
今では衝突安全から予防安全へ
シートベルトからステレオカメラへ

しかし車にパソコンを乗せておくわけにはいかない
画像を与えトップビューや後ろへの変換を行ったりする
提案手法はメモリを太量に持っているので高速な手法である

SfMを用いた距離推定
幾何解析
パターン認識
と様々なものが搭載されだした。
歩行者検出、車両検出、レーン検出を行う

最初はなかなか売れなかった
そのため開発が中々進まない
他社のが流行って作れるようになった
CoHoG

今後市場は拡大し安定していくと考えている
今後は他社と差をつけるため安さや精度、自動運転への対応を考えている

OS1-03 画像解析技術と番組アーカイブス検索システムへの応用

概要:放送のデータは日々たまり続けその情報を素早く検索するシステムが必要
オブジェクト認識と類似画像検索を用いて番組を検索
顕著性マップやSpatial Pyramidなどを用いて既存手法からの精度を上げている
Caltech101やTRECVIDの話などあったが最新の研究と比べてしまうと性能はそこまででもない

以下スライド概要
日々映像はたまり続ける 番組は日100件、ニュースは300件
テープからファイルに変化してきており、映像検索技術の重要性は今後もますます増加
従来にも番組検索システムは存在している。
今までは
人手でメタデータを入れなければならない
番組単位でしか検索できない
言葉で表現できないような映像を検索できない
そこで画像認識技術を利用した映像検索システムを提案

オブジェクト認識
Denseサンプリングと色・テクスチャ・Spatial Pyramid
周辺特徴をまとめて検出それを統合しMax pooling
Caltech101で80%程度
実際の使用環境で90%程度の再現性
TRECVIDでの評価Semantic Indexingタスク
2013年で平均適合率0.1程度 順位40位


類似画像検索
従来技術ではブロックに分割しマッチングを取る
背景や被写体の位置形状の変化の影響を受ける

顕著性マップをいれて被写体領域を抽出
その領域のみで類似検索を行う
ハッシュなどを用いて類似のクエリだけを検索することで精度と速度を向上させている
適合率34%

NHKアーカイブス
1981年以降の番組データを保存
ここで検索も行っている
上記の手法を用いて認識を用いた映像検索システムの作成を行った
2015年1月から4月までを運用テスト
これから分析を行ったりアンケートなどをとる

名前:  非公開コメント   

  • TB-URL  http://mm.cs.uec.ac.jp/adiary/adiary.cgi/yanailab/011/tb/