今、画像認識が熱い！システムが見通すO2Oの未来とは

2015
03.13

今、画像認識が熱い！システムが見通すO2Oの未来とは

こんにちは。O2O販促ラボ・伊藤です。

数年前のことでしょうか。
書籍を裁断して電子書籍化する、いわゆる自炊の是非を巡って大激論が起こっていたことを記憶しています。その時期にOCRという単語を初めて聞かれた方もいらっしゃるのではないでしょうか。OCRは画像に含まれるテキストを認識する技術で、それ自体は結構昔から存在を聞いておりましたが、この「画像認識」という分野がSNSやエンターテイメント、安全性の補助など、実生活に近いシーンで多様に使用されるようになり、オンラインとオフラインを結びつけるO2O技術の一つになってきたと感じましたので今回のテーマにさせて頂きます。

Googleから凄いニュースが届いていた

A picture is worth a thousand (coherent)words: building a natural description of images

上記ページは英語かつ難解で、各論を理解することは出来ていないのですが、要するに「一枚の絵を取り込んだシステムが、その絵に写っている物体、状況を加味して勝手に説明文を組み立てるよ！」と言っています。

すごい！

精度はまだまだらしいのですが、例えば下記のような画像の説明に成功しています。画像の下の説明は人間が付け加えたものではなく、システムが画像から判断したものです。
（引用： http://googleresearch.blogspot.jp/2014/11/a-picture-is-worth-thousand-coherent.html）

訳：未舗装の道でバイクに乗る人

訳：フリスビーで遊ぶ若いグループ

すごすぎる！

下記のような画像の解析には失敗しているとのことですが、もう結構当たりに近いところまで来ているのではないでしょうか。

訳：フリスビーをジャンピングキャッチしている犬

訳：食べ物と飲み物でいっぱいの冷蔵庫

この技術は、明らかにGoogle Glassとの親和性が高そうなので、ウェアラブルデバイスにも導入されていくことになるのでしょう。上記ページでGoogleは「きっと視覚障害の役に立つよ」と言っています。
また、このシステムの驚くべきは「画像認識が出来た」だけではなく、むしろ画像に写っている物体が何なのか、どういう状況なのか、というところをシステムが学んでいくところにあります。そのため、今後も飛躍的に認識能力は上がっていくことでしょう。ほとんどSFの世界に入ってきたなぁと実感します。

Googleだけじゃない。最近の画像解析とその応用

東芝、演算性能が毎秒１．９兆回の車載向け画像認識プロセッサー開発

引用： http://toshiba.semicon-storage.com/jp/product/automotive/image-recognition.html

上司が「EyeSightは凄い」と言っていました。車に詳しくない私は、まずそれを搭載している車種が分からないのですが、「ぶつからない車」として、自動ブレーキシステムは広く車に実装されるようになってきました。またブレーキだけではなく、画像認識を用いて、スピードの制御、ハンドル操作のアシストまでこなしてくれるというのだから舌を巻きます。このニュースを見る限り、GPSで目的地設定、画像認識で完全自動運転と言った未来もそうそう遠くないように思います。

JR西日本、駅ホーム上の事故防止に「カメラ画像解析」導入へ

引用： http://www.westjr.co.jp/press/article/2014/12/page_6611.html

画像解析で線路への転落事故を防ごうとする取り組みです。前述の車のハンドル操作でも言えることですが、線路への転落を自動検知して列車の停止手配まで行うというのですから、まだ運用前とは言え、正確性に相当な自信がうかがえます。

まだまだ未来の技術、正確性にかける胡散臭い技術と思っていた画像認証が、人間の把握出来る情報を補完するものとして、実用に耐えうるレベルになったという好例だと思います。

画像解析技術でフリマアプリなどの不正出品を防ぐ「模倣品画像検知システム」をイー・ガーディアンが提供開始

引用： http://shopping-tribe.com/news/14765/

ネットショップで問題の絶えない不正を防ぐ素晴らしい技術です。
例えばブランドバッグの偽物画像をシステムに覚えさせておくことにより、同様の画像投稿があった場合、検知をするシステムとのこと。
今EC業界では偽物の販売で多くの消費者が被害を被っていると聞きます。またこの技術は裏を返せば、画像の正当性を保証する技術にもなっていくのではないでしょうか。
近い未来でECやO2Oに取り入れられることは十分に考えられ、販促などに利用されれば、信頼性の向上による集客効果、マーケットの拡大もありうるかと思われます。

画像解析によるO2Oマーケティング支援を行うABEJA、セールスフォースと第三者割当増資引き受けによる資本業務提携を実施

引用： http://www.abeja.asia/

こちらは来店したお客さんの顔を画像認識して性別や年齢を推定するサービスです。
これを来店履歴とすることで、来店頻度や滞在時間を取得出来るそうです。プライバシーの諸問題はさておき、これまで人の能力を使わないと出来なかったことがコンピュータに出来るようになり、現実世界でさらに効率的なリターゲティングが出来るようになるかと思われます。

人とシステムで情報を漏らさない

ここでご紹介した様々な新技術のニュースから見るに、画像認識は数えきれないほどの可能性を秘めていると思われます。コンピュータの目には、この世界はどう見えているのでしょうか。
それをコンピュータ自身が説明してくれる時代もすぐそこまで来ているのでしょう。

例えば、そのうち自宅写真を自分のスマホで撮ると、空間コンサルティングをし、その部屋にマッチする家具を販売している店舗へ導くシステム、アプリが開発されるかもしれません。あるいは衣服の写真を撮っただけで、その商品、もしくは類似品への購入ページを開いてくれるような、ある種のO2O（Offline to Online）も実現が可能でしょう。
その画像解析を支えるために、「信頼のおける」画像データベースも出来上がっていくことでより精度が上がって実用性が高まるのだと思われます。

しかし、システムが把握する画像の情報、イコール、人が認識する情報ではありません。まだまだシステムには行間や文脈や空気を読むことは苦手です。
システムが出力、あるいは蓄えた情報を、どのように活かしていくかは、まだまだ人が考える必要がありそうです。