NTT R&Dフォーラム2014で、
ビッグメディアの探索と活用
〜パターン認識・メディア理解研究の最前線〜
を聞いてきた。その内容をメモメモ
■身の回りのメディア認識技術
自動販売機
自動運転
ドコモ「うつして翻訳」
→裏には、ビッグメディア
■あふれるメディア
動画・画像 Youtube,Flickr,Facebook(で投稿される写真)
モニタカメラ
■パターン認識
大きく分けて2つ
例1:猫を(犬と)識別する
→(犬と猫間の)線を引く、領域に入っているか?
→種類(ねこ)の認識・一般物
つまり : 学習→識別
例2:うちのねこを認識する
→線をひかずに、一番近いものをとってくる
→特定のモノの認識=2種類
特定物:うちのねこ
特定メディア:うちのねこの写真
つまり: 蓄積→探索
■ビッグメディア・アプローチ
ビッグデータ・ビッグメディアがもたらすもの
勘と経験 →データ集積
モデル →モデル+現実
同種単一 →異種・複合(クロス分析)
■集積は驚くほど強力
・さいころを振るより、少しましな答えをするもの
→よい結果になる
・高速で精度の低い識別を多数用意し
→多数決で
■ロバストメディア探索技術の仕組み(2003)
・RMS(Robust Media Search)
=NTTが開発した、音、映像、の高速探索技術
特徴:粗く量子化された、局所特徴の照合と集積
特徴データベース、特徴抽出
→10msの単位で変化に耐えられるように
・大規模ニューラルネットワーク
・RMSの進化とCo-Innovation
アクティブ探索(LAS)
RMS
マッシブリクエスト
(すまん、これが、第0世代、1、2、3世代とキレイにならんで
いろいろ書いてあったと思うが、写しきれなかった)
・フィールド
RMSサービスメニュー
全曲報告サービス
リアルタイムコンテンツマッチングサービス
ダブルスクリーンサービスなど・・・
(たしか、メモし切れていない。今見ると、何を書いたか、よくわからん^^;)
ごめん、キレイにメモしてなくて、よ〜わからん。
間違えているところ、ありそうだけど、ごめん・・
ビッグメディアの探索と活用
〜パターン認識・メディア理解研究の最前線〜
を聞いてきた。その内容をメモメモ
■身の回りのメディア認識技術
自動販売機
自動運転
ドコモ「うつして翻訳」
→裏には、ビッグメディア
■あふれるメディア
動画・画像 Youtube,Flickr,Facebook(で投稿される写真)
モニタカメラ
■パターン認識
大きく分けて2つ
例1:猫を(犬と)識別する
→(犬と猫間の)線を引く、領域に入っているか?
→種類(ねこ)の認識・一般物
つまり : 学習→識別
例2:うちのねこを認識する
→線をひかずに、一番近いものをとってくる
→特定のモノの認識=2種類
特定物:うちのねこ
特定メディア:うちのねこの写真
つまり: 蓄積→探索
■ビッグメディア・アプローチ
ビッグデータ・ビッグメディアがもたらすもの
勘と経験 →データ集積
モデル →モデル+現実
同種単一 →異種・複合(クロス分析)
■集積は驚くほど強力
・さいころを振るより、少しましな答えをするもの
→よい結果になる
・高速で精度の低い識別を多数用意し
→多数決で
■ロバストメディア探索技術の仕組み(2003)
・RMS(Robust Media Search)
=NTTが開発した、音、映像、の高速探索技術
特徴:粗く量子化された、局所特徴の照合と集積
特徴データベース、特徴抽出
→10msの単位で変化に耐えられるように
・大規模ニューラルネットワーク
・RMSの進化とCo-Innovation
アクティブ探索(LAS)
RMS
マッシブリクエスト
(すまん、これが、第0世代、1、2、3世代とキレイにならんで
いろいろ書いてあったと思うが、写しきれなかった)
・フィールド
RMSサービスメニュー
全曲報告サービス
リアルタイムコンテンツマッチングサービス
ダブルスクリーンサービスなど・・・
(たしか、メモし切れていない。今見ると、何を書いたか、よくわからん^^;)
ごめん、キレイにメモしてなくて、よ〜わからん。
間違えているところ、ありそうだけど、ごめん・・