富士通フォーラムで
ビッグデータがイノベーションを引き起こす
キュレーターが実施する新たなデータ活用
富士通(部署省略) キュレーターの高梨氏
聞いてきたのでメモメモ
・ビッグデータのもたらすインパクト
「まっきんぜーのレポート
Big Data:The next frontier for innovation,competitioon and productivity」
ビッグデータの活用により ICTの活用
ビッグデータを活用するために 米国だけで14万人〜19万人不足
まねーじゃー、分析者150万人不足
データでできること、すべきこと
・LODから データジャーナリズム
LOD:Linked Open Data
富士通もLODを生かそうとしてる
Ted2010 Tim Berners-Lee講演 Row Data Now
上下水道の整備→白人と黒人の家
データを無作為に見たわけではない→必然
LOD:ハイチの地図
目的が明確:データも手に入る
・生活習慣病の高リスク者を予測
機械学習によるリスク予測モデル
単純なヒント→ヒントを増やす
・機械学習を用いた将棋ソフト
これまでの将棋ソフト
コツをヒアリング
開発者の固定観念、先入観、主観でパラメータ 500パラメータ
→アマチュア初段
機械学習を用いた将棋ソフト ぼなんざ〜
プロの棋譜
各こまの価値
こまとこまの位置関係
↓
「局面評価関数」の最適なパラメータを自動学習
9000万パラメータ
↓
プロレベル
・まとめ「ITデータでできること」
目的から
必要なデータを集めて
分析することで
課題を解決
集める/ためる 必要なデータとは
・なぜ大量のデータが必要か
データの集積度を上げることで、
ひとつのモノ・ひとりの人を
より深く理解できる
→一人一人に価値あるフィードバックを
・実現するコンバージェンスサービス
リアルワールドとバーチャルワールドが密接に連携
センシング
フィードバック
・コンバージェンスサービス全体の取り組み
コンバージェンスサービスは、
プラットフォーム、アプリ、人材で構成されています
・データ活用のステップ
1.データが実現するイノベーション
2.見直すべきデータ、新しいデータ
3.データから考える
4.新しい価値へ
・身近なデータを見直す
1.商品そのもの
2.業務の中で生み出されるデータ
3.ヒントになる外部データ
1,2 事業者から入手できんじゃい 大量の事実データ
=価値がある
・大量の事実データを再利用する
ローデータ
サマライズされる前
業務システム
ほかの目的で活用
・商品やプロセスを見続けるためのデータ
1つの製品や1つの業務の中でデータをデザイン
長期的な視点でデータをデザイン
どんなデータを使って新製品のスペックを間がエルベkぃ科
製品や利用者の何を見続けて行くべきか
↓
長期的なビジネス目標
・価値のある新しいデータを作る
ロジックに価値
データ→ロジック→生活習慣病
データに価値
生活習慣病の予測
→事業を通してしか得られないデータ
→長期的アドバンテージ
・まとめ
ひとつのモノ、ひとりの人を理解するためにデータをあつめる
データ発生源に価値あるフィードバック・・・
(かききれん)
キュレーター
・データから考える
人知に基づくアプローチ
データに基づくアプローチ
・キュレーターのアプローチ
データビューイング
モデリング&アナリティクス
・データビューイング
1.データの概観
テーブル数
レコード数
項目数
収集機関
2.固有IDの確認
予測したい単位の定義
固有IDの存在
全体の出現数
補完の可能性
3.目的変数の確認
予測すべき事象を定義
フラグの存在
4.説明変数の確認
・モデリング&アナリティクス(予測モデル作成)
5.特徴量の作成
ヒントとなる項目を作成
6.モデルの構築
予測モデルの構築
7.モデルの評価
・データから理解するモノ
データを通して、モノの向こう側にいるヒトとコトを捕らえる
目に見える事象から推測
・データから理解するステップ
1.センシング
2.スライシング
3.エクスプレッション
4.アグリケーション
捕らえたいモノ/コト
5.キュレーション
・ロジック+データで理解する
ヒトをより深く理解するためのデータ活用
ロジックは精度向上に、データは世界を広げるために
モノでフィードバック
好みでフィードバック
思いでフィードバック
世界観を広げる
・まとめ
データで解くほうが効率y的
キュレーションサービス
・データ活用をサポートするキュレーター
業務知識をいかにはずせるか
モデリング
アナリティクス
システムデザイン
・データによる価値創造サイクル
キュレーションサービス
・商品「データコンサルティング」
・キュレーションサービス(分析チーム)の価値
・分析アルゴリズムをさまざまなデータに展開
・参考 オートアナリティクス(仮称)
関連性マップ
・参考 データ活用ワークショップ
目的をどう作って共有するか
トライアルワークショップ
データビューイングワークショップ
ビッグデータブートキャンプ
・参考 ビッグデータ・ブートキャンプの考え方
バックキャスト
・参考 データプラーザ
データ利活用促進の場所
まとめ
事例
・購買データから顧客の特徴を見出す
・検査データから品質見直し
クラスタリング(デンドログラム)
・Webページを評価方法を見直す
まとめ
・ローデータは必ずある
・データを味方にして競争力を
ビッグデータがイノベーションを引き起こす
キュレーターが実施する新たなデータ活用
富士通(部署省略) キュレーターの高梨氏
聞いてきたのでメモメモ
・ビッグデータのもたらすインパクト
「まっきんぜーのレポート
Big Data:The next frontier for innovation,competitioon and productivity」
ビッグデータの活用により ICTの活用
ビッグデータを活用するために 米国だけで14万人〜19万人不足
まねーじゃー、分析者150万人不足
データでできること、すべきこと
・LODから データジャーナリズム
LOD:Linked Open Data
富士通もLODを生かそうとしてる
Ted2010 Tim Berners-Lee講演 Row Data Now
上下水道の整備→白人と黒人の家
データを無作為に見たわけではない→必然
LOD:ハイチの地図
目的が明確:データも手に入る
・生活習慣病の高リスク者を予測
機械学習によるリスク予測モデル
単純なヒント→ヒントを増やす
・機械学習を用いた将棋ソフト
これまでの将棋ソフト
コツをヒアリング
開発者の固定観念、先入観、主観でパラメータ 500パラメータ
→アマチュア初段
機械学習を用いた将棋ソフト ぼなんざ〜
プロの棋譜
各こまの価値
こまとこまの位置関係
↓
「局面評価関数」の最適なパラメータを自動学習
9000万パラメータ
↓
プロレベル
・まとめ「ITデータでできること」
目的から
必要なデータを集めて
分析することで
課題を解決
集める/ためる 必要なデータとは
・なぜ大量のデータが必要か
データの集積度を上げることで、
ひとつのモノ・ひとりの人を
より深く理解できる
→一人一人に価値あるフィードバックを
・実現するコンバージェンスサービス
リアルワールドとバーチャルワールドが密接に連携
センシング
フィードバック
・コンバージェンスサービス全体の取り組み
コンバージェンスサービスは、
プラットフォーム、アプリ、人材で構成されています
・データ活用のステップ
1.データが実現するイノベーション
2.見直すべきデータ、新しいデータ
3.データから考える
4.新しい価値へ
・身近なデータを見直す
1.商品そのもの
2.業務の中で生み出されるデータ
3.ヒントになる外部データ
1,2 事業者から入手できんじゃい 大量の事実データ
=価値がある
・大量の事実データを再利用する
ローデータ
サマライズされる前
業務システム
ほかの目的で活用
・商品やプロセスを見続けるためのデータ
1つの製品や1つの業務の中でデータをデザイン
長期的な視点でデータをデザイン
どんなデータを使って新製品のスペックを間がエルベkぃ科
製品や利用者の何を見続けて行くべきか
↓
長期的なビジネス目標
・価値のある新しいデータを作る
ロジックに価値
データ→ロジック→生活習慣病
データに価値
生活習慣病の予測
→事業を通してしか得られないデータ
→長期的アドバンテージ
・まとめ
ひとつのモノ、ひとりの人を理解するためにデータをあつめる
データ発生源に価値あるフィードバック・・・
(かききれん)
キュレーター
・データから考える
人知に基づくアプローチ
データに基づくアプローチ
・キュレーターのアプローチ
データビューイング
モデリング&アナリティクス
・データビューイング
1.データの概観
テーブル数
レコード数
項目数
収集機関
2.固有IDの確認
予測したい単位の定義
固有IDの存在
全体の出現数
補完の可能性
3.目的変数の確認
予測すべき事象を定義
フラグの存在
4.説明変数の確認
・モデリング&アナリティクス(予測モデル作成)
5.特徴量の作成
ヒントとなる項目を作成
6.モデルの構築
予測モデルの構築
7.モデルの評価
・データから理解するモノ
データを通して、モノの向こう側にいるヒトとコトを捕らえる
目に見える事象から推測
・データから理解するステップ
1.センシング
2.スライシング
3.エクスプレッション
4.アグリケーション
捕らえたいモノ/コト
5.キュレーション
・ロジック+データで理解する
ヒトをより深く理解するためのデータ活用
ロジックは精度向上に、データは世界を広げるために
モノでフィードバック
好みでフィードバック
思いでフィードバック
世界観を広げる
・まとめ
データで解くほうが効率y的
キュレーションサービス
・データ活用をサポートするキュレーター
業務知識をいかにはずせるか
モデリング
アナリティクス
システムデザイン
・データによる価値創造サイクル
キュレーションサービス
・商品「データコンサルティング」
・キュレーションサービス(分析チーム)の価値
・分析アルゴリズムをさまざまなデータに展開
・参考 オートアナリティクス(仮称)
関連性マップ
・参考 データ活用ワークショップ
目的をどう作って共有するか
トライアルワークショップ
データビューイングワークショップ
ビッグデータブートキャンプ
・参考 ビッグデータ・ブートキャンプの考え方
バックキャスト
・参考 データプラーザ
データ利活用促進の場所
まとめ
事例
・購買データから顧客の特徴を見出す
・検査データから品質見直し
クラスタリング(デンドログラム)
・Webページを評価方法を見直す
まとめ
・ローデータは必ずある
・データを味方にして競争力を