11月5日、オープンソースカンファレンス2016 Tokyo/Fallに行ってきた!
次は
オープンソースをベースとしたパーソナルIoTの作りかたと異常検知について
をメモメモ
・はじめに
このデータ 2LDK,70平米 築10年 東京23区→家賃1.7万円
(実際にあったデータです)
→なんかあるよね・・・いわくつき
→電話かける→不動産や、休み→次の日に電話:入力ミス。17万円
→入力ミスの間に、データが広がってしまい・・・
●システムが、答えてくれるのがやさしい。
これを、検知できないのか?
(1)パーソナライズIoTの勘所
・Industry Internet パーソナルIoT
インダストリー4.0 API
・パーソナルとしてのIoT活用
センサー 漁師さん
クラウド 市場
AI 料理人
IoT おすし
1)個人でIoTを作れる時代
2)知恵と想像力でIoTを活用する波を起こす
・ 見える化・計数値化
・要素技術
センサー、シングルボードコンピューター、3Dプリンター
・3Dプリンターでロボット、ギター、プリント基板
・ウェザーステーションNetatmoからのデータ取得
・Webからリアルの世界に飛び出したのがPersonalIoT
パーソナルIoTを実現するには
アイデアを描く
協力体制
OSSの活用
・パーソナルIoTの例:おもしろカウンタ
・お近づきカウンタ
フィールド評価:見える化のひとつ
2.パーソナルIoTを2年間動かす
新築家屋で2年間のIoT実証実験結果
見える化だけでも、べんり
分析
アラート
見える化
3.異常値検知 Jubatus実装
・異常値検知 機械学習 Jubatus
→1万7千円の話
全体の中の集合として、異常を判定する
6次元データから、どうとってくるか
(1次元なら、いまのシステムでもできる)
特徴空間にマップしたとき、
LOFは、距離をベースとした異常検出方ではなく、
密度をベースとした異常値検出方
データ解析をリアルタイムで行うフレームワーク
リアルタイムで大規模(Hadoopはリアルタイムではない)
多値分類、異常検知、クラスタリング
日本で開発
LOFアルゴリズム
Pythonで書いている。JSONで定義
・教示データ:正常値だけを教え込む場合
湿度センサーのばらつき検知
・エッジコンピューターで動かすには
IoTの能力を高める
・分かったこと:アラートが頻繁だと、慢性化する
センサーは故障する
センサーメンテナンス
4.機械学習 ランダムフォレスト
内部温度に影響している因子は何?
目的変数:内部温度
説明変数:その他5項目
・特徴
学習対象データから多数の決定機を作成し、
それぞれの決定機の結果を多数決で決定
2)分類、回帰、予測 Kinectに使われる
説明変数の重要度が出力可能
学習スピードが速い
過学習がおきにくい
Pythonで書いている。ランダムフォレストのくらすふぁいやーをインポート
データクレンジング大事
・まとめ
デジタル革命の大海原にパーソナルIoTの船を出す
オリジナルシーフードを味わおう
次は
オープンソースをベースとしたパーソナルIoTの作りかたと異常検知について
をメモメモ
・はじめに
このデータ 2LDK,70平米 築10年 東京23区→家賃1.7万円
(実際にあったデータです)
→なんかあるよね・・・いわくつき
→電話かける→不動産や、休み→次の日に電話:入力ミス。17万円
→入力ミスの間に、データが広がってしまい・・・
●システムが、答えてくれるのがやさしい。
これを、検知できないのか?
(1)パーソナライズIoTの勘所
・Industry Internet パーソナルIoT
インダストリー4.0 API
・パーソナルとしてのIoT活用
センサー 漁師さん
クラウド 市場
AI 料理人
IoT おすし
1)個人でIoTを作れる時代
2)知恵と想像力でIoTを活用する波を起こす
・ 見える化・計数値化
・要素技術
センサー、シングルボードコンピューター、3Dプリンター
・3Dプリンターでロボット、ギター、プリント基板
・ウェザーステーションNetatmoからのデータ取得
・Webからリアルの世界に飛び出したのがPersonalIoT
パーソナルIoTを実現するには
アイデアを描く
協力体制
OSSの活用
・パーソナルIoTの例:おもしろカウンタ
・お近づきカウンタ
フィールド評価:見える化のひとつ
2.パーソナルIoTを2年間動かす
新築家屋で2年間のIoT実証実験結果
見える化だけでも、べんり
分析
アラート
見える化
3.異常値検知 Jubatus実装
・異常値検知 機械学習 Jubatus
→1万7千円の話
全体の中の集合として、異常を判定する
6次元データから、どうとってくるか
(1次元なら、いまのシステムでもできる)
特徴空間にマップしたとき、
LOFは、距離をベースとした異常検出方ではなく、
密度をベースとした異常値検出方
データ解析をリアルタイムで行うフレームワーク
リアルタイムで大規模(Hadoopはリアルタイムではない)
多値分類、異常検知、クラスタリング
日本で開発
LOFアルゴリズム
Pythonで書いている。JSONで定義
・教示データ:正常値だけを教え込む場合
湿度センサーのばらつき検知
・エッジコンピューターで動かすには
IoTの能力を高める
・分かったこと:アラートが頻繁だと、慢性化する
センサーは故障する
センサーメンテナンス
4.機械学習 ランダムフォレスト
内部温度に影響している因子は何?
目的変数:内部温度
説明変数:その他5項目
・特徴
学習対象データから多数の決定機を作成し、
それぞれの決定機の結果を多数決で決定
2)分類、回帰、予測 Kinectに使われる
説明変数の重要度が出力可能
学習スピードが速い
過学習がおきにくい
Pythonで書いている。ランダムフォレストのくらすふぁいやーをインポート
データクレンジング大事
・まとめ
デジタル革命の大海原にパーソナルIoTの船を出す
オリジナルシーフードを味わおう