Quantcast
Channel: ウィリアムのいたずらの、まちあるき、たべあるき
Viewing all 6845 articles
Browse latest View live

様々なストレージの差を意識しないでアクセスするための標準化、OpenSDSについて聞いてきた!

$
0
0
今日(10月27日)オープンソースカンファレンス2018Tokyo/Fallに行ってきて、

OpenSDS、始めてみませんか(BOF)

について聞いてきたのでメモメモ



・出展とは関係ないストレージの話
・OpenSDSのJapanの偉い人になったので

・OpenSDSとは
 SoftwareDefinedが増えてきたーぽちぽちで設定できる
 ネットワークのSoftwareDefinedは大変
  パフォーマンス維持しながらは大変
  とにかくばらばら
 →やっとできるようになった


 SoftwareDefinedのストレージは?:なんたらコンバージドは?
  ナイトクラウドサービスできないよね;特化している
   メーカーごとに出している
 →便利さ、味をしめる

 ストレージ製品:メーカーごとに違う→乱立する オブジェクト・ブロック・分散
 パフォーマンス、運用、トラブルシューティング:それぞれちがう

 →ソフトウェア デファインドになっても、縦割り、やめちゃったり(もちろん対応してないのも)
    →めんどうくさい、ベンダーロックイン:解決策として OpenSDS

・一番大きな誤解
 ブロックデバイスなの?→そもそも、ストレージじゃないです。データプレーンをいじるためのラッパーです、
 ふぁーうぇいのひとがえらいひと

 →ストレージにラッパーかけるということです

 クーばねーてぃすやDockerにたたいてもらう→OpenSDSが下の面倒を見る→ストレージ

 くーばねーてぃす  OpenStack どっかー
    ↓       ↓     ↓
   Open SDS
 ↓  ↓      ↓          ↓
 SAN NAS  ダイレクトアタッチ(DASD) クラウドストレージ(まだ)
 ※RedHatだとCephとつなげる

・今は
 とりあえず動いてます(αになってねーだろ、枯れてない、エンプラに入れる気はしない)
 コードベースで10万行、結構書いてる
 ふぁーうぇい頑張ってる

・大きなカンファレンス:年に1、2回
 日本は9月にミートアップ(80人くらい?)

・コミュニティ立ち上げた
 第二回:今年中にできると嬉しいけど、年越えちゃうかも

・パフォーマンスは?
 何のストレージ使うかに依存
 メーカーにより濃淡
 開発は進んでいる。ユーザーは熱い(Nこむ Yahoo)

・今やると、「うちやってますよ」と言えるくらいの状態
 ブロックストレージが進んでいる(オブジェクトストレージはあと)
 オープンソースなので使える。議論は見れる
 テレカンをやっている:聞こうと思えば、傍観者として聴ける(英語だけど)

・まだきぼうだんかい

・Linux Foundationがホスティング

・アダプタはメーカーが書いて、OpenSDSに入れているので、インストールすると入ってくる
 プロビジョニングなんかができる

・ユーザー独自の機能を使ってしまうと破綻する
 ただし、APIをたたいているから、その点は同じ

・興味があったら2回目ミートアップ!

SSLの新バージョンTLS1.3について聞いてきた!

$
0
0
10月27日、オープンソースカンファレンス2018 Tokyo/Fall

TLS1.3がやってきた
(講師は、以下のブログを書いたwolfSSLのある程度偉い人?
 
TLS1.2とTLS1.3の違いは何?
https://www.wolfssl.jp/wolfblog/2017/06/16/tls1-2-tls1-3/


)

を聞いてきたので内容をメモメモ



・1.2のマイナーバージョンアップ?それ以上のものがある
・自己紹介:ルンバの中にも入っているよ

・オープンソースと商用のデュアルライセンス方式
・WolfSSLTLS1.3正式サポート 2018年8月RFC8446

  TCP:SSL/TLS
  UDP:DTLS
・SSLの経緯
  SSL1.0 ネットスケープ

・TLS1.3 検討開始は2013年
・公開されている脆弱性:いっぱい
  2008乱数発生
    :
・これまでのつぎはぎだらけの対応を全面整理:経験、知見を集大成
・これまでは、安全性を向上させると性能の低下:負荷が上がる=コスト上がる
・1.3 安全性の向上はもちろん、性能も(整理したから)
     新しい暗号化技術が正式採用

・デバイスサイド:サーバが1.3になると、デバイスも・・・
  理由:暗号化されたメッセージ通信をするから

・違うところ
  ハンドシェイク
   1.2までは2往復、TLS1.3は1往復
   1.2までは平文  TLS1.3はハンドシェイクもほとんど暗号化
 →暗号スイートの整理:200スイート以上を整理

   鍵合意 でぃっフィーヘルマンのDHEしか使わない(楕円曲線ECにするかどうかはあるけど)

   共通鍵:GCM,CCM,POLYに集約
  →これで1往復になった

・IoTでも効く追加機能
 セッション再開と事前共有鍵(PSK)
 セッションチケット
 Early Data(0-RTT:ハンドシェイクしないで暗号化データを送る)
 ハンドジェイク後の通信相手の認証
 鍵の再生成
※完全前方秘匿性:あるカギを入手したとき、前のデータの暗号が解ける。。ことがないようにする

・DHによる鍵合意がおすすめだけど・・

・WolSSLのTLS1.3
 1.2と同じ使い方をするのであれば、なにもしなくても使える
 ダウンどーどしたら、.configure(1.3用のオプションつけ),.makeしてね!
・1.3以外も使える
・セッションチケットは送ったり、送らなかったり

「フェイクニュース」の裏の人の話

ストレージ冗長化 20年の歴史を勉強してきた

$
0
0
10月27日、オープンソースカンファレンス2018 Tokyo/Fall

DR:BD 20年の歴史で理解するストレージ冗長化

を聞いてきたので、内容をメモメモ



・DR:BDの歴史
 止められないシステム:でも時々壊れる
 こわいな By ぱくたそフリー素材

・システム障害への対策
 システム冗長化
  一台をアクティブ 一台をスタンバイ、故障時切り替え
   HAシステム

 →ストレージをどうするの?
  バックアップ

 RPOとRTO
 RPO:障害が起きたときに復旧できるデータの新しさ
 RTO:復旧するまでの時間

 データの冗長化にバックアップは役立たない

・Active Stanbyに共有ストレージ
  →単一障害点の問題
  →そこでDR:BD

・DR:BD
 システムカーネル→コピーをDR:BDとる→書き出す

 世界中に使われている

・DR:BD開発史
 1999年から開発

・0.1バージョン
 1999年:ウィーン工科大学 フィリップライスマンさんの卒研テーマ
 2004年くらいまで 0.1~0.5 

・0.6
 最初の安定板 カーネルとの動きを合わせるの大変
 データが同期して使えるようになった最初のバージョン
 サードウェアは2004ねんからつばをつけている

・0.7 アクティビティログ追加
 障害時にフル同期の必要がなくなった

・2006年7月 SR:BD+ 商用版パッケージ

・8.0~8.2
 なんで?0,8じゃないの→大人の事情らしい
 Linuxカーネルにマージするため、コーディングスタイルを合わせる
 2010年2月にリリースされた2.6.33にソースコードがマージされる

・200811月8.3
 DR:BD+と統合LINBITの方針変更
 まだ現役として使える

・2011年7月 8.4
 マルチボリューム
 高速、設定ファイル書式少し変更

・2015年3月 9.0
 いろいろな機能追加
  マルチノード接続
  オートプロモーと
  設定ファイル:管理ツール LINSTOR

・DR:BD H!
 Pacemakerとの組み合わせ

・DR:BD DR

・DR:DB SDS ブロックストレージ
 OpenStack 来年3月リリース
 OpenSDS DR:BD使える

・これから、どこへ行く
 LINSTOR 正式版リリース
 CLI
 サードパーティで評価中、ブログに書いている
 
・おまけWindows版DR:DB
 ベータ4版

IBM、Red Hatを買収へ

Excelから、Ansible,Serverspecのコードを生成するということらしい・・・

$
0
0
10月27日、オープンソースカンファレンス2018 Tokyo/Fall

Ansible・Serverspecベースの自動化フレームワークSHIFT wareのご紹介

を聞いてきたのでメモメモ



・自己紹介
・あじぇんだ
 Shiftware
 Docker くーばねーてぃす

・きっかけ
 品質・生産性向上の技術施策から生まれた
 品質と生産性の向上

・これまでのインフラ
 属人化、引継ぎ
 人的ミス
 ドキュメントと実機の乖離
 リニアなコスト増加

・Shiftware
 コンセプト
  従来の(延長戦の)やり方から転換(ゆーあー目線で)便利なインフラ標準フレームワーク
 内容
  Ansible,Serverspecに関連するコード集
  コード集を利用するためのフロントエンドツール
 結果として、品質・恒常性につなげる!

 Excelをスタート→コーディングレスに(コード自動生成)

 適用範囲:OSはいってる
  設定のテスト
  インストール、コンフィグ、テスト

・ユースケース
 百数十台のサーバーで 30%減
 275%の生産性向上も!

・いんふらすとらくちゃあずこーど(IaC)活用研究会

・システムインテグレーターのコンテナ技術推進
 クラウドネイティブな要求に対応力を上げる
 来年ぐらいはどんなものでもコンテナ化?
 マイクロサービスアーキテクチャ→オーケストレーションはインフラエンジニア

・まずはDocker
 営業もやっている→案件創出
 気づいたこと
  動機付け大事、トレンド追従も大事
  営業面ヒットさせるシナリオ

お仕事におけるUbuntuとの付き合い方を聞いてきた

$
0
0
10月27日、オープンソースカンファレンス2018 Tokyo/Fall
お仕事におけるUbuntuとの付き合い方
(OSCのスケジュールに書いてある表題とは違い、こっちに変更)
を聞いてきたので、メモメモ



・本日の資料
 https://wiki.ubuntu.com/MitsuyaShibata/Slides
 発表資料は CC BY-SA4.0

・Ubuntuの紹介
 とばす Debianベース、4月10月リリース
 18.04.1ではuniverseが無効かされた?→バグ、手動で
 UIテーマ YaruとアイコンセットSuru

・お仕事でUbuntuを使う理由
 趣味で使うなというリチャードストールマンのような人はいないと思うので・・
 お仕事
  ベンチャーからサポート
  上司から適当なLinux環境といわれて

・そもそもUbuntu選ばれてる?
 Googleトレンド:へってるけど、それなりに検索はされているらしい
 日本では大差ない:Unityデフォルトになってから減った
 W3Techs
 OpnStack半数以上がUbuntu上で構築(70%→50%:RedHatが頑張ってるので)
 EC2のベースイメージ1位:AmazonLinuxが追いつきつつあるが

・サーバー用途ではデファクトスタンダードな立ち位置
 クラウド、コンテナのベースイメージ、
 AI/MLのプラットフォーム
 メインフレームもUbuntuが動く時代に

・デスクトップは?
 Dell プロジェクト・スプートニク
 Ubuntuの利用統計
  クリーンインストール8割
  物理半数、

・Ubuntuの利点
 インストールの簡単さ→とりあえずUbuntu(現在はどのでゅすとりも簡単に)
 独自パッケージ配布サービスとしてのPPA
 リリース頻度の多さ:半年ごとのリリース→アップグレードプランが立てやすい
 Ubuntu版は商用版が存在しない サポートをカノニカルから買う
 ググれば解決策出てくる:重要

・コンテナベースイメージとしてのUbuntu
 サイズの問題

・そもそもUbuntuでなければいけないのか?
 好きなもの使え。ほかのLinuxでもできる。必要性はほぼない
 重要なのはUbuntuも選択肢にのこること

・問題点
 日本ではCentOSのほうが強い
  周りに合わせる
 開発においてカノニカルの主導権が強い
 NIH症候群(NotInvented Here 自分たちで作ったものではない)
 Mirはまだ生きている

・どのUbuntuを使うのか
 デスクトップかサーバーか
 パッケージ構成が違うだけ(リポジトリ共通)
  メタパッケージにubuntu-desktop,ubuntu-serverを選ぶか
  GUIが欲しいかどうか

 デスクトップ:フレーバー
  lxQt,Xubuntu

 日本語ReMix日本語環境向けカスタマイズ
   そのまま使っても問題ない

 32bit版:そろそろ終了 18.10へはアップデートできない
   16.04,18.04を使い続けるべき
   ほしいと思う人はそれなりにいる模様
 どのリリース?
   LTSを使う
 ポイントリリースについて
   追加リリース 16.04は5回出している

・どうやってUbuntuを用意するのか
 Windowsとのデュアルブートは危険
 仮想マシンにインストール
 仮想マシン用のインストール用意されている
 クラウド cloud-init

・今gて何デプロイ
 Windows Subsystem for Linux
 Hyper-V ギャラリー
 Docker for Windowxx

・インストールしたそのあとは
 rootはロックされている。sudo
 sudo -i
 アンチウィルス clamav(くらむえーぶい)
 公式リポジトリ:鉄板だけど古くなる
 sbap node.jsとかはいい

・バックアップ
 ストレージは消耗品

・製品を作る
 商標の問題→カノニカルにきいて

・おふみしてる

PostgreSQL11新機能を聞いてきた

$
0
0
10月27日、オープンソースカンファレンス2018 Tokyo/Fall

PostgreSQL11新機能解説

を聞いてきたので、メモメモ




・もともと
【リリースまじか!】PostgreSQL11新機能解説
  →りりーすされたので

・PostgreSQLとは
 歴史 INGRES(’70)、POSTGRES('80)から
 特定オーナー企業がない

・現在の実力
  SQL機能
  ANSI SQL:2011
  POSTGIS:地理情報
  他DB連携
 性能的には、スケールする
  9.6からパラレルクエリ
 クラスタ
  インスタンス単位。10からテーブル単位
  HA,BDR、MPP→RACはまだ
 運用支援
  PgAdmin4→がらっとかわった
  SI Object Browser

・11のポイント
  JITコンパイル
  ストアド
  パーティショニング
  パラレルクエリの拡充
  SCRAM認証
  その他:ウィンドウ関数の対応構文追加など


・JITコンパイル
 SQL実行にJITコンパイル
 LLVM利用
 繰り返し処理の回数が多い時有効
 プランなコストでJIT利用判断

・ストアドプロシージャ
 OracleのPL/SQL移植が楽。
 プロシージャでCOMMIT/RollBackが利用可能
 いろいろ制限ある

・パーティショニング機能の拡充
 パーティションテーブル全体にインデックスを作成できる
 条件あり:
 パーティションテーブル全体に主キー制約が作れる
 パ^てぃしょんテーブル全体に外部キー設定できる
 ハッシュパーティショニング
 パーティション除外処理の改善
 問い合わせでのおアーティしょん指向の結合・集約

・パラレル処理の拡充
 いままでも入っているが、それが拡充
  並列ハッシュ結合、並列Append

・SCRAMチャネルバインド
 SSL接続の拡充
 SCRAM認証がチャネルバインドに対応:人にとられないようにした

・その他:
 ウィンドウ関数の対応構文追加:GROUPS、RANGE,EXCLUDE
 ALTER TABLE ・・・ ADD COLUMN改善:デフォルト値を伴ったADD COLUMNが高速化
 CREATE INDEXがINCLUDE句に対応:index-only scan
 initdb時にwalファイルサイズ設定
 ロジカルレプリケーションでTRUNCATE対応
 ビューに対するテーブルロック
 各種psql,pgbenchの機能改善
 各種のロック軽減とオプティマイザ改良

・まとめ

Zabbix4.0なら、サーバーだけでなく、IoTの監視もできてしまう話を聞いてきた

$
0
0
10月28日、オープンソースカンファレンス2018 Tokyo/Fall

Zabbix4.0のご紹介

を聞いてきたのでメモ、ただし

・はじめ5分くらい遅れた。行ったら、Zabbix(全般)の紹介してた
・書ききれてないところある。資料は後から公開するとのこと
・表題の件は、終わりのほう「おすすめ機能:Webサービスの呼び出し」



(遅れてついたところから)

・Zabbix3.0以降に追加された機能

・3.2で追加
 トリガーの主導クローズ
 ヒステリシストリガーの改善:条件式と復旧条件式が書ける
 イベントタグの設定
 イベント相関関係の設定
 LLDで生成したアイテムの詳細確認
 Webシナリオのエクスポートとインポート
 イベント画面から障害画面
 ホストグループの階層化
 ログバースト対応

・3.4で追加
 Webインターフェースの改善
 依存アイテムとアイテムの保存前処理:加工して保存
 アイテムと値・・
  :
 (書ききれんかった)

・4.0で追加
 監視データ取得ぼたbb
 新しいHTTPアイテム追加:HTTPエージェント(リクエスト投げて結果を受け取る)
 時間範囲指定の簡略化
 SVGグラフウィジェットの追加
 単位変換の柔軟化
 サーバーとプロキシ間をよりセキュアに
 サーバーとプロキシ間の通信を圧縮
 翻訳の変更について:寺島さんの翻訳を継承してきたが、ユーザーさんの意見を踏まえ(英語は変わってない)
    :
 (1枚目書ききれんかった)
    :
 タグベースの権限設定
 タグによるメンテナンス設定の拡張
 障害の深刻度が変更可能
 エージェント自動登録機能改善
 ポップアップウィンドウオーバーレイに
 閲覧(キオスク)モードの追加:前にフルスクリーンモードがあった。さらに・・/最初からキオスクにできる
 障害画面にコンパクト表示モード
 自動登録の柔軟性追加
 DNS名の長さ拡張
 MySQL8.0サポート
 スクリーンリーダー対応

・実現できること
 おすすめ機能:ボタンクリックで値取得
   アイテムだけでなく、ディスカバリにも
 おすすめ機能:Webサービスの呼び出し
   気温や気圧の値を保存前処理を使用してをJSON形式応答から取ってこれる
 おすすめ機能:新しいグラフウィジェット
 おすすめ機能:タグを利用した一部トリガーのみのメンテナンス
 地味だけど便利:単位変換の抑制

・まとめ
 4.0による改善
  設定作業軽減
  自動化を活用した監視の設定が柔軟に
  Webサービスを利用する場合、JSONやXMLから値を取り出せる
 今後
  Zabbix4.2など今後のロードマップが公開されている
  スケーラビリティ、冗長化、分散監視の改善
  Prometheus(ぷろめてうす)エージェントの対応というキーワードもあり



自然言語処理に入門してきた!

$
0
0
10月28日、オープンソースカンファレンス2018 Tokyo/Fall

【入門】自然言語処理の入門と活用

を聞いてきたので、メモメモ

ただし、今回は、日曜日でも学食がやっていて、おすすめランチ食べてたので、はじめのほう、おくれて聞けてない



(「はじめに」の途中から)
・こんにゃくは太りません

・アジェンダ
・自己紹介

・自然言語処理ってなに
 人間の言葉をコンピューターで自動的に処理させる技術
  自然言語:私たちが使う言葉、解釈が様々、あいまい
  人工言語:プログラミング言語など、解釈が1とおりにきまる

 →黒い瞳の大きな女の子

 実は結構身近に存在する

・自然言語処理事例
 検索:シソーラスの利用により、あいまいな単語でも検索可能
  シソーラス:単語を、上位/回関係、部分/全体
  ・関連後に対応
  ・表記ゆれに対応
  ・タイポの訂正

・メールフィルタ
 ベイジアンフィルタでメールの怪しさを評価

・チャットボット
 ユーザーの発言からインテントとエンティティを抽出

・ほかにも
  翻訳
  レコメンド
  文書分類
などなど応用先多数

・自然言語ってどうやるの
・要素技術の紹介
 形態素解析
 構文解析
 意味解析
 文脈解析:照合解析を紹介

・形態素解析:単語の切れ目のない言語で必要
 文を最小の意味を持つ単語単位までに分解し、それらの単位の性質を明らかにする処理

・構文解析
 2こ
  係り受け解析:→日本語向き
  句構造解析:単語の並びに依存→日本語には向かない

・意味解析
 2こ
  述語項構造解析:述語から見たときの守護・目的語を秋r多寡にする
  意味役割解析:述語から見たときの各項の意味役割を明らかにする

・文脈解析
 2個
 照応解析:指示語
  太郎は花子と講演で遊んだ
  彼はそこで彼女と縄跳びをした
 談話構造解析:文間の役割関係を明らかにする 

・自然言語処理を使ってみる
 マジカルバナナ
  言葉を返す
  構文情報からペアをルールで抽出する
 連想ペアネットワーク
 変な回答をすることがあるので、単語間の類似度で足切りする

・COTOHA APIの紹介
 構文解析
 固有表現抽出
 照応省略解析
 キーワード抽出
 文タイプ判定
 ユーザー属性推定
 類似度算出

・クロージング



東証システム障害の深層

ネット無料画像、自治体が使用→多額請求も!

富士通がリストラ

SanSanが使ってるディープラーニングは約20層のディープCNN

$
0
0
SanSan BuildersBox

最後の

Closing : ビジネスを加速するために、AI で実現したこと、したいこと

だけ聞けた!のでその内容をメモメモ


共有がテーマ:何かしら持ち帰り
・SunSun全体の総括:融合して一つのサービス
・ビジネスを加速するために、AIで実現したこと、したいこと
AIという言葉、使いたくない
エンジニア:AIと言いたくない。本業はデータサイエンティスト(リサーチャー)
AIって、そもそもなんだったっけ?

・自己紹介

・人工知能AIとは
 機械学習、予測そのものをAIという認識になってきた
 あくまでも機械学習は人工知能の一部
 SunSUnのAIは広いもの:ルールベース統計処理→ルール 
 間違ったデータを与えれば、間違った学習をする

・AI チューリングテスト
 機械が思考するか:簡単なチャットシステムでもチューリングテストをパスする可能性
  2014年 ロンドン王立協会:ロシアのAIがチューリングテストにパス(異議かある)

・チューリング:100年前 暗号解読 機械が思考を持つだろう
  イミテーションゲーム:面白い、脚色すごい
 マーヴィン・ミンスキー
  ディープラーニングの大本:パーセプトロンに批判→めげた人いっぱいいて衰退
  パーセプトロン以上を作ることが必要→ニューラルネット

・革命的変化:ディープラーニング:様々な問題変化

・ミンスキー博士の発想
 パーセプトロン
 フレーム理論:AI炊飯器(ファジー入れただけ)
 ニューラルネットワークの可能性
 心の社会:今のぶースティング
 1950年ころから60年たって花開く
  乗り物:100年で素晴らしい発展
  AIは高々50年

・ディープラーニング
  有名になったのは囲碁
  ・多層ネットワークによる抽象化
  ・クラウドシステム:豊富なリソース
  ・ビッグデータ:質のいいデータを簡単に集められる
  →3つの言葉がキーワード

 RPAはやってる
  単純語有無の肩代わり:導入企業でうまくいっていない
  高度に専門化された一部の業務:ここに着目

・シンギュラリティ:まゆつば
  わからないけど、恐怖心をあおわれるのがもんだ
  →それ以上の仕事が奪われる

・機能しないAIと機能するAI
 データ不足、不明瞭な目的使われない
 機能するAI
  専門家の知識の基づくエキスパートシステム
  書面、会計監査行動予測レコメンデーション

・これからのAI
  スマートスピーカー:音声コマンド入力装置→情報収集
  量子コンピューター:計算方法が決まっていない

・SanSan 多様な研究者 Kagleタイトルホルダー、博士学位、各地にラボ

・「出会う」が世界を変えていく
  脳科学
  統計学・確率論
  自然言語
 取り組んでいること→製品にむすびつく→目標を選ぶ

・ディープラーニングを用いて項目判定 精度98%
 言語判定:主要4か国語を判定
 約20層のディープCNNによる学習
 ResNet:層の入力を参照した残差を学習させる(155層までできる)

 層が増えると:特徴量→抽象化:複雑な学習できる

・AI活用とワークシェアリング
 創業時:SanSanに名刺1日に数百→頑張れば処理できる
 今  :SanSanに名刺1日に数十万
   →画像データと正解データある:学習できる
 オペレーターを人員削減ぜずに、処理能力を上げる

・ミス:パターンがある 制度99.9%

・これから SanSanLab
 ABMダッシュボード
 バーチャル組織図
 人を知り他人を知り、企業を知る
 社内のキーパーソンを探す
 企業間距離

 キーワードを持つ企業

 スマートレコメンデーション

・出会いがもたらす未来の力

OpenCVで画像処理するには・・・

$
0
0
SanSanの「浅葉建設」をOpenCVを使って文字認識するには、
まずは画像処理が前処理として必要なんだろうと、
OpenCVの画像認識をお勉強

■前提

import cv2

ができることはもちろん

import numpy as np
import matplotlib.pyplot as plt

が出来ないと使いものにならない。できなかったら、まずは、
pip install opencv-python
でインストール

■イメージを読み込む
img = cv2.imread(読み込み画像ファイル名)

でよみこむ。読み込んだものは、画素の値がnumpyの配列で表示される
(読み込みはBGR 表示はRGBなので、表示するには変換する)

■切り出し 2値化
 2値化結果画像を1(または255)で初期化(画像と同じ配列の大きさで)
 画像の該当画素が、式一以上だったら255(または1)を2値化結果画像にセット

 必要ならノイズぼかし(ガウシアンcv2.GaussianBlur)などかける

■.輪郭抽出
 cv2.findContours()する(表示はcv2.drawContours())

 輪郭だけとってきたい場合、面積大きいところ:cv2.contourAreaなどでもとめる

■歪み補正
 変換行列 = cv2.getPerspectiveTransform(元の画像の点, 変換先の点)
 出力画像 = cv2.warpPerspective(変形する対象の画像, 変換行列, 抽出する領域の大きさ)
 の合わせ技

で、さあ、文字識別する画像認識ができると思ったら・・・・

(明日に続く)


SanSanの浅葉建設をOpenCVで文字認識するには・・・

旋盤とフライス盤とボール盤と切削機とCNCルーターの違い

$
0
0
ボール盤:
 目的:穴をあけるために
 固定するもの:素材は固定、「バイト(ドリル)」が回転

切削機:
 目的:削る
 固定するもの:素材を固定、「砥石」が回転

旋盤→複数の歯を切り替えると、複合旋盤
 目的:(回転軸に対象になるように)削る
 固定するもの:バイトを固定、「素材」が回転

フライス盤→複数の歯を切り替えると、マシニングセンター
 目的:削る
 固定するもの:素材が固定、フライス(エンドミル)が回転
    /卓(テーブル)が傾けられる(立てフライス、横フライス、万能フライス)

CNCルーター
 目的:木材の面取り・ホゾつくり・溝切り・切断
 固定するもの:素材を固定し、上下左右前後にドリルが動く
 →フライス盤は、フライスが上下に動き、左右前後は卓が動く

※でもGコードで全部制御できるけど・・・

「男の人は胸の大きい女の人が好きなんですか?」をビッグデータ解析で答えるには、どうする?

$
0
0
頭の体操。

【データ】

DMM Webサービス
https://affiliate.dmm.com/api/

・商品検索API
 で、上位適当な数検索

・取得したデータの「genre」に注目、作品名を独立変数、ジャンルを従属変数にして、
 (=1作品1行、1ジャンルで1桁)

 各作品が、そのジャンルに属していたら1、属していなかったら0にする

例:
https://affiliate.dmm.com/api/v3/itemlist.html
のサンプルデータ

product id  独占配信 中出し ・・・ 巨乳 貧乳・微乳
28ara00014   1   1  ・・・  0   0
kawd00415    1   0  ・・・ 0    0
h_175dxrt00001 0    0 ・・・・ 0   0

(サンプルは「上原亜衣」"で"縛っている(助詞は"を"ではない。わかってる)。
 上原亜衣さんが巨乳でも貧乳でもないため、このカテゴリに値が入らないが、
 上原亜衣さん以外なら、入る作品があるはず)

【分析】

単純に、巨乳と貧乳・微乳の数をみて、結論を出してもOK
→たぶん、巨乳好きは多いが、貧乳・微乳もある程度あるので、みんな好きとは言い切れない
 になると思う

見栄え良くするには、多次元尺度構成法を使ったり、コレポンしてみたり・・・というところでしょうか?

【深堀するには】
購買情報があると、微乳・貧乳を購入している人は、巨乳を購入するか YES/NOで、
微乳好きの人は、巨乳を好きではない・巨乳も好きということが言えるんだけど、
購買データはとれないですね・・・

サクラエディタがすごいと聞いたので、ダウンロードしてみた・・・

$
0
0
サクラエディタのダウンロードは

サクラエディタ - ダウンロード
https://sakura-editor.github.io/download.html


にいって、ダウンロードすればいいんだけど、
サクラエディタのすごさは、diffとか、ctagとか、つかえるところにあるらしい。
それには、関連ファイルが必要で、それらを全部やってくれるのは、

SakuraDown
http://sakura.qp.land.to/?Install%2FSakuraDown

らしいので、ここから、

Ver.2.x(Unicode版)
SakuraDown12f-18_forv2.zip (sourceforge.net) 2017-08-22

をダウンロードしてみる。解凍すると、

な感じになるので、
SakuraDown12f.exeをクリック

という感じで立ち上がる。最新版を確認

確認しても、バージョンが入らないものがある。これはチェックできない(=ここから入れなれない)
チェックして、インストール開始!

したら、ばきばき失敗した(どうも、いっぺんにチェックしてダウンロードすると、エラーになるらしい。
サクラエディタ - ダウンロードhttps://sakura-editor.github.io/download.htmlのページに書いてあった)

ってことで、結果、全部入らなかったんだけど、先ほどのSakuraDown12f.exeが入っていたフォルダを開くと

sakura.exeはダウンロードできているので、これを起動

・・・サクラエディタはダウンロードできたみたい。

サードウェアが終わるってよ・・・

Viewing all 6845 articles
Browse latest View live




Latest Images