SSブログ

ビッグデータの罠~ビッグデータの定義・事例から、脆弱なパスワードランキングまで [本/Biz経済]



ビッグデータの罠 (新潮選書)

ビッグデータの罠 (新潮選書)

  • 作者: 岡嶋 裕史
  • 出版社/メーカー: 新潮社
  • 発売日: 2014/11/27
  • メディア: 単行本


【ビッグデータの罠/岡嶋裕史/14年11月初版】
ビッグデータというのがよくわからなかったので読んでみた本。IT担当者との会話の中にぽろっと出てきて、なんかよくわからんけどすごい事かなぁと。

まずググってみました。

ビッグデータの定義ですが、総務省のHPにはビッグデータとは「事業に役立つ知見を導出するためのデータ」とされています。

ビッグデータビジネスとは「ビッグデータを用いて社会・経済の問題解決や、業務の付加価値向上を行う、あるいは支援する事業」であると。

中原圭介によると「ビッグデータ自体、IT業界で売るものがなくなったため、こじつけで生まれた面もある。ビッグデータというのはつまるところ、膨大なデータをどう統計で処理するか、ということにすぎない。そう考えると別になんの新味もない」身もふたもない。

いわゆる統計学なんでしょうね。少しすっきりした。



本書から有名どころなビッグデータを3つ。

1つはアマゾンの注文前発送。
どうするかというと、注文が発生する前に直近のブランチまで商品を発送してしまう。アマゾンはこの仕組みに自信を持っています。根拠は長年蓄積してきたプロファイリングデータ。顧客が次に買うものをほぼ特定できるようになったと。で、実際に買う前に近くまで発送してしまおうという。アメリカの場合、無人航空機と合わせて運用すれば、30分以内のデリバリーが保証できるサービスが構築できると。

2つめはグーグルの精度の高いインフルエンザ予測。
なぜグーグルは医療機関でもないのにインフルエンザの動向に精通してるのか。インフルエンザについて検索する利用者数と、インフルエンザの発症者数には密接な関係があるという。

3つめにヤフーの選挙予測。
2013年の参院選での予測は、121議席で争われ111議席で予測を的中させた。人間であれば票読み屋として一生食っていけるレベル。ヤフーのビッグデータ分析は政治的主張は全く関係ない。単に検索数だけで議席の予測をしている。検索数と得票数、議席数は計ったかのように相関を示した。小選挙区は政党名のSNS投稿数と得票数に強い相関関係があった。はずれたケースは、政党名をベースに分析を進める仕組みにしたため、無所属の候補で誤差が大きかった。



ビッグデータってリバイアサンかもしれない。データが個人の判断や分析に勝る。個人はいずれデータに従うようになる。

グーグルグラスはプライバシーの侵害で発売中止に追い込まれました。法整備を含めて、まだ時代が追い付いてない。みんながグーグルグラスをつけて生活を始めると、膨大なビッグデータが収集できます。

ドラゴンボールのスカウターみたいなもんでしょう。ルックスを数値化したり、イケメンに会う確率までデータとして取れたりして。イケメンは100人に7人ですとか(上位7%は偏差値65)。

そのうち何でも予測ができるようになったりして、人生の面白さが半減するような気もします。


その他の読書メモを。

(広告)




<コンピュータ将棋の戦法>
過去の膨大な局面から学ぶ。この局面で手Aを指した。その後勝った。したがって手Aはいい手である。一方で手Bを指したときは負けている。手Bは悪手である。こうした評価を延々と積み重ねていく。

日本将棋連盟は、2013年から対局中は電子機器の電源をオフにすることを対局規定に盛り込んだ。将棋ソフトなどで手を解析し戦いを有利に進めることを防ぐためである。もう少しすると、伝統的な2日制の対局はなくなるかもしれない。夜の間にカンニングできるからだ。チェスは2日制の対局は姿を消している。



<様々な分野のビッグデータの活用>
学校運営の分野でビッグデータの活用が認知されている。教員の勘や経験にもとづいていた分析をビッグデータで代替する。生徒の行動データと学務記録を突き合わせるといろんな分析ができるようになった。図書館の利用率は学業や生活全般に与える影響の大きい項目だが、1年生の秋に頻繁に図書館を使い始めた学生は何故か成績が向上する傾向がある。学食の利用頻度の高い学生は成績が良い、など。意外な相関関係が発見されたりする。こうした分析を継続し、学業不振や不登校に陥るリスクの高い生徒をピックアップし、個別にフォローする。



<ジェラシックパーク>
マイケル・クライントンはかつて「ジェラシックパーク」で、インターネットは人の多様性を促進しない、むしろ失わせる、検索エンジンの1ページ目に表示されない人や物は、見向きもされないようになると指摘した。それは現実のものになった。



<リベンジポルノに注意>
現状ではそれを回収、消去する方法はない。多くの機器にカメラが登載されるようになった今、恋人たちの間で撮影される性的な写真は極めて多数にのぼる。情報セキュリティ企業のマカフィは、「バレンタインデーにセクシーな画像を送るか」を調査して発表した。中国で53%、ブラジルで47%の人が送ると回答している。日本は調査対象となった15カ国の中で送ると答えた人の割合が最低だったが、それでも6%の人が送ると回答している。



<脆弱なパスワードランキング>

DSC_0527.JPG

上記の左側は4ケタのクレジットカード暗証番号ワースト20。約1万通りの組み合わせがあるが、ワースト20の占める割合は、2012年の340万件の調査で約27%もあった。トップの1234は340万件のなかで何と11%を占めていた。この一覧を試していくだけで、他人のアカウントの3割は乗っ取ることができる。

また2013年の日本国内の調査では、パスワードを1種類ですませている人が15%、2~3種類のパスワードを使いまわしている人が47%存在し、72%の人がパスワードの定期的な変更を行っていないと回答している。


誰かが僕を監視してる♪
プライバシーがないんだ♪

ロックウェルでSomebody’s Watching Me♪  
モータウン創業者の息子という事で、マイケルジャクソンがボーカルで参加してました。マイケルのボーカル効果で結構ヒットしたような。


関連図書:統計がらみ
【統計学が最強の学問である/西内啓/13年1月初版】
http://donhenley.blog.so-net.ne.jp/2013-03-26

【世界の経営学者はいま何を考えているのか/入山章栄/12年11月初版】
http://donhenley.blog.so-net.ne.jp/2013-02-05

【統計データが語る日本人の大きな誤解/本川裕/13年11月初版】
http://donhenley.blog.so-net.ne.jp/2014-01-21

【虎の007/三宅博/12年2月初版】
http://donhenley.blog.so-net.ne.jp/2012-06-02

【巨魁/清武英利/12年2月初版】
http://donhenley.blog.so-net.ne.jp/2012-05-19

(広告)



nice!(23)  コメント(12)  トラックバック(0) 

nice! 23

コメント 12

hanamura

昨日ラジオで、人工知能の判断力というか、仕組みを解説していました。統計による導きでも、経験則でもなく、「総当たり!」みたいな(うろ覚えでスミマセン)方法で、出来うるかぎりの、全てのパターンを試して、判断する。・・・という話を聞きました。
「ワトソン」 (コンピュータ)、カントの「コペルニクス的転回」というキーワードを覚えていますがぁ・・・。う~ん!やっぱり、よく分かりません。人間の思考や判断とは、まるで違うとも聞きました。
by hanamura (2015-01-28 07:28) 

扶侶夢

データ尊重を否定はしませんが、それは程度を考えないと数値至上主義デジタル崇拝に繋がってゆく道のように思えます。
by 扶侶夢 (2015-01-28 12:06) 

don

hanamuraさんこんにちは~
なるほど、総当たりですか。
性能が上がれば総当たりができるんでしょうね。[__犬]
by don (2015-01-28 12:44) 

don

扶侶夢さんこんにちは~
結果がついてくると、デジタル崇拝になってしまうのかもしれません。[__犬]
by don (2015-01-28 12:48) 

song4u

パスワードについては、こんな前近代的でチープな仕組みを
いつまで継続するつもりなのか?・・・と思います。
ある特定の文字列をミスなく入力させようとすれば、
その文字列に一定の意味合いが生じるのは必然であり、
更にそれを定期的に変更するなど、ほぼあり得ません。
これだけ脆弱なことが分かっているのなら、速やかに仕組みを
変えるべきだと思うのですが、なかなかやりませんよね。
提供者側の問題も大きいのに、いつの間にか利用者側の
問題にすり替わっているような気もします。
by song4u (2015-01-28 21:28) 

みかん

donさん、おはようございます。

ここのところいきなり夏のようになっていますが、
また金曜から冷えるみたいで、気温差がすごいです、
やはり砂漠地帯なんでしょうね。

ドラゴンボールのスカウター! 懐かしい^^
女性ですと「美力・体力・知力」みたいのがピピピッとか出て、
そのうち未来は結婚相手などもコンピューターで
決められてしまったりして(@_@。 怖いですね~!
by みかん (2015-01-28 23:25) 

DEBDYLAN

コンピューターはあくまで道具。
人間の細やかな感情や行動はソレでは一括りにできないんすよね。
臨機応変なのは人が動くアナログ。
ビッグデータはあくまで目安、参考資料の範囲かなぁ。

by DEBDYLAN (2015-01-29 23:40) 

don

song4uさんこんにちは~
指紋認証がいいのでしょうか。
パスワードに代わる何かは、すぐには思いつきません。

ぼくもほとんどパスワードの変更をしません。
2~3種類をずっと使いまわしてます[__犬]
by don (2015-01-30 12:42) 

don

みかんさんこんにちは~
今日はこちらは雨が降ってます。
わりと寒いです。
この時期に夏のような暖かさというのは、ちょっとうらやましい^^

グーグルグラスでも、フェイスブックデータがピッと出るみたい
なので、その人の基本スペックみたいなのはすぐに把握
されるんでしょうね。

そういう時代がきたら、プライバシーがなくて怖いです[__犬]
by don (2015-01-30 12:46) 

don

DEBDYLANさんこんにちは~
おっしゃるとおりなのですが、データに頼りきりになったりして。
参考情報がすべてになってしまう^^;
by don (2015-01-30 12:48) 

heroherosr

アマゾン、グーグル、ヤフーなどの持つビッグデータをさらにまとめて管理できるようになると、それこそ何でも分かることになりそうですね。
そのときはターミネーターじゃないけど審判の日になりそうです。
by heroherosr (2015-01-30 16:55) 

don

heroherosrさんこんにちは~
情報を握ったものは強いですよね。
グーグルに匹敵する企業が出てきて、
健全な競合世界ができて欲しいです[__犬]
by don (2015-01-31 12:04) 

コメントを書く

お名前:[必須]
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

トラックバックの受付は締め切りました