ビッグデータの罠 (新潮選書)

  • 作者: 岡嶋 裕史
  • 出版社/メーカー: 新潮社
  • 発売日: 2014/11/27
  • メディア: 単行本


【ビッグデータの罠/岡嶋裕史/14年11月初版】
ビッグデータというのがよくわからなかったので読んでみた本。IT担当者との会話の中にぽろっと出てきて、なんかよくわからんけどすごい事かなぁと。

まずググってみました。

ビッグデータの定義ですが、総務省のHPにはビッグデータとは「事業に役立つ知見を導出するためのデータ」とされています。

ビッグデータビジネスとは「ビッグデータを用いて社会・経済の問題解決や、業務の付加価値向上を行う、あるいは支援する事業」であると。

中原圭介によると「ビッグデータ自体、IT業界で売るものがなくなったため、こじつけで生まれた面もある。ビッグデータというのはつまるところ、膨大なデータをどう統計で処理するか、ということにすぎない。そう考えると別になんの新味もない」身もふたもない。

いわゆる統計学なんでしょうね。少しすっきりした。



本書から有名どころなビッグデータを3つ。

1つはアマゾンの注文前発送。
どうするかというと、注文が発生する前に直近のブランチまで商品を発送してしまう。アマゾンはこの仕組みに自信を持っています。根拠は長年蓄積してきたプロファイリングデータ。顧客が次に買うものをほぼ特定できるようになったと。で、実際に買う前に近くまで発送してしまおうという。アメリカの場合、無人航空機と合わせて運用すれば、30分以内のデリバリーが保証できるサービスが構築できると。

2つめはグーグルの精度の高いインフルエンザ予測。
なぜグーグルは医療機関でもないのにインフルエンザの動向に精通してるのか。インフルエンザについて検索する利用者数と、インフルエンザの発症者数には密接な関係があるという。

3つめにヤフーの選挙予測。
2013年の参院選での予測は、121議席で争われ111議席で予測を的中させた。人間であれば票読み屋として一生食っていけるレベル。ヤフーのビッグデータ分析は政治的主張は全く関係ない。単に検索数だけで議席の予測をしている。検索数と得票数、議席数は計ったかのように相関を示した。小選挙区は政党名のSNS投稿数と得票数に強い相関関係があった。はずれたケースは、政党名をベースに分析を進める仕組みにしたため、無所属の候補で誤差が大きかった。



ビッグデータってリバイアサンかもしれない。データが個人の判断や分析に勝る。個人はいずれデータに従うようになる。

グーグルグラスはプライバシーの侵害で発売中止に追い込まれました。法整備を含めて、まだ時代が追い付いてない。みんながグーグルグラスをつけて生活を始めると、膨大なビッグデータが収集できます。

ドラゴンボールのスカウターみたいなもんでしょう。ルックスを数値化したり、イケメンに会う確率までデータとして取れたりして。イケメンは100人に7人ですとか(上位7%は偏差値65)。

そのうち何でも予測ができるようになったりして、人生の面白さが半減するような気もします。


その他の読書メモを。

(広告)




<コンピュータ将棋の戦法>
過去の膨大な局面から学ぶ。この局面で手Aを指した。その後勝った。したがって手Aはいい手である。一方で手Bを指したときは負けている。手Bは悪手である。こうした評価を延々と積み重ねていく。

日本将棋連盟は、2013年から対局中は電子機器の電源をオフにすることを対局規定に盛り込んだ。将棋ソフトなどで手を解析し戦いを有利に進めることを防ぐためである。もう少しすると、伝統的な2日制の対局はなくなるかもしれない。夜の間にカンニングできるからだ。チェスは2日制の対局は姿を消している。



<様々な分野のビッグデータの活用>
学校運営の分野でビッグデータの活用が認知されている。教員の勘や経験にもとづいていた分析をビッグデータで代替する。生徒の行動データと学務記録を突き合わせるといろんな分析ができるようになった。図書館の利用率は学業や生活全般に与える影響の大きい項目だが、1年生の秋に頻繁に図書館を使い始めた学生は何故か成績が向上する傾向がある。学食の利用頻度の高い学生は成績が良い、など。意外な相関関係が発見されたりする。こうした分析を継続し、学業不振や不登校に陥るリスクの高い生徒をピックアップし、個別にフォローする。



<ジェラシックパーク>
マイケル・クライントンはかつて「ジェラシックパーク」で、インターネットは人の多様性を促進しない、むしろ失わせる、検索エンジンの1ページ目に表示されない人や物は、見向きもされないようになると指摘した。それは現実のものになった。



<リベンジポルノに注意>
現状ではそれを回収、消去する方法はない。多くの機器にカメラが登載されるようになった今、恋人たちの間で撮影される性的な写真は極めて多数にのぼる。情報セキュリティ企業のマカフィは、「バレンタインデーにセクシーな画像を送るか」を調査して発表した。中国で53%、ブラジルで47%の人が送ると回答している。日本は調査対象となった15カ国の中で送ると答えた人の割合が最低だったが、それでも6%の人が送ると回答している。



<脆弱なパスワードランキング>



上記の左側は4ケタのクレジットカード暗証番号ワースト20。約1万通りの組み合わせがあるが、ワースト20の占める割合は、2012年の340万件の調査で約27%もあった。トップの1234は340万件のなかで何と11%を占めていた。この一覧を試していくだけで、他人のアカウントの3割は乗っ取ることができる。

また2013年の日本国内の調査では、パスワードを1種類ですませている人が15%、2~3種類のパスワードを使いまわしている人が47%存在し、72%の人がパスワードの定期的な変更を行っていないと回答している。


誰かが僕を監視してる♪
プライバシーがないんだ♪

ロックウェルでSomebody’s Watching Me♪  
モータウン創業者の息子という事で、マイケルジャクソンがボーカルで参加してました。マイケルのボーカル効果で結構ヒットしたような。


関連図書:統計がらみ
【統計学が最強の学問である/西内啓/13年1月初版】
http://donhenley.blog.so-net.ne.jp/2013-03-26

【世界の経営学者はいま何を考えているのか/入山章栄/12年11月初版】
http://donhenley.blog.so-net.ne.jp/2013-02-05

【統計データが語る日本人の大きな誤解/本川裕/13年11月初版】
http://donhenley.blog.so-net.ne.jp/2014-01-21

【虎の007/三宅博/12年2月初版】
http://donhenley.blog.so-net.ne.jp/2012-06-02

【巨魁/清武英利/12年2月初版】
http://donhenley.blog.so-net.ne.jp/2012-05-19

(広告)