水曜日, 5月 01, 2013

「ビッグデータの覇者たち」を読んだ

  • 海部美知さんの「ビッグデータの覇者たち」を読んだ。
  • 実は「ビッグデータとは」というのがどうもピンとこなくて、いくつか本を買ってはみたものの積んどく状態になっていて、いい本がないか探していたのだった。
  • 海部さんの「Tech Mom From Silicon Valley」というブログは時々身を通していたのだが、ブログを引っ越しされて新ブログに移って、そこに近々、ビッグデータ云々という本がでるという告知があり、読んでみようと思っていたのだった。
  • ビッグデータというのは、海部さんの解説によると、
  • 人間の頭脳で扱える範囲を超えた膨大な量のデータを、処理・分析して活用する仕組み 
  • とあった。膨大な量のデータを扱うのはよくわかるが、どのように処理・分析するとどんなことに使えるのか、これが知りたい。
  • iPhone5発売によって、google mapにかわって搭載されたアップル純正の地図アプリの不出来具合の例(パチンコ・ガンダム事件)での説明がわかりやすかった。
  • アップルは地図データベースや3D航空写真の会社などを複数買収して準備し、地図の基本データは、欧米ではオランダトムトム社から調達した。トムトム社は世界のカーナビ向け地図データの供給元大手2社の一つということで、グーグルと遜色があるわけではない。ただし、トムトム社はカーナビ向けが主力で道路データは強いが鉄道・店舗・主要施設・観光地等という「非道路系」データは強くない。グーグルは多くのソースから情報を集め、そしてこれらに整合性を持たせ優先順位をつけ、地図にわかりやすく文字や記号を入れ込み、ユーザーが投入したキーワードに合う場所を表示する。そこにグーグルのビッグデータ力が使われている。
  • アップルは自前データを十分にもっていないため、鉄道や店舗などのデータをいろいろなソースからかき集めた。それがアメリカ以外では十分ではなかった。さらにこれらを縫い合わせて不整合が起きないようにする「コンフレーション」という作業が不十分だったところが原因のようだ。さらに「検索・絞り込み」の問題がある。重要度の絞り込みが下手でパチンコ屋の名前が駅の記号で表示されてしまう、データベースの引っ張り方が下手でテムズ川の検索結果に中世の地図が出てしまう。つまりこれらのことはビッグデータ力の不足ということだ。
  • 今後のビッグデータ活用に関して、公共部門や医療問題が挙げられていた。確かに。この応用の可能性について、どうも自分の意識の引っかかりがあったようだ。これから、考えてみる必要のある大きな問題だろう。


0 件のコメント: