ニュースやネット記事などで、「ビックデータ」という言葉をよく聞くようになりました。AI(人工知能)やクラウドと同様にビジネスに取り入れ活用すべきITのトレンド技術として語られ、導入事例も活発に紹介されています。
しかし、ビックデータがどのような技術なのか、具体的な活用方法、ビックデータの強みなどしっかりと理解できている人は少ないのではないでしょうか。今回は、「ビックデータ」活用の第一歩として、基本から、その強み、活用事例まで分かりやすく紹介していきます。
ビッグデータとは?
ビックデータとは「一般的なデータ解析ソフト・手法などでは扱うことが困難な、巨大で複雑な種類のデータの集合体」を指します。総務省はビックデータを以下のように定義しています。
デジタル化の更なる進展やネットワークの高度化、またスマートフォンやセンサー等IoT関連機器の小型化・低コスト化によるIoTの進展により、スマートフォン等を通じた位置情報や行動履歴、インターネットやテレビでの視聴・消費行動等に関する情報、また小型化したセンサー等から得られる膨大なデータ
引用:総務省 平成29年版情報通信白書
さらに、ビックデータの特徴を端的に表したものとしてVolume(データの量が多い)、Variety(豊富なデータの種類)、Velocity(データの生成と更新が速い)の3つの用語の頭文字をとった「3V」というものがあります。
このようにビックデータは単に「膨大なデータ」というだけではなく、「様々な種類・形式が含まれるデータ」ということができます。
従来のデータとの違い
従来のデータ分析でもコンピューター性能の向上やクラウドコンピューティングの発達などにより膨大な量のデータを扱うことは可能でした。しかし、そこで扱えるデータは基本的にCSVファイルやExcelファイルの表のようにデータの個数や順序が決まっていて、リレーショナルデータベース(RDB)に格納することができる「構造化データ」(定形データ)が中心でした。
しかし、ビックデータ分析では「構造化データ」だけではなく、様々な種類・形式を含む「非構造化データ」(非定形データ)を扱うことができます。
非構造化データには絶えること無く生成され続ける時系列性・リアルタイム性があるデータが多く、従来のデータ分析では扱うことは困難でした。ビックデータではこのようなデータをリアルタイムに記録・保存し解析することで、新たな規則性を発見したり、これまでにはないソリューショや仕組み・システムを生み出すことができると期待されています。
なぜビッグデータは活用されているのか
ビックデータの活用が進んでいる理由は意思決定にデータを活用したいという企業ニーズの増加と、IT技術の発展によるデータ収集の容易化、AIに代表されるようなコンピュータの処理能力の向上です。
ビジネスの観点から見ると、企業には元々データを経営の意思決定に活用したいというニーズがありました。
たとえば、ECサイト運営企業であれば、Webサイトのアクセスを解析して、訪問者の閲覧履歴から最適な情報を届けられるようにサイトを改良したり、SNSを利用したマーケティングを行っています。また、スーパーやコンビニのような小売業の場合はレジのPOSデータを解析し商品の仕入れや、陳列の最適化に活用しています。
他にも需要予測に基づく生産量の調整、新市場・新規顧客の開拓など様々な経営判断にデータが活用されいます。
一方で技術的な面から見ると、IoTの普及やMA(マーケティングオートメーション)ツールの高度化・多機能化、データベースの容量増加、SNSマーケティングの活用により従来は集めることができなかったデータを収集・蓄積できるようになりました。またコンピューターやAI(人工知能)の処理能力が大幅に向上し、収集された豊富な種類のデータを高度に分析・解析が行えるようにもなりました。
さらに、現在は「クラウドコンピューティング」の誕生により、データの蓄積・解析のために自社でデータベースやコンピューターを所有する必要がなく、従来よりも低コストでデータ活用が行えるようにもなりました。
このように企業のニーズとIT技術の発展により企業が扱うことができるデータ量は年々増加の一途をたどっています。それに伴い適切な意思決定のために、できる限り豊富な種類・形式のデータを集め、解析することが重要になってきています。そこにコンピューティング技術の発展も伴い、ビックデータが活用されるようになりました。
ビッグデータの種類
ビックデータにはいくつかの種類がありますが、分類方法の1つとして、総務省は「国、企業、個人」の3つを基準に以下のように4つに分類しています。
国や自治体のデータ(オープンデータ)
オープンデータは政府や自治体など公共団体が所有している情報・データのことで、「官民データ」とも呼ばれます。政府は2016年12月に「官民データ活用推進基本法」を施行して、オープンデータを一般に開放しビックデータとして活用してもらうことで、革新的なイノベーションやアイディアの創出につなげようという取り組みが推進しています。
民間企業にとっても、政府や自治体のオープンデータを活用することで、これまではにはないビジネスアイディアやビジネス機会を創出することができます。
企業のデータ①(暗黙知・ノウハウ)
企業の様々なビジネスノウハウや経営ノウハウをデジタル化・構造化し、蓄積した情報・データのことです。「知のデジタル化」とも呼ばれます。今後は多種多様な分野・産業で「知のデジタル化」が進み、様々なノウハウがデジタル化され、ビックデータとして蓄積・活用されていくでしょう。
企業のデータ②(M2Mのデータ)
M2Mは「Machine to Machine」の略で機械同士をネットワークでつなぎ機器間で情報・データを交換・収集することで最適化された制御を人間の介入なしで行う仕組みのことです。
たとえば、工場では生産設備のIoT機器から収集されるデータを活用し、効率的な生産体制を実現しています。他にもコンピューター、サーバーなどの情報通信機器のデータ、街なかにあるカメラやセンサー等からのデータがM2Mのデータにあたります。
「知のデジタル化」であるノウハウデータとM2Mのデータを組み合わせたものを「産業データ」と言います。
個人のデータ
個人のデータは「パーソナルデータ」と呼ばれるもので、個人の名前や性別、年齢などの属性情報や購買履歴、スマホ、スマートウォッチなどのウェアラブル端末から収集される移動・行動履歴のような個人情報が含まれます。
また、2017年に施行された『改正個人情報保護法』においてビッグデータの適正な活用のために特定の個人を識別できないように加工された人流情報、商品情報等である「匿名加工情報」もパーソナルデータに含まれることになりました。
ビッグデータ最新活用事例
交通:タクシーの配車支援システム
街なかでよく見かけるタクシーですが、終電後の駅周辺などではずらりと大量のタクシーが並んでいることが多く、そこに停車している時間は料金が発生しないため非常に効率のが現状です。
そこで、トヨタ、JapanTaxi、KDDI、アクセンチュアの4社は人工知能を活用したタクシーの「配車支援システム」の導入を始めています。このシステムではタクシーの運行情報とイベントなどの開催状況、人々のスマホの位置情報をビックデータとして収集し解析することで94.1%という高い精度の需要予測の配信に成功しています。
実際に配車支援システムを活用して売上が上がったという成果もでています。
通信:ソフトバンクは接続性を向上
ソフトバンクは元々、スマホ通信の接続性が悪いという評価が多く、すぐにでも改善する必要がありました。そこでソフトバンクは月間3億件にも上るスマートフォンの位置情報や接続状況をセットにし、ビックデータとして収集し解析することで繋がりにくい地域や時間帯を特定して接続状況の改善に成功しました。
EC:アマゾンや楽天はレコメンド機能で売上向上
オンラインショッピングではビックデータ解析を活用した「レコメンド機能」で、売上の向上を図っています。ビックデータとして蓄積されたWebサイトの観覧履歴や購買履歴を解析して、顧客の好みにあった商品やよく同時に購入されている商品、以前購入した商品で定期的な購入が必要な商品などを最適なタイミングでオススメとして表示しています。
また、楽天はビックデータ解析から、ランキングの更新頻度を高くしたり、ジャンルを細分化することで売上が上がることを突き止め、実際にランキングを改善し、売上げ向上の成果を上げています。
決済:園内での一括決済を実現したディズニー
アメリカ・フロリダ州にあるディズニーワールドでは園内での支払いを一括で行えるようにするためにIoT技術と ビッグデータ解析を活用した「MagicBand」というウェアラブルリストバンドを導入しています。
リストバンドにはセンサーが搭載されており、入場、園内での買い物、アトラクションの予約、ホテルのチェックインなど様々なシーンで一括の支払いを行えます。
さらに、ディズニーはバンドを利用者の行動・移動履歴をデータとして収集することにも活用していて、アトラクションの混み具合や待ち時間、レストランの滞在時間を調べることで、来場者がスムーズに移動し楽しめるよう、スタッフの配置や在庫補充に役立てています。
公共:オークランド市はビックデータ活用で犯罪発生率を低下
アメリカ・カリフォルニア州オークランドは高い犯罪発生率を改善するためにビックデータを活用しています。
これまでの事件のデータを解析して、いつ、どこでどのような犯罪が起きたのかを特定し、市民に危険な地域や時間帯を避けるように勧告したり、その地域・時間帯でのパトロールを強化することで犯罪の発生防止に役立てています。
今後さらにビッグデータの活用は進む
ビックデータは現在でも様々な分野で活用され効果を発揮しています。しかし、これからはIoTの普及に伴いあらゆるものがデータを生成する時代になり、これまでとは比べ物にならないほど大量のデータが生成される時代になります。
それに伴いサービスの品質アップや新しいサービスの創出、業務の効率化が行われるなど、ますますビックデータの活用が進むでしょう。