データ活用支援で押さえるべきポイント

はじめに

三菱総研DCSデータサイエンス事業部の榎戸です。
今回はデータサイエンティストの仕事の一つである、「データ活用支援」についてご紹介します。実際私も現在ビッグデータを保持する企業様向けに、データ活用支援を行う業務を担当しており、その業務をどのように進めているか説明します。

    目次

  1. データ活用支援とは
  2. データ活用支援の進め方
  3. データ活用支援で大切なこと
  4. 最後に

データ活用支援とは

当社のデータサイエンス事業として取り組んでいる「データ活用支援」とは、お客様の企業で「データ活用文化を推進する」ことを目標としています。データ活用支援ではお客様が抱える課題に対して、データを様々な手法で分析し課題解決をお手伝いします。主に以下のような内容で分析を行っています。

・アドホック分析
お客様の目的に沿った分析結果を都度ご提供します。
とある小売店で「集客のためキャンペーンを実施したいが、ターゲットをどのようにして決めたら良いかわからない。」ということであれば、店舗利用者の性別や年代などの属性、時間帯別売り上げなどを分析します。例えば新規顧客の開拓を目的としたキャンペーンを実施するのであれば、お客様はそのレポートを元に、利用が少ない属性をターゲットに施策の検討をすることができます。

・定型レポート
月次レポートなど決まった内容で定期的にレポートを提供します。
店舗の売上を月次で把握したいということであれば、対象月の売上や過去からの推移、加えて利用者の属性やリピーターなど確認できるレポートを作成し月次でお客様に提供します。お客様はそのレポートで売上を把握できます。もし急な変化がありお客様から詳細分析のご要望があれば、原因の仮説を立てて検証するアドホック分析を実施します。

・分析メニュー
定型レポートは毎回決まった内容でご提供しますが、分析メニューではお客様がある程度自由に条件を設定してレポートを出力します。ある程度想定される条件でデータマート[1]を事前に作成しておきそこから出力する方法と、利用の都度データを抽出し集計してレポートを作成する方法の2パターンが存在します。
前者は集計済みのため作成時間が早いというメリットがありますが、データマートにない条件は出力することができません。逆に後者は自由度が高い出力ができますが、都度データを抽出するため、かなりの時間を要する場合があります。
分析メニューについては、目的に応じてどちらを使うかを適切に判断する必要があります。

[1] データマートとは、企業などで情報システムに記録・蓄積されたデータから、利用部門や用途、目的などに応じて必要なものだけを抽出、集計し、利用しやすい形に格納したデータベースのこと。「マート」(mart)は「小売店」の意。(出典元:IT用語辞典

データ活用支援の進め方

では、実際にデータ活用支援はどのように行うのでしょうか。
分析の内容をいくつか説明しましたが、その中でアドホック分析の基本的な進め方を説明します。

①分析相談
分析側からお客様の業務課題に対して分析提案をすることもありますが、大半はお客様からの「こういったことを分析できないのか」という相談から始まります。
分析相談では分析が必要となった背景や目的などをヒアリングし、解決するための分析手法やアウトプットを考えてご提案します。
ただし、必ずしも分析結果を提供できるような相談ばかりではありません。参照可能なデータだけでは結果がでない依頼もあります。その場合でも、見方を変えてみるなど可能な限り、お客様に寄り添って対応します

②分析設計
分析相談の後、正式に分析の依頼を受けると、まずは分析の進め方を設計します。分析設計では、以下の分析をする際に必要となることを決めます。

  • 今回の分析で必要となるデータはどれか。
  • そのデータをどのように抽出し集計すれば、求めるアウトプットができるようになるか。
  • 最終的にお客様に納品するためのアウトプットはどのようなものにするか。
  • 作業時間はどのくらいかかり、成果物を納品できるのはいつになるのか。

ここでの分析設計が甘いと、定義が曖昧だったりして後の分析作業で手戻りが発生してしまう場合があります。

③分析
このフェーズでは、分析設計に基づき実際にデータの抽出や集計を行い、アウトプットを作成するのに必要なデータマートを作成します。ここでの抽出や集計にミスがあると、レポートの値のミスに繋がります。複雑な分析の場合は手順が多くなりがちですが、そのような場合こそ作業途中での小まめな確認が重要になります。

④レポート作成
分析フェーズで作成したデータマートを使って、分析結果をまとめたレポートを作成します。わかりやすいレポートを作成することも、データ活用推進には必要なスキルです。
例えば日別の売上推移を確認したいといった要望の場合、単に集計表を作成するだけでは、売上の良し悪しを一目で判断できません。そういった場合は折れ線グラフを使うなどの工夫が必要です。棒グラフ、ヒートマップなども視覚的にわかり易いレポートです。お客様にとって何が最適かを常に考えながら作業をする必要があります。

図:視覚的にわかりやすいように工夫したレポートイメージ[2]

[2] 統計ダッシュボード(https://dashboard.e-stat.go.jp/)のレポートを加工して作成

データ活用支援で大切なこと

データ活用支援で大切なことについて、ここでは3つほど具体例を挙げて説明します。

1つ目は分析設計をする際、分析するための目的を見極めること」です。

お客様からの依頼でこういうことがあります。

『A店の売上が悪くてね。改善のため商品の見直しを考えているんだけど、商品別の売上推移が知りたいのだけど出せるかな。

「商品の見直し」をするために分析をする。もっともらしい依頼ですが、「商品の見直し」は手段であって目的ではありません。本当の目的は「A店の売上の改善」で、そのために「商品の見直し」を行うのです。
展開している商品が原因ということもありますが、そうと決めつける前にもっと大きな括りで考えることが必要です。好調な店舗と比較して利用者の性別や年代など属性は異なるのか。どこの時間帯の売上が悪いのかなどの観点からも見る必要があります。
私達がやっているのは「データ活用支援」で、お客様自身で分析する目的をしっかりと考えられるようになるための支援も役割の一つです。

2つ目は分析をする際にはデータ整備に時間をかけること」です。

特定のお客様でのデータ活用支援を長く行なっていると、こういった相談があります。

『最近Webサイトが変わってアクセスログが簡単に取得できるようになったのだけど。CSVとかで連携するから、今の顧客情報DBと組み合わせて、どんな人がアクセスしているか分析してみてくれないか。まずは簡単な物で良いので2週間くらいでできるかな。』

と、新しいデータを使った分析を依頼されることがありますが、新しいデータを利用する場合には、必ずデータクレンジングが必要で簡単に分析に使うことはできません。データクレンジングとはデータの欠損や重複、表記の揺れ、粒度の違いなどを特定し、分析や業務に適したデータに加工する工程です。分析の準備としてとても大切な作業でしっかりと時間をかけて行う必要があります。

3つ目は「データ活用支援では上記のように、正しいステップを踏むということ」です。

  1. まずは分析をする目的は何かをハッキリさせる。
  2. 目的に沿って分析を設計する。
  3. 分析する前にデータを整備し、分析できる環境を整える。
  4. 実際に分析し、目的に沿ったアウトプットを作成する。

上記のステップを途中からやっても最終的にいい成果物を作成することはできません。そういったことをしっかりと理解し進めることで、正しい意味での「データ活用支援」が行えるのではないかと考えます。

最後に

今回ご紹介したことは、データ活用支援のほんの一握りの部分です。ですがデータ活用に興味が出てきたとか、自分たちでもデータを活用したいと思われた方もいるのではないかと思います。

そういう私も3年くらい前までは、Webアプリケーションの開発といった全く別の分野を担当していました。そんな私がなぜデータサイエンスの分野で活躍できているかというと、、、当社ではデータサイエンティスト育成研修を社内外に提供しているからです。

当社に在籍する60名以上のデータサイエンティストを育成してきたノウハウに基づく研修プログラムで、データサイエンスに関わる基礎から応用まで習得できます。このご時世、集合研修が難しいという場合でも、e-learningのコンテンツもご用意しています。

ちょっとでも興味を持った方は下記URLをクリック!

【データサイエンティスト育成サービス】
https://www.dcs.co.jp/bsd/lp/analytics.html