ソリューション

業務データ分析

AI開発でも使われる「Python」言語と、データ分析ライブラリ「Pandas」及び数値計算ライブラリ「NumPy」を使ってデータサイエンティスト業務を支援します。
具体的には、断片的または不整合なCSVやEXCELデータを補正したり結合や集計して、業務分析資料を作成します。
データサイエンティスト業務といえば、AIの機械学習に与える学習データを作成するイメージが強いですが、人の判断を助ける分析資料を作成するのも仕事です。

基幹業務システムが整備されていない会社では、データベースや帳票資料が整備されておらず、EXCELで管理されているケースも多いでしょう。
また、基幹業務システムが導入されていても、例えば以下のような事情で、適切な分析資料を出力する機能が実装されてないケースもあります。

  • 状況に応じて必要な分析資料が頻繁に変化する
  • 適切な分析資料の仕様を明確に定めることができない
  • 採用されているアーキテクチャの都合で実装が困難
  • 基幹システムへの追加予算が確保できない
  • 既存システムからCSV出力して各々加工したEXCELデータで管理している

作成した分析パターンは担当者様に引継ぎさせて頂くことも可能ですし、当社が継続して資料作成することもできます。

Case-1

WEBでECサイトを運営しており、商品や顧客の分析を行いたい。
多くのECサイトでは、注文履歴データ・顧客マスタ・商品マスタなど断片的なCSVデータをダウンロードできても、 分析資料は自分たちで加工・集計して作成しなければならないことが多く、
  • 作成する時間がない
  • どんな資料をどう作れば良いか分からない
  • 作成しているが非常に業務負担になっている
  • 分析資料をどう生かせば良いか分からない
などの状況が良く見られます。

Case-2

出荷(売上)伝票をEXCELで作って共有フォルダに大量保存しているが、これら伝票を一括集計したい。

EXCELに手入力で作成したデータは、システムによる機械的な入力チェックが行われていない為、 データはおのずと「汚く」なっていまい、そのままではデータ分析に活用できません。 例えば、人間からすると大差のない「半角」と「全角」の違いなども、データ分析においては誤動作を引き起こす「汚い」データとなってしまいます。

また、異なる部署から集められたデータを扱う場合には、それぞれ独自のシステムでデータが管理されていることが多く、 それらを統一的に扱うのは容易ではありません。 例えば、伝票番号先頭4桁が顧客番号を表す場合、顧客番号に紐づく顧客データは別部署が管理していることもあります。 更にいえば、伝票のように取引ごとファイルが分かれているケースでは、EXCEL内で関数やVBAマクロを使った集計方法では難しいでしょう。

Case-3

会員顧客の全体像を把握し、消費者行動を予測したい。将来の会員数の増減を予測したい。

将来に対する「何となくの感覚」をシュミレーションとして可視化することで、予測する判断材料にすることができます。
また、業務システムでの分析資料出力では、開発前に事前に帳票仕様を明確に定める必要があり柔軟性に欠けますが、 当社の業務データ分析支援サービスでは、分析結果に基づき次の段階の分析を行うといった発展的で柔軟な対応が可能です。

  • 利用履歴データと会員基本データを結合し、在籍/退会ユーザー数や性別や区分別の集計、会員期間の分布、月内平均利用回数など、基礎集計を行って会員顧客の全体像を把握します。
  • 継続ユーザーと退会ユーザーの過去傾向を比較し、退会見込みを予測する分析資料を作成することにより、退会リスクのあるユーザーにキャンペーン案内を行うなど顧客離れを未然に防ぐアクションに繋げることができます。
  • AIの機械学習を用いて、翌月の利用回数を予測することも可能です。具体的には教師あり学習の回帰アルゴリズムを使い、過去の利用履歴データを加工/集計してAIアルゴリズムに与える学習データとします。
  • SNSによる口コミ伝播をシュミレートし、消費者の行動予測を行うことも可能です。

Case-4

AIアルゴリズムを活用して、膨大なアンケートデータを効率的に分析したい。

GoogleフォームやLINEを使って膨大なアンケートデータを集めた場合、事前に用意する選択肢の集計を行ってグラフで可視化するのは比較的容易です。 しかし、選択した理由もしくは選択肢にない自由欄のコメントを分析・把握するのが難しく、アンケートを十分に活用できてない状況が良く見られます。

例えば、満足度を5段階で選択し、その理由をコメント欄に自由入力して頂く場合、AIアルゴリズムの形態素解析を用いて文章を単語と動詞等に自動的に振り分け、 満足度と理由の頻出語との関係データをグラフで可視化することができます。 更には、頻出語に動詞を付けた上で類似文章を検索することで、深堀り作業を効率化できます。コメント欄をいくつかピックアップして例示する場合にも役立ちます。