動的なグラフ生成が得意。
3月14日に開催された、KCCSモバイルエンジニアリング株式会社主催の「はじめて学ぶビジュアル分析 Tableauハンズオンセミナー」に参加してきたのでレポートします。
Tableauは、言わずと知れたセルフサービスBIのデファクトスタンダードとも言えるBIツールですが、非常に多機能かつ自由度が高いため、使えば使うほど新しい発見があります。また、人から教わることによって機能や使い方の新たな気づきも得られるので、基礎のおさらいも兼ねて、学ぶ機会があればなるべく参加するようにしています。そういうわけで今回も受講してきました。
セミナーの構成は、Tableauの概要や特長の説明のあと、基本的な分析と可視化のハンズオンが一時間程度あり、最後にTableau PrepやAlteryxといったデータ準備ツールの紹介をして終了という形です。
まずTableauの特長がExcelとの比較で示されており、Excelの苦手なポイントとして、集計を行いながら動的にグラフ作成を行うこと、同じようなグラフを大量に作成することの二つを挙げつつ、Tableauはそれを得意としているという説明がなされていました。なお、TableauとExcelの比較については「Tableau vs. Excel どっち?」にまとめているのでそちらも参照ください。
Tableauの分析と可視化のハンズオンでは、以下の基本的な内容が丁寧に説明されていました。
- データの読み込み。※データはサンプルスーパーストア
- ディメンションとメジャーについて。
- カテゴリ・サブカテゴリごとの売上と利益のクロス集計。
- 会計年度でのフィルター。※会計年度のアメリカ式と日本式の違い
- 二軸グラフの作成とリファレンスライン。
- 散布図の作成と傾向線・ハイライター。
- 地図へのマッピング。
- ダッシュボードの作成。
この中で、とりわけ会計年度のアメリカ式と日本式の違いについては、いままで受講したTableauの講座では聞いたことがなかったため、参考になりました。Tableauはアメリカで開発されたツールであるため、アメリカ式を採用しており、注意が必要です。具体的には、たとえば2019年4月から始まる会計年度は、日本式では2019年度となりますが、アメリカでは2020年度となります。
データ分析の80%はデータ準備。
セミナーの最後に、Tableau PrepやAlteryxといったデータ準備ツールの紹介がありました。そもそもデータ準備(Data Preparation)とは、データを分析可能な状態にするための準備プロセスのことで、データのチェックから、結合・変換・クリーニングまでの作業が含まれます。ある調査によると、データ分析の作業時間の80%はデータ準備に費やされており、分析に費やされる時間は20%にすぎないと報告されています。すなわち、データ準備の生産性向上が、データ分析の精度向上に直結することになります。
データ準備ツールは、データの欠損や分布を可視化することでチェックをしやすくしたり、データの結合や変換の処理をGUIベースで行う、いわゆるETLツールの機能を備えたツールです。ETLは、Extract(抽出)、Transform(変換)、Load(格納)の頭文字をとったもので、データウェアハウス(Data Warehouse:DWH)へのデータの集約を、従来はSQLなどのデータ操作プログラムによるスクラッチ開発で行なっていたものを、専門知識なしで行えるようにするために作られたものです。
データ準備ツールはDWHへのデータの集約のプロセスを劇的に改善したものの、近年のビッグデータ化にともない、処理性能や処理速度に問題を抱えるようになっています。Tableau PrepもTableau Createrライセンスがあれば利用可能なデータ準備ツールですが、オンプレミス型であるためマシン環境に依存し、多くの場合はビッグデータ処理には向きません。そこで、GCPのCloud Dataprepや、AWSのGlueなどのフルマネージドなクラウドサービスが登場し、データ準備を手軽に行うことが可能となりつつあります。
そのような状況の中で、Alteryxはオンプレミス型ではあるものの、多くの企業で利用されているデータ準備ツールです。もっともAlteryxは、データ準備から高度な分析や予測の機能までをワンストップで提供する統合分析基盤であるため、データ準備ツールというと語弊がありますが、Tableauとの連携性が高く、データ準備ツールとしての存在感を高めているといえます。Alteryxの詳細については別の記事にて紹介したいと思います。
関連する記事
須川 敦史
UX&データスペシャリスト
クロスハック 代表 / uxmeetsdata.com 編集長