折れ線グラフで時系列データを可視化してみよう
今回のデータは注文日を含んだ時系列データとなっています。そこで、横軸を時間とした時系列グラフとして地域別の利益を可視化してみましょう。一度やったやり方については簡易的に記載していきます。やり方がわからなくなった場合は前の章を読み返してください。
先ほどのダッシュボードの画面の左上にある「Create visualization」をクリックします。 新規Visualize作成画面に移動したらドラッグ&ドロップを活用し、以下の設定になるようグラフを作っていきます。
-
Horizontal axis
- Order Date
-
Vertical axis
-
Total Profit
- Sum(合計値)
-
Total Profit
ここでさらに地域別になるようにグラフを分割してみましょう。「Break down By」に「Available Field」の「Region」をドラッグ&ドロップします。
すると棒グラフのグラフが縦軸で地域別に分割されました。 全ての地域の情報を表示したいので、前回と同じ手順で「Top values of Region」をクリックし、「Number of values」を「10」に変更します。
これですべての地域の情報を縦棒グラフで表示できました。しかし、何とも見にくいです。原因としては以下の2点が挙げられるでしょう。
- 積み上げ棒グラフの形ではそれぞれの地域がどの程度の値なのか比較するのが難しい
- 横軸の広さに対して棒1本あたりの期間が狭すぎる(変動を細かく可視化し過ぎている)
それぞれの課題を解決していきます。まずはそれぞれの地域別の値を直接可視化できるようにグラフの形状を折れ線グラフに変更します。「Suggestions」の左から3番目の折れ線グラフの画像をクリックします。
グラフが折れ線グラフになったことで、それぞれの地域の値が直接見られるようになりました。しかし、縦軸の合計値計算の期間が短すぎるためにギザギザし過ぎていて、それぞれの地域がどんな値を持っているのかわかりません。計算期間を変更していきましょう。「Vertical axis」の「Sum of Total Profit」をクリックします。
「Customize time interval」をクリックし、「Minimum interval」として「year」を選択します。こうすることで、利益の合計値計算が1年単位となり、把握できるグラフとなりました。
今回のグラフはこれで良いでしょう。画面右上の「Save and return」をクリックします。
前回のVisualizeに追加して、今回作成したVisualizeがダッシュボードに追加されました。 前回のグラフからは、「Europe」が1位で「Sub-Saharan Africa」が2位ということはわかっていましたが、年単位で見ると、順位が入れ替わっていることが新たにわかりました。他の地域については、常に同じ順位ですね。
以上が時系列グラフを可視化する手順となります。統計的な計算をする際に時系列の期間をどれくらいに設定するか、が肝となってきますが、他は通常のグラフを作るのと変わりません。
ツリーマップで割合を可視化してみよう
次は地域別とは異なる観点の、利益の種別割合に関するグラフを追加してみます。 割合を可視化する場合、円グラフを使いたいという人が多い印象ですが、動的に値が変わるダッシュボードで円グラフを使うのは基本的にオススメできません。理由は以下の通りです。
-
円グラフでは1位の割合は見た瞬間に把握できるが、2位以下の割合を一瞬では把握しにくい
- そのため、1位と2位以下の比較はしやすいが、2位以下同士の比較となると、どれくらい差があるのかわかりにくい
- 上位の寡占具合を可視化しやすいのが円グラフの利点だが、動的に値が変わると必ずしも上位寡占状態とは限らなくなる
これらの問題を解決しつつ割合を可視化できるのがツリーマップです。今回はアイテム種別の利益割合をツリーマップで可視化してみます。 先ほどのダッシュボードの画面の左上にある「Create visualization」をクリックします。
ここまではグラフ種別を画面下部の「Suggestions」から選択しましたが、自分で変更もできます。画面中央上部の「Bar vertical stacked」をクリックし、その中から「Treemap」をクリックします。 さらに画面右側の設定を以下のように変更します。
-
Group by
-
Item Type
- 上位100件
-
Item Type
-
Sort by
-
Total Profit
- Sum(合計値)
-
Total Profit
すると、このようにアイテム種別の利益割合をツリーマップで可視化できました。このデータの中では生活雑貨(Household)や衣類(Cosmetics)の利益が高く、介護(Personal Care)や飲料(Beverages)の利益は低いことがわかります。 「Save and return」で戻りましょう。
作成したVisualizeがダッシュボードに追加されました。割合の表示方法、いかがだったでしょうか。