- 面積グラフとは?
- 面積図を使うべき場合
- Overlapping area chart
- Stacked area chart
- データ構造の例
- 面積図の使い方
- ゼロベースラインを入れる
- Limit number of series in an overlapping area chart
- Consider of lines in stacked area chart
- よくある誤用
- 単一の系列をプロットするために面積チャートを使用する
- Iterpreting values on individual groups in a stacked area chart
- 一般的な面積グラフのオプション
- パーセント積層面積グラフ
- Line chart
- 棒グラフと積み上げ棒グラフ
- Ridgeline plot
- Stream graph
- Visualization tools
面積グラフとは?
面積グラフは折れ線グラフと棒グラフを組み合わせて、1つまたは複数のグループの数値が、第2変数(通常は時間)の進行に伴ってどう変化するかを示すものです。
このエリア チャートは、架空の Web ベースの会社のアクティブ ユーザー数を月別に計算したものです。 各月の値は、図形の上部の垂直位置だけでなく、ベースラインと上部の間の色のついた高さからも測定できます。 このグラフでは、2019年11月から2020年2月にかけてアクティブユーザー数が約2倍になっており、時間の経過とともにユーザーの増加率が高まっていることがわかります
面積図を使うべき場合
上の例では、陰影をつけた1本の線のみをプロットしましたが、一般的に面積図は複数の線でグループ(別名シリーズ)間の比較や全体を構成部分に分割して表すために使用されます。
Overlapping area chart
グループ間の値を比較したい場合は、Overlapping area chartになります。 重なり面積グラフでは、まず標準的な折れ線グラフを作成します。 グループごとに、横軸の値に1点ずつ、縦軸の変数にグループの値を示す高さをプロットし、グループのすべての点を左から右へ線で結びます。 面積図は、ゼロの基準線に対して、各線の間に陰影をつける。 通常、グループの陰影はある程度重なるので、すべてのグループの線が見やすいように、陰影に透明度を持たせている。
一方の系列が他方より常に高くならないように注意し、またはプロットが他のタイプの面積グラフ (積み上げられた面積グラフ) と混同されるかもしれません。
Stacked area chart
一般に、「エリアチャート」という言葉が使われるとき、実際に暗示されているのはstacked area chart(積み上げられたエリアチャート)です。 重なり合ったエリア・チャートでは、各線はその垂直値から共通のベースラインまで陰影がつけられていた。 積み上げ式面積図の場合、線は1本ずつプロットされ、最も新しくプロットされたグループの高さが移動基線となる。 そのため、一番上の線の完全に積み重ねた高さは、すべてのグループにわたって合計すると合計に対応します。
合計値だけでなく、グループによってその合計の内訳を理解したい場合、積み上げられた面積グラフを使用することになります。 曲線の各セグメントの高さを比較することで、合計への貢献度において、各サブグループが他とどのように比較しているかを一般的に把握できます。
データ構造の例
Month | Trials | Basic | Premium |
---|---|---|---|
2019-」のようになります。11 | 154 | 1180 | 201 |
2019-12 | 157 | 1186 | 219 |
2020-01 | 170 | 1195 | 270 |
2020-02 | 180 | 1213 | 285 |
… | … | … |
エリアチャートで描画するデータは、通常2列以上の表に集約されます。 最初の列は、各線がプロットされる横軸の位置を示しています。 続く列は、各ポイントの垂直方向の寄与を示し、プロットされる系列ごとに1列となる。
積み上げられたエリア・チャートのために、いくつかの視覚化ツールは、個々の寄与ではなく、代わりに累積寄与をリストする列を必要とする。 この場合、列は線の高さを直接指定し、各グループの貢献は列間の値の差によって暗示される。
月 | トライアル | + Basic | + Premium |
---|---|---|---|
2019-年11 | 154 | 1334 | 1535 |
2019-12 | 157 | 1343 | 1562 |
2020-01 | 170 | 1365 | 1635 |
2020-02 | 180 | 1393 | 1678 |
… | … | … |
面積図の使い方
ゼロベースラインを入れる
線グラフはゼロベースラインを必要とするという制限はありませんが、網掛けを追加することは各グループの値の大きさを比較するのに色付きの領域の高さを使うことになるわけですから、その高さによって、そのグループの値がどのように変わるかを比較することになります。 したがって、棒グラフと同様に、網掛けを行うべきゼロベースラインが存在することが必須である。
このルールの例外は、シェーディング ルールを変更して、オーバーラップするエリア チャートで 2 つの系列を比較するときに発生することがあります。 もし、陰影を両方の線から共通のベースラインまでではなく、線の間に制限するならば、ベースラインなしで興味のある効果に縦軸の限界をズームすることができます。 網掛けは現在別の意味を持ち、色はどちらのグループがより大きな値であるかを示し、色の量は差の大きさを示します。
Limit number of series in an overlapping area chart
重なり合う領域チャートで系列が多くなればなるほど、それらが重なるときに色の組み合わせが多くなることになります。 ほとんどの色が1つのグループに関連づけられないという事実は、解釈の難しさの原因となります。 3つの個別の色、3つのペアでの重複、3つのグループが重なったときの1色で合計7色になります。 また、一般的な凡例にはない、重なった色の解釈で読者が混乱する可能性もあります。 一般的な経験則として、重複面積図の使用を考えている場合、2つの系列に限定し、線グラフを使用することでグループ間の比較がより明確に示されるかどうかを考えてください。
Consider of lines in stacked area chart
グループの線がプロットされる順序にかかわらず、図の全体像は同じですが、可視化を読むことは線の順序の良い選択によってサポートできます。 経験則としては、最も大きいグループや最も安定しているグループを下に、最も変動しやすいグループや最も小さいグループを最後に、そして上に置くとよいでしょう。
よくある誤用
単一の系列をプロットするために面積チャートを使用する
記事の冒頭で述べたように、面積プロットの典型的な使用例は、2つ以上の系列間の比較や量の分割を表示することです。 プロットする値の系列が1つだけの場合、面積図を使用するのは間違った選択であることがよくあります。 より良い選択肢は、データについて何を学び、何を伝えたいかによって、棒グラフまたは折れ線グラフを選択することです。
時間の経過とともに正確な値の進行を理解したい場合、横軸にプロットする値があまり多くない場合は、棒グラフが良い選択となります。 そうでなければ、折れ線グラフがよりよい選択です。 線グラフは、棒グラフに比べ、データ量とインク量の比率が高く、見た目もすっきりしています。 さらに、多くの値がある場合、正確な値よりも傾向の方向と傾きに関心がある可能性が高く、折れ線グラフがよりよく機能するケースです。
Iterpreting values on individual groups in a stacked area chart
Stacked area chart では、全体の合計と一番下のグループの2ケースでのみ正確な値を計測することが本当に簡単です。 中間のグループの場合、グループの貢献の正確な値を得るには、そのグループの線の高さを見つけ、その下の線の高さを差し引く必要があります。
時間の経過とともに変化を追跡したい場合、作業はさらに悪くなります。 前と同様に、これは全体と最下部のグループには簡単である。 しかし、中間のグループは、変化するベースラインによって妨げられ、正確な垂直方向の違いを認識することが困難になります。 このブログの記事から引用した以下の例では、このことが明確に示されています。 中央の黄色いグループの大きさが時間とともに変化しているように見えますが、実際には、各ポイントの高さは一貫しています。
正確なグループの値とその時間的変化を知りたい場合は、この Everyday Analytics の記事で示されているように、標準のライン チャートを選択するとよりよい選択肢になるでしょう。
一般的な面積グラフのオプション
パーセント積層面積グラフ
面積グラフの一般的なオプションは、パーセント、または相対頻度、積層面積グラフです。 各縦断で各グループの絶対値を積み重ねるのではなく、全体の高さが常に100%になるように、合計に対する各グループの相対的またはパーセンテージの寄与を積み重ねます。 このグラフは、絶対値の合計の傾向に関する情報を失うが(したがって、独自の折れ線グラフが必要になる)、グループ間の相対的な貢献度の比較を浮き彫りにするのに役立つ。
Line chart
線グラフは面積グラフの主な祖先です。 エリア・チャートに興味があるかどうかわからない場合、ライン・チャートを使用すれば、間違った方向に進むことはないでしょう。 特に、重なり合った領域がすぐに制御不能になる重なり合い面積図の場合、その傾向が顕著です。 もう 1 つの考慮事項として、データで複数の比較を行うことに興味がある場合、できるだけ多くのことを運ぶために 1 つのチャート タイプだけを選択する必要性を感じるのではなく、単に多くのプロットを生成することが常に可能です。
棒グラフと積み上げ棒グラフ
エリア・チャートの他の子孫として棒グラフが挙げられます。 より正確には、積み上げられたエリアチャートと積み上げられたバーチャートの間に最も近いリンクがあります。
積み上げられたバーチャートは、線の代わりにバーがあるだけで、積み上げられたエリアチャートに非常によく似ています。 したがって、積み上げ面積チャートの制限の多くは、積み上げ棒グラフにも当てはまります。 ただし、積み上げ棒グラフの利点は、各水平軸のビン内の値を一貫して判断することがはるかに容易であることです。 面積図の網掛け部分は、特に線の方向が変わったときに、上記のように歪んでしまうことがあります。
Ridgeline plot
Overlapping area chart に代わるもうひとつの方法は、Ridgeline plot です。 すべての線と色のついた領域を同じ軸にプロットするのではなく、 ridgeline plot はそれぞれの線を異なる軸に置き、それぞれが他の線から部分的に垂直方向にオフセットしています。 線のオフセットの性質のために、通常、垂直方向のマークは稜線プロットから省かれます。
Stream graph
面積グラフの空想上の親戚に、流線グラフというものがあります。 積み上げ面積グラフでは、すべての線が積み上げの底にあるまっすぐな基線の上に重ねられています。 流線グラフは、グラフの中心を基線とし、その中心線を中心に左右対称に面積が集まっている。 このため、どのグループも、あるいは全体の合計も、正確な値を測ることは困難です。
Andy Kirkが主張するように、ストリームグラフは、多くのデータを多くの人に提示する場合に、インタラクティブな形で使用するとよいでしょう。 読者が視覚化を掘り下げ、自分自身の発見を形成できるようにするために、インタラクティブ性は不可欠です。 しかし、正確な判断が必要な場合や、静的な表現が必要な場合は、従来のビジュアライゼーションにこだわり、データを集約し、表現したいポイントを最もよく引き出せるようにするのがよいでしょう。
Visualization tools
最も一般的なチャートタイプ (line と bar) の組み合わせとして、面積プロットは可視化ツール全体でかなり共通のチャートオプションにもなっています。 面積グラフがチャートタイプとして存在する場合、通常の実装は積み重ねられた面積グラフとしてです。 重ね合わせ面積図は、通常、可視化ツールの内蔵オプションではないので、ライン・チャートをベースにしてカスタム作成する必要があります。 一部のツール(多くの場合、プログラム)では、いずれかのタイプの面積グラフの作成は基本的なグラフ タイプのオプションではなく、陰影領域と線から面積グラフを作成するには、データに対して何らかの追加作業を行う必要があります。 必須チャート タイプ、データ視覚化のタイプの選択方法、またはチャート カテゴリの全記事コレクションを参照して、さらに学んでください。