Co to jest wykres obszarowy?

Wykres obszarowy łączy w sobie wykres liniowy i słupkowy, aby pokazać, jak wartości liczbowe jednej lub więcej grup zmieniają się w miarę postępu drugiej zmiennej, zazwyczaj czasowej. Wykres obszarowy różni się od wykresu liniowego dodaniem cieniowania między liniami i linią bazową, jak w wykresie słupkowym.

Ten wykres obszarowy pokazuje liczbę aktywnych użytkowników dla fikcyjnej firmy internetowej, obliczoną według miesięcy. Wartości dla każdego miesiąca mogą być mierzone nie tylko na podstawie pionowej pozycji wierzchołka kształtu, ale także kolorowej wysokości pomiędzy linią bazową a wierzchołkiem. Na tym wykresie widzimy, że liczba aktywnych użytkowników wzrosła około dwukrotnie od listopada 2019 r. do lutego 2020 r., a tempo przyrostu użytkowników wzrosło w czasie.

Kiedy powinieneś użyć wykresu obszaru

Podczas gdy powyższy przykład wykreśla tylko pojedynczą linię z zacienionym obszarem, wykres obszaru jest zwykle używany z wieloma liniami, aby dokonać porównania między grupami (aka seriami) lub pokazać, jak całość jest podzielona na części składowe. Prowadzi to do dwóch różnych typów wykresów obszarowych, po jednym dla każdego przypadku użycia.

Wykres obszarowy nakładający się

W przypadku, gdy chcemy porównać wartości między grupami, otrzymujemy wykres obszarowy nakładający się. W przypadku wykresu nakładania się obszarów, zaczynamy od standardowego wykresu liniowego. Dla każdej grupy, jeden punkt jest wykreślany przy każdej wartości poziomej z wysokością wskazującą wartość grupy na zmiennej osi pionowej; linia łączy wszystkie punkty grupy od lewej do prawej. Wykres obszarowy dodaje cieniowanie pomiędzy każdą linią do zerowej linii bazowej. Ponieważ cieniowanie dla grup zazwyczaj w pewnym stopniu nakłada się na siebie, w cieniowaniu uwzględnia się pewną przezroczystość, tak aby linie wszystkich grup były dobrze widoczne. Cieniowanie pomaga podkreślić, która grupa ma największą wartość na podstawie tego, który czysty kolor grupy jest widoczny.

Uważaj, że jedna seria nie jest zawsze wyższa od drugiej, bo inaczej wykres może zostać pomylony z innym typem wykresu obszarowego: wykresem obszarowym ułożonym w stos. W takich przypadkach lepszym wyborem będzie trzymanie się standardowego wykresu liniowego.

Wykres obszarowy

Generalnie, kiedy używa się terminu „wykres obszarowy”, tym, co jest w rzeczywistości implikowane, jest wykres obszarowy spiętrzony. W nakładającym się wykresie obszarowym, każda linia była cieniowana od jej pionowej wartości do wspólnej linii bazowej. W stosowym wykresie powierzchni linie są wykreślane pojedynczo, przy czym wysokość ostatnio wykreślonej grupy służy jako ruchoma linia bazowa. W związku z tym, w pełni spiętrzona wysokość najwyższej linii będzie odpowiadała sumie podczas sumowania wszystkich grup.

Użyjesz wykresu spiętrzonego, gdy chcesz śledzić nie tylko wartość całkowitą, ale także chcesz zrozumieć podział tej sumy na grupy. Porównanie wysokości każdego segmentu krzywej pozwala nam uzyskać ogólne pojęcie o tym, jak każda podgrupa porównuje się do innych w ich wkładzie do całości.

Większość aktywnych użytkowników pochodzi z kont podstawowych, ale użytkownicy premium wydają się rosnąć proporcjonalnie szybciej.

Przykład struktury danych

Month Trials Basic Premium
2019-.11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

Dane, które mają być przedstawione za pomocą wykresu powierzchniowego, są zazwyczaj agregowane w tabeli zawierającej dwie lub więcej kolumn. Pierwsza kolumna wskazuje pozycje na osi poziomej, gdzie każdy wiersz zostanie wykreślony. Każda następna kolumna wskazuje wkład pionowy dla każdego punktu, po jednej kolumnie dla każdej serii, która ma być wykreślona. Format ten ma zastosowanie zarówno do wykresów nakładających się, jak i do wykresów spiętrzonych, a główna różnica między nimi polega na sposobie interpretacji wartości przy renderowaniu.

W przypadku wykresów spiętrzonych niektóre narzędzia wizualizacyjne wymagają, aby kolumny nie zawierały indywidualnych wkładów, lecz wkłady skumulowane. W tym przypadku kolumny określają wysokość linii bezpośrednio, a wkład każdej grupy jest implikowany przez różnicę w wartościach między kolumnami.

Miesiąc Trials + Basic + Premium
2019-.11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Najlepsze praktyki korzystania z wykresu obszarowego

Włącz linię bazową z zerem

Pomimo że wykres liniowy nie jest ograniczony do wymagania linii bazowej z zerem, dodanie cieniowania oznacza, że wysokości kolorowych regionów będą używane do porównywania wielkości wartości każdej grupy. Tak więc, podobnie jak w przypadku wykresu słupkowego, obowiązkowo musi istnieć linia bazowa zero, względem której należy wykonać cieniowanie. Obcięcie osi spowodowałoby, że rzeczywisty stosunek wartości grup nie zgadzałby się z tym, co wynika z wygenerowanego wykresu.

Odstępstwem od tej reguły może być sytuacja, w której porównujemy dwie serie w nakładającym się wykresie obszarowym ze zmianą reguły cieniowania. Jeśli ograniczymy cieniowanie do obszaru pomiędzy liniami, a nie od obu linii do wspólnej linii bazowej, wówczas możemy powiększyć granice osi pionowej do interesującego nas efektu bez linii bazowej. Cieniowanie nabiera teraz innego znaczenia, kolor wskazuje, która grupa ma większą wartość, a ilość koloru wielkość różnicy.

Limit liczby serii w nakładającym się wykresie obszarowym

Im więcej serii mamy w nakładającym się wykresie obszarowym, tym więcej będzie kombinacji kolorów, gdy będą się one nakładać. Fakt, że większość kolorów nie będzie kojarzona z jedną grupą może powodować pewne trudności w interpretacji. Nawet z tylko trzema seriami, może to być czasami zbyt wiele do śledzenia: trzy indywidualne kolory, trzy parami nakładające się, i jeden kolor dla wszystkich trzech grup nakładających się daje w sumie siedem kolorów.

Porównanie dwóch serii jest zazwyczaj bezpieczne, chociaż jeśli jedna seria jest zawsze większa niż druga, wykres może być łatwo pomylony z wykresem obszarowym. Czytelnicy mogą być również zdezorientowani przez interpretację nakładających się kolorów, które nie będą obecne w ogólnej legendzie. Jako ogólną zasadę, jeśli myślisz o użyciu nakładającego się wykresu obszarowego, ogranicz się do dwóch serii i zastanów się, czy użycie wykresu liniowego nie pokaże wyraźniej porównania między grupami.

Zastanów się nad kolejnością linii w spiętrzonym wykresie obszarowym

Podczas gdy całkowity kształt wykresu będzie taki sam bez względu na kolejność, w jakiej linie grup są wykreślone, czytanie wizualizacji może być wspomagane przez dobry wybór kolejności linii. Dobrą zasadą jest umieszczenie największych lub najbardziej stabilnych grup na dole, z najbardziej zmiennymi lub najmniejszymi grupami na końcu i na górze. Jak zostanie wspomniane w następnej sekcji, odczytanie wartości dla każdej grupy z osobna, z wyjątkiem najniższej, wymaga pracy, więc dobrze jest uczynić ją najważniejszą.

Wspólne niewłaściwe zastosowania

Używanie wykresu obszarowego do wykreślania pojedynczej serii

Jak zauważono na początku artykułu, typowym przypadkiem użycia wykresu obszarowego jest dokonanie porównania lub pokazanie podziału wielkości pomiędzy dwiema lub więcej seriami. Kiedy mamy tylko jedną serię wartości do wykreślenia, użycie wykresu obszarowego jest często złym wyborem. Lepszym rozwiązaniem jest wybranie wykresu słupkowego lub liniowego, w zależności od tego, czego chcemy się dowiedzieć lub przekazać o danych.

Jeśli chcemy zrozumieć progresję dokładnych wartości w czasie i nie mamy zbyt wielu wartości do wykreślenia na osi poziomej, wtedy wykres słupkowy jest dobrym wyborem. W przeciwnym razie, wykres liniowy jest lepszym wyborem. Linie mają bardziej efektywny stosunek danych do tuszu i czystszy wygląd przy dużej ilości wartości do wykreślenia w porównaniu do słupków. Ponadto, gdy mamy wiele wartości, prawdopodobnie będziemy bardziej zainteresowani kierunkiem i nachyleniem trendów niż dokładnymi wartościami, co jest przypadkiem, w którym wykresy liniowe sprawdzają się lepiej.

Interpretacja wartości dla poszczególnych grup na wykresie powierzchniowym

Na wykresie powierzchniowym, określenie dokładnych wartości jest naprawdę łatwe tylko w dwóch przypadkach: dla całkowitej sumy i dla najniższej grupy. Dla grup pośrednich, uzyskanie dokładnej wartości wkładu grupy wymaga znalezienia wysokości linii tej grupy i odjęcia wysokości linii poniżej niej.

Zadanie staje się jeszcze gorsze, gdy chcemy śledzić zmiany w czasie. Tak jak poprzednio, jest to łatwe dla grupy całkowitej i grupy najniższej. Jednak grupy pośrednie są utrudnione przez zmieniającą się linię bazową, co sprawia, że trudno jest dostrzec dokładne różnice w pionie. Poniższy przykład zaadaptowany z tego wpisu na blogu pokazuje to wyraźnie. Podczas gdy wielkość środkowej grupy żółtej wydaje się zmieniać w czasie, w rzeczywistości wysokości w każdym punkcie są spójne.

Jeśli chcesz poznać dokładne wartości grup i ich zmiany w czasie, wówczas wybór standardowego wykresu liniowego będzie lepszą opcją, jak pokazano w tym artykule Everyday Analytics.

Wspólne opcje wykresów obszarowych

Wykres procentowy

Wspólną opcją dla wykresów obszarowych jest procentowy lub względny wykres częstotliwości. Zamiast układać w stos wartości bezwzględne każdej grupy w każdym pionowym wycinku, układamy w stos względny lub procentowy udział każdej grupy w całości, tak aby całkowita wysokość wynosiła zawsze 100%. Ten typ wykresu traci informacje o tendencji bezwzględnych sum (i dlatego będzie potrzebował własnego wykresu liniowego), ale pomaga wydobyć porównanie względnych wkładów między grupami. Jako bonus, ten typ wykresu zyskuje drugą linię bazową w górnej części wykresu, na której można ocenić wkład poszczególnych grup.

Wykres liniowy

Wykres liniowy jest głównym źródłem wykresu obszarowego. Jeśli nie jesteś pewien, czy wykres obszarowy jest tym, co Cię interesuje, użycie wykresu liniowego raczej nie doprowadzi Cię do błędu. Jest to szczególnie prawdziwe w przypadku nakładających się wykresów obszarowych, gdzie nakładające się regiony mogą szybko wymknąć się spod kontroli. Innym aspektem jest możliwość wygenerowania większej liczby wykresów, jeśli chcemy dokonać wielu porównań w danych, a nie czuć potrzebę wybrania tylko jednego typu wykresu, aby przenieść jak najwięcej. Dokładniej jednak, najbliższe powiązanie jest między wykresem obszarowym i słupkowym; nie ma tak naprawdę dobrej analogii między nakładającym się wykresem obszarowym i jakimkolwiek wykresem słupkowym.

Wykres słupkowy jest bardzo podobny do wykresu obszarowego, tylko z słupkami zamiast linii. Tak więc, wiele ograniczeń wykresu obszarowego ma zastosowanie również do wykresu słupkowego. Jednak jedną z zalet stosu barów jest to, że jest o wiele łatwiejsze do wykonania spójnego wyroku wartości w ramach każdego bin osi poziomej. Zacieniowane regiony na wykresie obszarowym mogą zostać zniekształcone, jak widać powyżej, zwłaszcza gdy linia zmienia kierunek. Ponieważ każdy region jest prostokątny w wykresie słupkowym, ten rodzaj zniekształcenia jest unikany.

Kartka linii papilarnych

Jedną z dodatkowych alternatyw dla nakładającego się wykresu obszarowego jest kartka linii papilarnych. Zamiast wykreślać wszystkie linie i kolorowe regiony na tej samej osi, wykres grzbietowy umieszcza każdą linię na innej osi, każdą z częściowym przesunięciem pionowym względem pozostałych. Ze względu na przesuniętą naturę linii, oznaczenia pionowe są zwykle pomijane w wykresie linii grzbietowej. Oznacza to, że wykresy grzbietowe są najbardziej użyteczne, gdy istnieje wyraźny wzór w wartościach poszczególnych serii oparty wyłącznie na ich kształtach.

Wykres strumieniowy

Fantazyjnym krewnym wykresu obszarowego jest wykres strumieniowy. W stosowym wykresie obszarowym wszystkie linie są ułożone jedna na drugiej nad prostą linią bazową na dole stosu. Z wykresem strumienia, linia bazowa jest ustawiona przez środek wykresu, a obszary symetrycznie zebrane wokół linii centralnej. Z tego powodu trudno jest określić dokładne wartości dla każdej grupy lub nawet całości.

Jak argumentuje Andy Kirk, wykresy strumieniowe są najlepiej używane w formie interaktywnej, gdy wiele danych ma być przedstawionych szerokiej publiczności. Interaktywność jest niezbędna, aby umożliwić czytelnikom zagłębienie się w wizualizację i sformułowanie własnych wniosków. Jednakże, gdy trzeba dokonać dokładnych osądów lub stworzyć statyczną prezentację, lepiej trzymać się bardziej konwencjonalnej wizualizacji, agregując dane w sposób, który najlepiej uwypukli punkty, które chcesz przedstawić.

Ta działka wykorzystuje te same dane, co powyższa działka ridgeline.

Narzędzia wizualizacji

Jako połączenie dwóch najbardziej powszechnych typów wykresów (liniowego i słupkowego), wykres obszarowy jest również dość powszechną opcją wykresu w narzędziach wizualizacji. Tam, gdzie wykres obszarowy jest obecny jako typ wykresu, zwykle implementuje się go jako wykres obszarowy ułożony w stos. Nakładające się wykresy obszarowe zazwyczaj nie są wbudowaną opcją narzędzi wizualizacyjnych i będą musiały być tworzone na zamówienie, zaczynając od wykresu liniowego. W przypadku niektórych narzędzi, często programowych, tworzenie obu typów wykresów obszarowych nie jest podstawową opcją typu wykresu, a niektóre dodatkowe prace będą musiały być wykonane na danych, aby utworzyć wykres obszarowy z zacienionych obszarów i linii.

Wykres obszarowy jest jednym z wielu różnych typów wykresów, które mogą być używane do wizualizacji danych. Dowiedz się więcej z naszych artykułów na temat podstawowych typów wykresów, jak wybrać typ wizualizacji danych lub przeglądając pełną kolekcję artykułów w kategorii wykresy.

admin

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

lg