- Vad är ett områdesdiagram?
- När du ska använda ett områdesdiagram
- Överlappande områdesdiagram
- Staplat områdesdiagram
- Exempel på datastruktur
- Bästa metoder för att använda ett områdesdiagram
- Inkludera en nollbaslinje
- Begränsat antal serier i ett överlappande områdesdiagram
- Tänk på linjernas ordning i ett staplat områdesdiagram
- Högre missbruk
- Användning av ett områdesdiagram för att plotta en enskild serie
- Tolkning av värden på enskilda grupper i ett staplat områdesdiagram
- Gemensamma alternativ för områdesdiagram
- Percentuellt staplat områdesdiagram
- Linjediagram
- Stapeldiagram och staplade stapeldiagram
- Ridgeline plot
- Strömdiagram
- Visualiseringsverktyg
Vad är ett områdesdiagram?
Ett områdesdiagram kombinerar linjediagram och stapeldiagram för att visa hur en eller flera gruppers numeriska värden förändras med en andra variabel, vanligen en tidsvariabel. Ett områdesdiagram skiljer sig från ett linjediagram genom tillägget av skuggning mellan linjerna och en baslinje, som i ett stapeldiagram.
Detta områdesdiagram visar antalet aktiva användare för ett fiktivt webbaserat företag, beräknat per månad. Värden för varje månad kan mätas inte bara från den vertikala positionen av formens topp, utan även den färgade höjden mellan baslinjen och toppen. I det här diagrammet kan vi se att antalet aktiva användare har ungefär fördubblats från november 2019 till februari 2020, och att takten i ökningen av antalet användare har ökat med tiden.
När du ska använda ett områdesdiagram
Samtidigt som exemplet ovan bara ritar en enda linje med skuggat område, används ett områdesdiagram vanligtvis med flera linjer för att göra en jämförelse mellan grupper (även kallade serier) eller för att visa hur en helhet är uppdelad i beståndsdelar. Detta leder till två olika typer av områdesdiagram, ett för varje användningsfall.
Överlappande områdesdiagram
I det fall vi vill jämföra värdena mellan grupper får vi ett överlappande områdesdiagram. I ett överlappande områdesdiagram börjar vi med ett standardlinjediagram. För varje grupp plottas en punkt vid varje horisontellt värde med höjd som anger gruppens värde på variabeln på den vertikala axeln; en linje förbinder alla gruppens punkter från vänster till höger. Områdesdiagrammet lägger till skuggning mellan varje linje till en nollbaslinje. Eftersom skuggningen för grupperna vanligtvis kommer att överlappa varandra i viss utsträckning, ingår en viss transparens i skuggningen så att alla gruppers linjer lätt kan ses. Skuggningen hjälper till att betona vilken grupp som har det största värdet baserat på vilken grupps rena färg som är synlig.
Var försiktig så att den ena serien inte alltid är högre än den andra, annars kan diagrammet förväxlas med den andra typen av områdesdiagram: det staplade områdesdiagrammet. I dessa fall är det bättre att bara hålla sig till det vanliga linjediagrammet.
Staplat områdesdiagram
I allmänhet, när termen ”områdesdiagram” används, är det som egentligen åsyftas det staplade områdesdiagrammet. I det överlappande områdesdiagrammet skuggades varje linje från sitt vertikala värde till en gemensam baslinje. I det staplade områdesdiagrammet plottas linjerna en i taget, med höjden för den senast plottade gruppen som rörlig baslinje. Den översta linjens höjd, som är fullt staplad, kommer att motsvara totalen när man summerar över alla grupper.
Du kommer att använda ett staplat områdesdiagram när du inte bara vill spåra det totala värdet, utan också vill förstå fördelningen av den totala summan på olika grupper. Genom att jämföra höjderna för varje segment av kurvan kan vi få en allmän uppfattning om hur varje undergrupp förhåller sig till den andra när det gäller deras bidrag till totalsumman.
Exempel på datastruktur
Månad | Trials | Basic | Premium |
---|---|---|---|
2019-11 | 154 | 1180 | 201 |
2019-12 | 157 | 1186 | 219 |
2020-01 | 170 | 1195 | 270 |
2020-02 | 180 | 1213 | 285 |
… | … | … | … |
Data som ska avbildas med ett områdesdiagram aggregeras vanligen i en tabell med två eller flera kolumner. Den första kolumnen anger de positioner på den horisontella axeln där varje linje ska plottas. Varje kolumn som följer anger det vertikala bidraget för varje punkt, en kolumn per serie som ska plottas. Detta format gäller både för överlappande och staplade områdesdiagram, med den huvudsakliga skillnaden mellan diagrammen i hur värdena tolkas för rendering.
För staplade områdesdiagram kräver vissa visualiseringsverktyg att kolumnerna inte listar de individuella bidragen, utan istället de kumulativa bidragen. I det här fallet anger kolumnerna linjehöjderna direkt, och bidragen för varje grupp impliceras av skillnaden i värden mellan kolumnerna.
Månad | Trials | + Basic | + Premium |
---|---|---|---|
2019-11 | 154 | 1334 | 1535 |
2019-12 | 157 | 1343 | 1562 |
2020-01 | 170 | 1365 | 1635 |
2020-02 | 180 | 1393 | 1678 |
… | … | … | … |
Bästa metoder för att använda ett områdesdiagram
Inkludera en nollbaslinje
Ett linjediagram är visserligen inte begränsat till att kräva en nollbaslinje, men tillägget av skuggning innebär att höjderna på de färgade områdena kommer att användas för att jämföra storleken på varje grupps värden. I likhet med ett stapeldiagram är det alltså obligatoriskt att det finns en nollbaslinje mot vilken skuggningen ska utföras. Att skära av axeln skulle resultera i att det faktiska förhållandet i gruppernas värden inte stämmer överens med vad som antyds av den genererade grafen.
Ett undantag från denna regel kan uppstå när vi jämför två serier i ett överlappande områdesdiagram med en ändring av skuggningsregeln. Om vi begränsar skuggningen till att vara mellan linjerna, snarare än från båda linjerna till en gemensam baslinje, kan vi zooma in gränserna för den vertikala axeln till den intressanta effekten utan baslinje. Skuggning får nu en annan innebörd, där färgen anger vilken grupp som har ett större värde, och mängden färg anger storleken på skillnaden.
Begränsat antal serier i ett överlappande områdesdiagram
Desto fler serier vi har i ett överlappande områdesdiagram, desto fler färgkombinationer kommer det att bli när de överlappar varandra. Det faktum att de flesta färger inte kommer att förknippas med en enda grupp kan orsaka vissa tolkningssvårigheter. Även med bara tre serier kan detta ibland bli för mycket att hålla reda på: tre individuella färger, tre parvisa överlappningar och en färg för alla tre grupper som överlappar varandra ger totalt sju färger.
Vid jämförelse av två serier är det vanligtvis säkert, men om den ena serien alltid är större än den andra kan diagrammet lätt förväxlas med ett staplat area diagram i stället. Läsarna kan också bli förvirrade av att tolka de överlappande färgerna, som inte kommer att finnas med i den allmänna legenden. En allmän tumregel är att om du funderar på att använda ett överlappande områdesdiagram, begränsa dig till två serier och fundera på om användningen av ett linjediagram kommer att visa jämförelsen mellan grupperna tydligare.
Tänk på linjernas ordning i ett staplat områdesdiagram
Men även om den totala formen på diagrammet kommer att vara densamma oavsett i vilken ordning gruppernas linjer plottas, kan läsningen av visualiseringen stödjas genom ett bra val av linjernas ordning. En bra tumregel är att placera de största eller mest stabila grupperna längst ner och de mest variabla eller minsta grupperna sist och högst upp. Som det kommer att nämnas i följande avsnitt kräver det arbete att läsa värden för varje enskild grupp utom den nedersta, så det är en bra idé att göra den till den viktigaste.
Högre missbruk
Användning av ett områdesdiagram för att plotta en enskild serie
Som nämnts i början av artikeln är det typiska användningsfallet för områdesdiagrammet att göra en jämförelse eller att visa en fördelning av kvantiteter mellan två eller flera serier. När vi bara har en enda värdeserie att plotta är det ofta fel val att använda ett områdesdiagram. Det bättre alternativet är att bara välja ett stapeldiagram eller linjediagram, beroende på vad du vill lära dig eller kommunicera om data.
Om vi vill förstå utvecklingen av exakta värden över tiden och vi inte har för många värden att plotta över den horisontella axeln, är ett stapeldiagram ett bra val. Annars är ett linjediagram ett bättre val. Linjer har ett effektivare förhållande mellan data och bläck och ett renare utseende med många värden att plotta jämfört med staplar. När vi har många värden är vi dessutom troligen mer intresserade av riktning och lutning av trender än av exakta värden, ett fall där linjediagram är bättre.
Tolkning av värden på enskilda grupper i ett staplat områdesdiagram
I ett staplat områdesdiagram är det bara riktigt lätt att mäta exakta värden i två fall: för den totala summan och för den nedersta gruppen. För mellanliggande grupper krävs det för att få fram det exakta värdet på en grupps bidrag att man hittar höjden på den gruppens linje och subtraherar höjden på linjen under den.
Uppgiften blir ännu värre när vi vill spåra förändringar över tid. Som tidigare är detta enkelt för den totala och nedersta gruppen. Mellanliggande grupper hindras dock av att baslinjen förändras, vilket gör det svårt att uppfatta exakta vertikala skillnader. Nedanstående exempel, anpassat från det här blogginlägget, tydliggör detta. Även om den centrala gula gruppens storlek tycks förändras över tiden är höjderna vid varje punkt i själva verket konsekventa.
Om du vill känna till de exakta gruppvärdena och deras förändringar över tiden är det bättre att välja ett standardlinjediagram, vilket visas i den här artikeln om Everyday Analytics.
Gemensamma alternativ för områdesdiagram
Percentuellt staplat områdesdiagram
Ett vanligt alternativ för områdesdiagram är det staplade områdesdiagrammet med procentuell, eller relativ frekvens. I stället för att stapla de absoluta värdena för varje grupp i varje vertikalt skikt staplar vi det relativa eller procentuella bidraget från varje grupp till totalen, så att den totala höjden alltid är 100 %. Denna diagramtyp förlorar information om trenden för de absoluta totalvärdena (och behöver därför ett eget linjediagram), men hjälper till att framhäva jämförelsen av de relativa bidragen mellan grupperna. Som en bonus får denna diagramtyp en andra baslinje över toppen av diagrammet som kan användas för att mäta en enskild grupps bidrag.
Linjediagram
Linjediagrammet är den huvudsakliga föregångaren till områdesdiagrammet. Om du inte är säker på om ett områdesdiagram är det du är intresserad av, är det osannolikt att använda ett linjediagram för att styra dig fel. Detta gäller särskilt för det överlappande områdesdiagrammet, där överlappande områden snabbt kan bli okontrollerbara. Som ett annat övervägande är det alltid möjligt att bara generera fler diagram om du är intresserad av att göra flera jämförelser i dina data i stället för att bara känna ett behov av att välja bara en enda diagramtyp för att få med sig så mycket som möjligt.
Stapeldiagram och staplade stapeldiagram
Den andra stamfadern till områdesdiagrammet är stapeldiagrammet. Mer exakt är dock den närmaste länken mellan det staplade områdesdiagrammet och det staplade stapeldiagrammet; det finns egentligen ingen bra analogi mellan det överlappande områdesdiagrammet och något stapeldiagram.
Det staplade stapeldiagrammet liknar det staplade områdesdiagrammet mycket, bara med staplar i stället för linjer. Därför gäller många av begränsningarna för det staplade områdesdiagrammet även för det staplade stapeldiagrammet. En fördel med staplade staplade staplar är dock att det är mycket lättare att göra en konsekvent bedömning av värdet inom varje bin på den horisontella axeln. De skuggade områdena i ett områdesdiagram kan bli förvrängda som ovan, särskilt när en linje ändrar riktning. Eftersom varje område är rektangulärt i ett staplat stapeldiagram undviks denna typ av förvrängning.
Ridgeline plot
Ett ytterligare alternativ till det överlappande områdesdiagrammet är ridgeline plot. I stället för att plotta alla linjer och färgade områden på samma axel, placeras varje linje på en annan axel, var och en med en partiell vertikal förskjutning från de andra. På grund av linjernas förskjutning utelämnas vanligtvis vertikala markeringar i en ridgeline plot. Detta innebär att ridgeline plots är mest användbara när det finns ett tydligt mönster i de enskilda seriernas värden baserat enbart på deras former.
Strömdiagram
En fantasifull släkting till områdesdiagrammet är strömdiagrammet. I ett staplat områdesdiagram är alla linjer staplade ovanpå varandra över en rak baslinje längst ner i stapeln. I ett strömningsdiagram går baslinjen genom diagrammets mitt, och områdena samlas symmetriskt runt den centrala linjen. På grund av detta är det svårt att bedöma exakta värden för varje grupp eller till och med den totala summan.
Som Andy Kirk hävdar används strömdiagram bäst i en interaktiv form när många uppgifter ska presenteras för en stor publik. Interaktivitet är viktigt för att läsarna ska kunna gräva i visualiseringen och bilda sina egna slutsatser. När exakta bedömningar måste göras eller en statisk presentation behöver göras är det dock bättre att hålla sig till en mer konventionell visualisering, där man aggregerar data på ett sätt som bäst drar fram de punkter man vill presentera.
Visualiseringsverktyg
Som en kombination av två av de vanligaste diagramtyperna (linje och stapel) är area plot också ett ganska vanligt diagramalternativ i alla visualiseringsverktyg. När områdesdiagrammet finns som diagramtyp är den vanliga implementeringen som ett staplat områdesdiagram. Överlappande områdesdiagram är vanligtvis inte ett inbyggt alternativ för visualiseringsverktyg, utan måste skapas på egen hand med utgångspunkt i ett linjediagram. För vissa verktyg, ofta programmatiska, är skapandet av någon typ av områdesdiagram inte ett grundläggande alternativ för diagramtypen, och ett visst ytterligare arbete måste utföras på data för att skapa ett områdesdiagram från skuggade områden och linjer.
Områdesdiagrammet är en av många olika diagramtyper som kan användas för att visualisera data. Lär dig mer i våra artiklar om viktiga diagramtyper, hur du väljer en typ av datavisualisering eller genom att bläddra i hela artikelsamlingen i kategorin diagram.