Hvad er et områdediagram?

Et områdediagram kombinerer linjediagram og søjlediagram for at vise, hvordan en eller flere gruppers numeriske værdier ændrer sig i takt med udviklingen af en anden variabel, typisk en tid. Et områdediagram adskiller sig fra et linjediagram ved at tilføje en skygge mellem linjerne og en basislinje, ligesom i et søjlediagram.

Dette områdediagram viser antallet af aktive brugere for en fiktiv webbaseret virksomhed, beregnet pr. måned. Værdierne for hver måned kan ikke blot måles ud fra den lodrette position af toppen af formen, men også ud fra den farvede højde mellem grundlinjen og toppen. I dette diagram kan vi se, at antallet af aktive brugere er omtrent fordoblet fra november 2019 til februar 2020, og at hastigheden af brugertilvæksten er steget over tid.

Hvornår du bør bruge et områdediagram

Mens eksemplet ovenfor kun tegner en enkelt linje med skraveret område, bruges et områdediagram typisk med flere linjer til at foretage en sammenligning mellem grupper (aka serier) eller til at vise, hvordan en helhed er opdelt i bestanddele. Dette fører til to forskellige typer af områdediagrammer, et til hvert anvendelsestilfælde.

Overlappende områdediagram

I det tilfælde, hvor vi ønsker at sammenligne værdierne mellem grupper, ender vi med et overlappende områdediagram. I et overlappende områdediagram starter vi med et standardlinjediagram. For hver gruppe plottes et punkt ved hver vandret værdi med en højde, der angiver gruppens værdi på variablen på den lodrette akse; en linje forbinder alle gruppens punkter fra venstre til højre. Arealdiagrammet tilføjer skravering mellem hver linje til en nulbasislinje. Da gruppernes skygger normalt vil overlappe hinanden i et vist omfang, er der en vis gennemsigtighed i skyggerne, således at alle gruppernes linjer let kan ses. Skraveringen er med til at fremhæve, hvilken gruppe der har den største værdi baseret på, hvilken gruppes rene farve der er synlig.

Vær opmærksom på, at den ene serie ikke altid er højere end den anden, da plottet ellers kan blive forvekslet med den anden type områdediagram: det stablede områdediagram. I de tilfælde vil det være et bedre valg blot at holde sig til standardlinjediagrammet.

Stablet områdediagram

Sædvanligvis er det stablede områdediagram det, der faktisk menes, når udtrykket “områdediagram” bruges. I det overlappende områdediagram blev hver linje skraveret fra sin lodrette værdi til en fælles basislinje. I det stablede områdediagram er linjerne plottet én ad gangen, idet højden af den senest plottede gruppe tjener som en bevægelig basislinje. Som sådan vil den fuldt stablede højde af den øverste linje svare til totalen, når der summeres på tværs af alle grupper.

Du vil bruge et stablet områdediagram, når du ikke kun ønsker at følge den samlede værdi, men også ønsker at forstå fordelingen af den samlede værdi på grupper. Ved at sammenligne højderne på hvert segment af kurven kan man få en generel idé om, hvordan de enkelte undergrupper sammenligner sig med hinanden i deres bidrag til den samlede sum.

De fleste af de aktive brugere kommer fra basiskonti, men premium-brugere synes at vokse forholdsmæssigt hurtigere.

Eksempel på datastruktur

Måned Trials Basic Premium
2019-11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

Data, der skal afbildes med et områdediagram, er typisk aggregeret i en tabel med to eller flere kolonner. Den første kolonne angiver de positioner på den vandrette akse, hvor hver linje vil blive plottet. Hver efterfølgende kolonne angiver det lodrette bidrag for hvert punkt, en kolonne pr. serie, der skal plottes. Dette format gælder både for det overlappende og det stablede områdediagram, idet den væsentligste forskel mellem diagrammerne er den måde, hvorpå værdierne fortolkes med henblik på rendering.

For stablede områdediagrammer kræver nogle visualiseringsværktøjer, at kolonnerne ikke angiver de individuelle bidrag, men i stedet de kumulative bidrag. I dette tilfælde angiver kolonnerne linjehøjderne direkte, og bidragene for hver gruppe er impliceret af forskellen i værdierne mellem kolonnerne.

Måned Trials + Basic + Premium
2019-11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Bedste praksis for brug af et områdediagram

Inkluder en nulbasislinje

Selv om et linjediagram ikke er begrænset til at kræve en nulbasislinje, betyder tilføjelsen af skravering, at højderne af de farvede områder vil blive brugt til at sammenligne størrelsen af hver gruppes værdier. Ligesom i et søjlediagram er det således obligatorisk, at der skal være en nulbasislinje, som skraveringen skal foretages i forhold til. Hvis aksen skæres af, vil det resultere i, at det faktiske forhold i gruppernes værdier ikke stemmer overens med det, der antydes af det genererede plot.

En undtagelse fra denne regel kan opstå, når vi sammenligner to serier i et overlappende områdediagram med en ændring af skraveringsreglen. Hvis vi begrænser skraveringen til at være mellem linjerne i stedet for fra begge linjer til en fælles basislinje, kan vi zoome grænserne på den lodrette akse ind på den interessante effekt uden en basislinje. Skravering får nu en anden betydning, hvor farven angiver, hvilken gruppe der har en større værdi, og hvor mængden af farve angiver størrelsen af forskellen.

Begrænset antal serier i et overlappende områdediagram

Desto flere serier vi har i et overlappende områdediagram, desto flere farvekombinationer vil der være, når de overlapper hinanden. Det faktum, at de fleste farver ikke vil være forbundet med en enkelt gruppe, kan give nogle vanskeligheder med fortolkningen. Selv med kun tre serier kan det nogle gange være for meget at holde styr på: tre individuelle farver, tre parvise overlapninger og en farve for alle tre grupper, der overlapper hinanden, giver i alt syv farver i alt.

Det er normalt sikkert at sammenligne to serier, men hvis den ene serie altid er større end den anden, kan plottet let forveksles med et stablet arealplot i stedet. Læserne kan også blive forvirret ved at fortolke de overlappende farver, som ikke vil være til stede i den generelle legende. Som en generel tommelfingerregel gælder det, at hvis du overvejer at bruge et overlappende fladediagram, så begræns dig til to serier og tænk over, om brugen af et linjediagram vil vise sammenligningen mellem grupperne tydeligere.

Tænk på rækkefølgen af linjer i et stablet fladediagram

Mens den samlede form af plottet vil være den samme, uanset i hvilken rækkefølge gruppernes linjer er plottet, kan læsningen af visualiseringen understøttes gennem et godt valg af rækkefølgen af linjerne. En god tommelfingerregel er at placere de største eller mest stabile grupper nederst, med de mest variable eller mindste grupper sidst og øverst. Som det vil blive nævnt i det følgende afsnit, kræver det arbejde at aflæse værdier for enhver individuel gruppe undtagen den nederste, så det er en god idé at gøre denne gruppe til den vigtigste.

Fælles misbrug

Anvendelse af et områdediagram til at plotte en enkelt serie

Som nævnt nær starten af artiklen er det typiske anvendelsestilfælde for områdediagrammet at foretage en sammenligning eller vise en opdeling af mængder mellem to eller flere serier. Når vi blot har en enkelt serie af værdier at plotte, er det ofte det forkerte valg at bruge et områdediagram. Det er bedre at vælge blot et søjlediagram eller et linjediagram, afhængigt af hvad du ønsker at lære eller kommunikere om dataene.

Hvis vi ønsker at forstå udviklingen af nøjagtige værdier over tid, og vi ikke har for mange værdier at plotte på tværs af den vandrette akse, så er et søjlediagram et godt valg. Ellers er et linjediagram et bedre valg. Linjer har et mere effektivt data-til-farve-forhold og et renere udseende med mange værdier at plotte sammenlignet med søjler. Når vi har mange værdier, er vi desuden sandsynligvis mere interesseret i retning og hældning af tendenser end i nøjagtige værdier, hvilket er et tilfælde, hvor linjediagrammer klarer sig bedre.

Intolkning af værdier på individuelle grupper i et stablet områdediagram

I et stablet områdediagram er det kun rigtig nemt at måle nøjagtige værdier i to tilfælde: for den samlede total og for den nederste gruppe. For mellemliggende grupper kræver det at finde den nøjagtige værdi af en gruppes bidrag, at man finder højden af den pågældende gruppes linje og trækker højden af linjen under den fra.

Opgaven bliver endnu værre, når vi ønsker at følge ændringer over tid. Som tidligere er dette let for den samlede og nederste gruppe. Mellemliggende grupper er imidlertid hæmmet af en skiftende basislinje, hvilket gør det vanskeligt at opfatte nøjagtige vertikale forskelle. Nedenstående eksempel, der er tilpasset fra dette blogindlæg, gør dette klart. Mens den centrale gule gruppes størrelse ser ud til at ændre sig over tid, er højderne på hvert punkt faktisk konsistente.

Hvis du ønsker at kende de nøjagtige gruppeværdier og deres ændringer over tid, vil det være en bedre mulighed at vælge et standardlinjediagram, som det fremgår af denne artikel i Everyday Analytics.

Fælles muligheder for områdediagrammer

Procentdel stablet områdediagram

En almindelig mulighed for områdediagrammer er det stablede områdediagram med procentdel eller relativ frekvens. I stedet for at stable de absolutte værdier for hver gruppe på hvert lodret skive, stabler vi det relative eller procentvise bidrag fra hver gruppe til den samlede mængde, således at den samlede højde altid er 100 %. Denne diagramtype mister oplysninger om tendensen i de absolutte totaler (og har derfor brug for sit eget linjediagram), men hjælper med at fremhæve sammenligningen af de relative bidrag mellem grupperne. Som en bonus får denne diagramtype en anden basislinje på tværs af toppen af diagrammet, hvorpå en individuel gruppes bidrag kan måles.

Linjediagram

Linjediagrammet er den vigtigste stamfader for områdetegistreringstypen. Hvis du ikke er sikker på, om et områdediagram er det, du er interesseret i, er det usandsynligt, at brugen af et linjediagram vil styre dig forkert. Dette gælder især for det overlappende områdediagram, hvor overlappende områder hurtigt kan komme ud af kontrol. Som en anden overvejelse er det altid muligt blot at generere flere plot, hvis du er interesseret i at foretage flere sammenligninger i dine data i stedet for blot at føle behov for at vælge blot en enkelt diagramtype for at bære så meget som muligt.

Søjlediagram og stablet søjlediagram

Den anden stamfader for områdediagrammet er søjlediagrammet. Mere præcist er den nærmeste forbindelse dog mellem det stablede områdediagram og det stablede søjlediagram; der er ikke rigtig nogen god analogi mellem det overlappende områdediagram og noget søjlediagram.

Det stablede søjlediagram minder meget om det stablede områdediagram, blot med søjler i stedet for linjer. Derfor gælder mange af begrænsningerne for det stablede områdediagram også for det stablede søjlediagram. En fordel ved stablede søjlediagrammer er dog, at det er meget lettere at foretage en konsekvent vurdering af værdien inden for hver bin på den vandrette akse. De skraverede områder i et områdediagram kan blive forvrænget, som det ses ovenfor, især når en linje ændrer retning. Da hvert område er rektangulært i et stablet søjlediagram, undgås denne form for forvrængning.

Ridgelineplot

Et yderligere alternativ til det overlappende områdediagram er ridgelineplottet. I stedet for at plotte alle linjer og farvede områder på den samme akse, placerer ridgeline-plottet hver linje på en anden akse, hver med en delvis vertikal forskydning fra de andre. På grund af linjernes forskydning udelades de lodrette markeringer normalt i et ridgeline-plot. Det betyder, at ridgeline-plots er mest anvendelige, når der er et klart mønster i de enkelte seriers værdier alene ud fra deres former.

Streamgraf

En fantasifuld slægtning til områdediagrammet er streamgrafen. I et stablet områdediagram er alle linjerne stablet oven på hinanden over en lige basislinje i bunden af stakken. I et strømdiagram er basislinjen sat gennem midten af diagrammet, og områderne er symmetrisk samlet omkring den centrale linje. På grund af dette er det vanskeligt at vurdere præcise værdier for hver enkelt gruppe eller endog den samlede sum.

Som Andy Kirk argumenterer for, anvendes streamgrafer bedst i en interaktiv form, når der skal præsenteres mange data for et bredt publikum. Interaktivitet er afgørende for at give læserne mulighed for at grave i visualiseringen og danne sig deres egne konklusioner. Men når der skal foretages præcise vurderinger, eller når der skal laves en statisk præsentation, er det bedre at holde sig til en mere konventionel visualisering, hvor dataene aggregeres på en måde, der bedst muligt fremhæver de punkter, man ønsker at præsentere.

Dette plot bruger de samme data som ridgelineplottet ovenfor.

Visualiseringsværktøjer

Som en kombination af to af de mest almindelige diagramtyper (linje og søjle) er arealplottet også en ret almindelig diagrammulighed på tværs af visualiseringsværktøjer. Hvor områdediagrammet er til stede som en diagramtype, er den sædvanlige implementering som et stablet områdediagram. Overlappende områdediagrammer er normalt ikke en indbygget mulighed for visualiseringsværktøjer, og skal oprettes efter eget ønske med udgangspunkt i et linjediagram. For nogle værktøjer, ofte programmatiske, er oprettelsen af en af de to typer områdediagrammer ikke en grundlæggende mulighed for diagramtypen, og der skal udføres noget yderligere arbejde på dataene for at oprette et områdediagram fra skraverede områder og linjer.

Områdediagrammet er en af mange forskellige diagramtyper, der kan bruges til visualisering af data. Få mere at vide i vores artikler om vigtige diagramtyper, hvordan du vælger en type datavisualisering, eller ved at gennemse hele artikelsamlingen i kategorien diagrammer.

admin

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

lg