Wat is een gebiedsdiagram?

Een gebiedsdiagram combineert het lijndiagram en het staafdiagram om te laten zien hoe de numerieke waarden van een of meer groepen veranderen gedurende de progressie van een tweede variabele, meestal die van de tijd. Een vlakdiagram onderscheidt zich van een lijndiagram door de toevoeging van arcering tussen lijnen en een basislijn, zoals in een staafdiagram.

Dit vlakdiagram toont het aantal actieve gebruikers voor een fictief webgebaseerd bedrijf, berekend per maand. De waarden voor elke maand kunnen niet alleen worden afgemeten aan de verticale positie van de top van de vorm, maar ook aan de gekleurde hoogte tussen de basislijn en de top. In deze grafiek kunnen we zien dat het aantal actieve gebruikers ongeveer is verdubbeld van november 2019 tot februari 2020, en dat de snelheid van de toename van het aantal gebruikers in de loop van de tijd is toegenomen.

Wanneer u een gebiedsgrafiek moet gebruiken

Hoewel het bovenstaande voorbeeld slechts een enkele lijn met gearceerd gebied plot, wordt een gebiedsgrafiek meestal gebruikt met meerdere lijnen om een vergelijking te maken tussen groepen (aka reeksen) of om te laten zien hoe een geheel is verdeeld in samenstellende delen. Dit leidt tot twee verschillende soorten gebiedsdiagrammen, een voor elk gebruik.

Overlappende gebiedsdiagram

In het geval dat we de waarden tussen groepen willen vergelijken, komen we uit op een overlappende gebiedsdiagram. In een overlappend gebiedsdiagram beginnen we met een standaard lijndiagram. Voor elke groep wordt een punt uitgezet op elke horizontale waarde, waarbij de hoogte de waarde van de groep op de variabele verticale as aangeeft; een lijn verbindt alle punten van een groep van links naar rechts. De oppervlaktegrafiek voegt arcering toe tussen elke lijn tot een nulbasislijn. Omdat de arceringen van groepen elkaar meestal tot op zekere hoogte overlappen, is de arcering enigszins transparant, zodat de lijnen van alle groepen goed zichtbaar zijn. De arcering helpt te benadrukken welke groep de grootste waarde heeft op basis van welke zuivere kleur van de groep zichtbaar is.

Zorg ervoor dat de ene reeks niet altijd hoger is dan de andere, anders kan de plot worden verward met het andere type gebiedsgrafiek: de gestapelde gebiedsgrafiek. In die gevallen is het beter om het bij de standaard lijngrafiek te houden.

Gestapelde gebiedsgrafiek

Wanneer de term ‘gebiedsgrafiek’ wordt gebruikt, wordt meestal de gestapelde gebiedsgrafiek bedoeld. In de overlappende oppervlaktegrafiek werd elke lijn gearceerd vanaf zijn verticale waarde tot een gemeenschappelijke basislijn. In de gestapelde oppervlaktegrafiek worden de lijnen één voor één geplot, waarbij de hoogte van de laatst geplotte groep als bewegende basislijn dient. Als zodanig komt de volledig gestapelde hoogte van de bovenste lijn overeen met het totaal bij optelling over alle groepen.

U gebruikt een gestapeld vlakdiagram wanneer u niet alleen de totale waarde wilt bijhouden, maar ook de verdeling van dat totaal over groepen wilt begrijpen. Door de hoogte van elk segment van de curve te vergelijken, kunnen we een algemeen idee krijgen van hoe elke subgroep zich verhoudt tot de andere in hun bijdragen aan het totaal.

Het grootste deel van de actieve gebruikers is afkomstig van basisaccounts, maar premiumgebruikers lijken verhoudingsgewijs sneller te groeien.

Voorbeeld van gegevensstructuur

Maand Trials Basic Premium
2019-11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

Gegevens die met een oppervlaktegrafiek moeten worden afgebeeld, worden gewoonlijk samengevoegd in een tabel met twee of meer kolommen. De eerste kolom geeft de posities op de horizontale as aan waar elke lijn zal worden uitgezet. Elke volgende kolom geeft de verticale bijdrage voor elk punt aan, één kolom per reeks die moet worden uitgezet. Dit formaat is van toepassing op zowel de overlappende als de gestapelde gebiedsgrafiek, met als voornaamste verschil tussen de grafieken de manier waarop de waarden worden geïnterpreteerd voor rendering.

Voor gestapelde gebiedsgrafieken vereisen sommige visualisatie-instrumenten dat de kolommen niet de individuele bijdragen vermelden, maar in plaats daarvan de cumulatieve bijdragen. In dat geval worden in de kolommen de lijnhoogten direct gespecificeerd, en worden de bijdragen van elke groep geïmpliceerd door het verschil in waarden tussen de kolommen.

Maand Trials + Basic + Premium
2019-11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Beste praktijken voor het gebruik van een vlakdiagram

Inclusief een nul-basislijn

Terwijl een lijndiagram niet beperkt is tot het vereisen van een nul-basislijn, betekent de toevoeging van arcering dat de hoogten van de gekleurde gebieden zullen worden gebruikt om de grootte van de waarden van elke groep te vergelijken. Net als bij een staafdiagram is het dus verplicht een nulpunt te hebben waartegen de arcering moet worden uitgevoerd. De as afsnijden zou tot gevolg hebben dat de werkelijke verhouding in groepswaarden niet overeenstemt met wat de gegenereerde plot impliceert.

Een uitzondering op deze regel kan zich voordoen wanneer we twee reeksen in een overlappende gebiedsgrafiek vergelijken met een wijziging van de arceerregel. Als we de arcering beperken tot tussen de lijnen, in plaats van van beide lijnen tot een gemeenschappelijke basislijn, dan kunnen we de grenzen van de verticale as inzoomen op het effect van belang zonder een basislijn. De arcering krijgt nu een andere betekenis, waarbij de kleur aangeeft welke groep een grotere waarde heeft, en de hoeveelheid kleur de grootte van het verschil.

Grensd aantal reeksen in een overlappende gebiedsgrafiek

Hoe meer reeksen we in een overlappende gebiedsgrafiek hebben, hoe meer combinaties van kleuren er zullen zijn wanneer ze elkaar overlappen. Het feit dat de meeste kleuren niet zullen worden geassocieerd met een enkele groep kan enige moeilijkheden opleveren bij de interpretatie. Zelfs met slechts drie reeksen kan dit soms te veel zijn om bij te houden: drie individuele kleuren, drie paarsgewijze overlappingen, en één kleur voor alle drie de groepen die elkaar overlappen, levert in totaal zeven kleuren op.

Vergelijking van twee reeksen is meestal veilig, hoewel, als de ene reeks altijd groter is dan de andere, de plot gemakkelijk kan worden verward met een gestapelde oppervlakteplot in plaats daarvan. Lezers kunnen ook in verwarring worden gebracht door de interpretatie van de overlappende kleuren, die niet in de algemene legenda voorkomen. Als algemene vuistregel geldt: als u overweegt een overlappende oppervlaktegrafiek te gebruiken, beperk u dan tot twee reeksen en denk na of het gebruik van een lijngrafiek de vergelijking tussen groepen duidelijker zal laten zien.

Opvolging van lijnen in gestapelde oppervlaktegrafiek

Hoewel de totale vorm van de plot hetzelfde zal zijn ongeacht de volgorde waarin de lijnen van groepen zijn uitgezet, kan het lezen van de visualisatie worden ondersteund door een goede keuze van de volgorde van de lijnen. Een goede vuistregel is om de grootste of meest stabiele groepen onderaan te zetten, en de meest variabele of kleinste groepen als laatste en bovenaan. Zoals in de volgende sectie zal worden vermeld, kost het werk om de waarden van elke afzonderlijke groep af te lezen, behalve de onderste, dus is het een goed idee om die groep het belangrijkst te maken.

Gemeenschappelijk misbruik

Een vlakdiagram gebruiken om een enkele reeks uit te zetten

Zoals aan het begin van het artikel werd opgemerkt, is het typische gebruik van de vlakdiagram om een vergelijking te maken of om een verdeling van grootheden tussen twee of meer reeksen te tonen. Wanneer slechts een enkele reeks waarden moet worden uitgezet, is het vaak de verkeerde keuze om een oppervlaktegrafiek te gebruiken. De betere optie is om gewoon een staafdiagram of lijndiagram te kiezen, afhankelijk van wat u wilt leren of communiceren over de gegevens.

Als we de progressie van exacte waarden in de tijd willen begrijpen en we niet te veel waarden hebben om over de horizontale as te plotten, dan is een staafdiagram een goede keuze. Anders is een lijndiagram een betere keuze. Lijnen hebben een efficiëntere verhouding tussen gegevens en inkt en zien er schoner uit als er veel waarden moeten worden uitgezet dan bij staven. Bovendien zijn we bij veel waarden waarschijnlijk meer geïnteresseerd in de richting en de helling van trends dan in exacte waarden, een geval waarin lijndiagrammen beter presteren.

Betekenis van waarden voor afzonderlijke groepen in een gestapeld vlakdiagram

In een gestapeld vlakdiagram is het bepalen van exacte waarden slechts in twee gevallen echt eenvoudig: voor het totaaltotaal en voor de onderste groep. Voor tussenliggende groepen moet voor het bepalen van de exacte waarde van de bijdrage van een groep de hoogte van de lijn van die groep worden bepaald en van die lijn de hoogte van de lijn eronder worden afgetrokken.

De taak wordt nog erger wanneer we veranderingen in de tijd willen volgen. Zoals voorheen is dit gemakkelijk voor de totale en de onderste groep. Tussenliggende groepen worden echter gehinderd door een veranderende basislijn, waardoor het moeilijk is om exacte verticale verschillen waar te nemen. Het onderstaande voorbeeld, aangepast uit deze blogpost, maakt dit duidelijk. Hoewel de grootte van de middelste gele groep in de loop van de tijd lijkt te veranderen, zijn de hoogten op elk punt in feite consistent.

Als u de exacte groepswaarden en hun veranderingen in de loop van de tijd wilt kennen, is de keuze voor een standaard lijndiagram een betere optie, zoals wordt aangetoond in dit Everyday Analytics-artikel.

Gemeenschappelijke opties voor vlakdiagrammen

Percentage gestapeld vlakdiagram

Een veelgebruikte optie voor vlakdiagrammen is het percentage, of de relatieve frequentie, gestapelde vlakdiagram. In plaats van de absolute waarden van elke groep bij elk verticaal deel te stapelen, stapelen we de relatieve of procentuele bijdrage van elke groep aan het totaal, zodat de totale hoogte altijd 100% is. Dit diagramtype verliest informatie over de trend van de absolute totalen (en zal dus een eigen lijngrafiek nodig hebben), maar helpt om de vergelijking van de relatieve bijdragen tussen groepen duidelijk te maken. Als bonus krijgt dit diagramtype een tweede basislijn bovenaan de plot waarop de bijdragen van een individuele groep kunnen worden afgemeten.

Lijndiagram

Het lijndiagram is de belangrijkste voorloper van het gebieddiagramtype. Als u niet zeker weet of u in een gebiedsdiagram bent geïnteresseerd, is het onwaarschijnlijk dat u met een lijndiagram de verkeerde weg inslaat. Dit geldt vooral voor de overlappende gebiedsgrafiek, waar overlappende gebieden snel uit de hand kunnen lopen. Een andere overweging is dat het altijd mogelijk is om gewoon meer plots te genereren als u geïnteresseerd bent in het maken van meerdere vergelijkingen in uw gegevens, in plaats van de behoefte te voelen om slechts één enkel grafiektype te kiezen om zoveel mogelijk te dragen.

Staafdiagram en gestapeld staafdiagram

De andere stamvader voor het gebiedsdiagram is het staafdiagram. Het dichtst in de buurt komt echter het gestapelde gebiedsdiagram en het gestapelde staafdiagram; er is niet echt een goede analogie tussen het overlappende gebiedsdiagram en een staafdiagram.

Het gestapelde staafdiagram lijkt sterk op het gestapelde gebiedsdiagram, alleen met staven in plaats van lijnen. Veel van de beperkingen van het gestapelde staafdiagram gelden dus ook voor het gestapelde staafdiagram. Een voordeel van gestapelde staafjes is echter dat het veel gemakkelijker is een consistent waardeoordeel te vellen binnen elke bin van de horizontale as. De gearceerde gebieden in een oppervlaktegrafiek kunnen vervormd raken, zoals hierboven te zien is, vooral wanneer een lijn van richting verandert. Aangezien elk gebied rechthoekig is in een gestapeld staafdiagram, wordt dit soort vervorming vermeden.

Ridgeline plot

Een aanvullend alternatief voor het overlappende gebiedsdiagram is de ridgeline plot. In plaats van alle lijnen en gekleurde gebieden op dezelfde as te plaatsen, wordt in de ridgeline-plot elke lijn op een andere as geplaatst, elk met een gedeeltelijke verticale afwijking ten opzichte van de andere. Vanwege de offset van lijnen worden verticale markeringen meestal weggelaten uit een ridgeline plot. Dit betekent dat ridgeline plots het nuttigst zijn wanneer er alleen al op basis van hun vorm een duidelijk patroon bestaat in de waarden van de afzonderlijke reeksen.

Stroomgrafiek

Een fantasierijke verwant van de oppervlaktegrafiek is de stroomgrafiek. In een gestapelde oppervlaktegrafiek worden alle lijnen op elkaar gestapeld over een rechte basislijn onderaan de stapel. Bij een stroomdiagram loopt de basislijn door het midden van de grafiek, en zijn de gebieden symmetrisch rond de centrale lijn gegroepeerd. Hierdoor is het moeilijk om de precieze waarden van een groep of zelfs het totaal te bepalen.

Zoals Andy Kirk betoogt, kunnen stroomdiagrammen het beste in een interactieve vorm worden gebruikt wanneer veel gegevens aan een groot publiek moeten worden gepresenteerd. Interactiviteit is van vitaal belang om lezers in staat te stellen in de visualisatie te graven en hun eigen bevindingen te vormen. Wanneer er echter nauwkeurige oordelen moeten worden geveld of een statische presentatie moet worden gemaakt, is het beter om het bij een meer conventionele visualisatie te houden, waarbij de gegevens worden geaggregeerd op een manier die het beste de punten naar voren brengt die u wilt presenteren.

Deze plot maakt gebruik van dezelfde gegevens als de ridgeline-plot hierboven.

Visualisatiehulpmiddelen

Als een combinatie van twee van de meest gebruikelijke grafiektypen (lijn en staaf), is de area plot ook een vrij gebruikelijke grafiekoptie in alle visualisatiehulpmiddelen. Waar de gebiedsgrafiek als grafiektype aanwezig is, is de gebruikelijke implementatie een gestapelde gebiedsgrafiek. Overlappende vlakdiagrammen zijn meestal geen ingebouwde optie bij visualisatiegereedschappen, en moeten op maat worden gemaakt op basis van een lijndiagram. Voor sommige tools, vaak programmatisch, is het maken van een van beide soorten gebiedsdiagrammen geen basisoptie voor het diagramtype, en moet er wat extra werk worden verricht op de gegevens om een gebiedsdiagram te maken van gearceerde gebieden en lijnen.

Het gebiedsdiagram is een van de vele verschillende diagramtypen die kunnen worden gebruikt voor het visualiseren van gegevens. Leer meer uit onze artikelen over essentiële diagramtypen, hoe u een type gegevensvisualisatie kiest, of door de volledige verzameling artikelen in de categorie diagrammen te doorbladeren.

admin

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

lg