- Mikä on aluekaavio?
- Milloin sinun pitäisi käyttää aluekaaviota
- Ylittyvä aluekaavio
- Pinotettu aluekaavio
- Esimerkki tietorakenteesta
- Pinta-alakaavion käytön parhaat käytännöt
- Sisällytä nollaperusviiva
- Limitoitujen sarjojen määrä päällekkäisen alueen kaaviossa
- Huomioi viivojen järjestys pinotussa aluekaaviossa
- Yleisiä väärinkäytöksiä
- Aluekaavion käyttäminen yksittäisen sarjan piirtämiseen
- Yksittäisten ryhmien arvojen tulkitseminen pinotussa aluekaaviossa
- Yleisiä aluekaaviovaihtoehtoja
- Prosenttinen pinottu aluekaavio
- viivakaavio
- Pylväskaavio ja pinottu pylväskaavio
- Ridgeline plot
- Virtakaavio
- Visualisointityökalut
Mikä on aluekaavio?
Aluekaaviossa yhdistyvät viiva- ja pylväskaavio, ja sen avulla voidaan näyttää, miten yhden tai useamman ryhmän numeeriset arvot muuttuvat toisen muuttujan, tyypillisesti ajan, edetessä. Aluekaavion erottaa viivakaaviosta se, että viivojen väliin on lisätty varjostus ja perusviiva, kuten pylväskaaviossa.
Tämässä aluekaaviossa esitetään kuvitteellisen verkkopohjaisen yrityksen aktiivisten käyttäjien määrä kuukausittain laskettuna. Kunkin kuukauden arvoja voidaan mitata paitsi muodon yläreunan pystyasennosta myös perusviivan ja yläreunan välisestä värillisestä korkeudesta. Tästä kaaviosta nähdään, että aktiivisten käyttäjien määrä on suunnilleen kaksinkertaistunut marraskuusta 2019 helmikuuhun 2020 ja että käyttäjämäärän kasvunopeus on kasvanut ajan myötä.
Milloin sinun pitäisi käyttää aluekaaviota
Mikäli yllä olevassa esimerkissä on piirretty vain yksi viiva, jossa on tummennettu pinta-ala, aluekaaviota käytetään tyypillisesti useammalla viivalla, kun halutaan vertailla ryhmien (alias sarjojen) välisiä lukuja toisiinsa nähden, tai kun halutaan näyttää, miten kokonaisuus on jaettu osiin. Tämä johtaa kahteen erityyppiseen aluekaavioon, yksi kutakin käyttötapausta varten.
Ylittyvä aluekaavio
Tapauksessa, jossa haluamme vertailla ryhmien välisiä arvoja, päädymme päällekkäiseen aluekaavioon. Päällekkäisessä aluekaaviossa aloitamme tavallisella viivakaaviolla. Kullekin ryhmälle piirretään yksi piste kunkin vaaka-arvon kohdalle, ja korkeus osoittaa ryhmän arvon pystyakselimuuttujalla; viiva yhdistää kaikki ryhmän pisteet vasemmalta oikealle. Aluekaavio lisää varjostuksen jokaisen viivan väliin nollan perusviivaan. Koska ryhmien varjostukset ovat yleensä jossain määrin päällekkäisiä, varjostukseen on lisätty jonkin verran läpinäkyvyyttä, jotta kaikkien ryhmien viivat ovat helposti nähtävissä. Varjostus auttaa korostamaan sitä, millä ryhmällä on suurin arvo sen perusteella, minkä ryhmän puhdas väri on näkyvissä.
Varo, ettei yksi sarja ole aina toista korkeammalla, tai kuvaaja voi sekoittua toisen tyyppiseen aluekaavioon: pinottuun aluekaavioon. Näissä tapauksissa pelkkä tavallisesta viivakaaviosta pitäytyminen on parempi valinta.
Pinotettu aluekaavio
Kun käytetään termiä ’aluekaavio’, tarkoitetaan oikeastaan pinottua aluekaaviota. Päällekkäisessä aluekaaviossa jokainen viiva tummennettiin pystyarvostaan yhteiseen perusviivaan. Pinotussa aluekaaviossa viivat piirretään yksi kerrallaan, ja viimeksi piirretyn ryhmän korkeus toimii liikkuvana perusviivana. Näin ollen ylimmän viivan täysin pinottu korkeus vastaa kokonaisarvoa, kun kaikki ryhmät lasketaan yhteen.
Käytät pinottua aluekaaviota silloin, kun haluat seurata kokonaisarvon lisäksi myös tämän kokonaisarvon jakautumista ryhmittäin. Vertailemalla käyrän kunkin segmentin korkeuksia saadaan yleiskuva siitä, miten kukin alaryhmä vertautuu toisiinsa niiden osuuksissa kokonaissummaan.
Esimerkki tietorakenteesta
Kuukausi | Trials | Basic | Premium | |
---|---|---|---|---|
2019-yks.11 | 154 | 1180 | 201 | |
2019-12 | 157 | 1186 | 219 | |
2020-01 | 170 | 1195 | 270 | |
2020-02 | 180 | 1213 | 285 | |
… | … | … | … | … |
Tiedot, jotka halutaan kuvata aluekaaviolla, kootaan tyypillisesti taulukkoon, jossa on kaksi tai useampi sarake. Ensimmäisessä sarakkeessa ilmoitetaan vaaka-akselin paikat, joihin kukin viiva piirretään. Jokaisessa seuraavassa sarakkeessa ilmoitetaan kunkin pisteen pystysuuntainen osuus, yksi sarake kutakin piirrettävää sarjaa kohti. Tätä muotoa voidaan soveltaa sekä päällekkäisiin että pinottuihin aluekaavioihin, ja suurin ero kaavioiden välillä on se, miten arvot tulkitaan renderöintiä varten.
Pinotetuissa aluekaavioissa jotkin visualisointityökalut vaativat, että sarakkeissa ei luetella yksittäisiä kontribuutioita vaan kumulatiivisia kontribuutioita. Tällöin sarakkeet määrittävät viivan korkeudet suoraan, ja kunkin ryhmän kontribuutiot ilmenevät sarakkeiden välisten arvojen erotuksesta.
Kuukausi | Kokeet | + Basic | + Premium |
---|---|---|---|
2019-…11 | 154 | 1334 | 1535 |
2019-12 | 157 | 1343 | 1562 |
2020-01 | 170 | 1365 | 1635 |
2020-02 | 180 | 1393 | 1678 |
… | … | … | … |
Pinta-alakaavion käytön parhaat käytännöt
Sisällytä nollaperusviiva
Viivakaavion ei tarvitse vaatia nollaperusviivaa, mutta varjostuksen lisääminen tarkoittaa sitä, että värillisten alueiden korkeuksia käytetään vertailtaessa kunkin ryhmän arvojen suuruutta. Näin ollen pylväsdiagrammin tavoin on pakollista, että on olemassa nollapohjataso, jota vasten varjostus on suoritettava. Akselin leikkaaminen johtaisi siihen, että ryhmien arvojen todellinen suhde ei vastaisi sitä, mitä luotu kuvaaja antaa ymmärtää.
Poikkeus tähän sääntöön voi tulla, kun vertaamme kahta sarjaa päällekkäisessä aluekaaviossa varjostussääntöä muuttamalla. Jos rajoitamme varjostuksen viivojen väliin, emmekä molemmista viivoista yhteiseen perusviivaan, voimme zoomata pystyakselin rajat kiinnostavaan vaikutukseen ilman perusviivaa. Varjostus saa nyt erilaisen merkityksen, jolloin väri osoittaa, kumpi ryhmä on suurempi arvo, ja värin määrä eron suuruuden.
Limitoitujen sarjojen määrä päällekkäisen alueen kaaviossa
Mitä enemmän sarjoja meillä on päällekkäisen alueen kaaviossa, sitä useampia väriyhdistelmiä on, kun ne ovat päällekkäin. Se, että useimmat värit eivät liity yhteen ryhmään, voi aiheuttaa tulkintavaikeuksia. Vaikka sarjoja olisi vain kolme, tämä voi joskus olla liikaa seurattavaa: kolme yksittäistä väriä, kolme pareittaista päällekkäisyyttä ja yksi väri kaikille kolmelle päällekkäiselle ryhmälle tekee yhteensä seitsemän väriä.
Kahden sarjan vertailu on yleensä turvallista, vaikka jos toinen sarja on aina toista suurempi, kuvaajaa voidaan helposti erehtyä luulemaan sen sijaan pinotuksi pinta-aladiagrammiksi. Lukijoita voi myös hämmentää päällekkäisten värien tulkinta, joita ei ole yleisessä legendassa. Yleisenä nyrkkisääntönä on, että jos harkitset päällekkäisen aluekaavion käyttämistä, rajoitu kahteen sarjaan ja mieti, näyttäisikö viivakaavion käyttäminen ryhmien välisen vertailun selkeämmin.
Huomioi viivojen järjestys pinotussa aluekaaviossa
Vaikka kaaviokuvan kokonaismuoto on sama riippumatta siitä, missä järjestyksessä ryhmien viivat on piirretty, visualisoinnin lukemista voidaan tukea viivojen järjestyksen hyvällä valinnalla. Hyvä nyrkkisääntö on sijoittaa suurimmat tai vakaimmat ryhmät alareunaan ja vaihtelevimmat tai pienimmät ryhmät viimeisenä ja ylimpänä. Kuten seuraavassa kappaleessa mainitaan, minkä tahansa yksittäisen ryhmän arvojen lukeminen vaatii työtä lukuun ottamatta alimpana olevaa ryhmää, joten siitä kannattaa tehdä tärkein.
Yleisiä väärinkäytöksiä
Aluekaavion käyttäminen yksittäisen sarjan piirtämiseen
Kuten artikkelin alussa todettiin, aluekaavion tyypillinen käyttötapaus on vertailun tekeminen tai suureiden jakautumisen osoittaminen kahden tai useamman sarjan välillä. Kun meillä on vain yksi arvosarja piirrettävänä, on usein väärä valinta käyttää aluekaaviota. Parempi vaihtoehto on valita pelkkä pylväsdiagrammi tai viivadiagrammi riippuen siitä, mitä haluat oppia tai viestiä tiedoista.
Jos haluamme ymmärtää tarkkojen arvojen etenemistä ajan kuluessa eikä meillä ole liikaa arvoja, joita voisimme piirtää vaaka-akselilla, pylväsdiagrammi on hyvä valinta. Muussa tapauksessa viivakaavio on parempi valinta. Viivoilla on tehokkaampi datan ja tussin suhde ja siistimpi ulkoasu, kun piirrettäviä arvoja on paljon, verrattuna palkkikaavioihin. Lisäksi kun arvoja on paljon, olemme todennäköisesti kiinnostuneempia trendien suunnasta ja kaltevuudesta kuin tarkoista arvoista, jolloin viivakaaviot toimivat paremmin.
Yksittäisten ryhmien arvojen tulkitseminen pinotussa aluekaaviossa
Pinotetussa aluekaaviossa tarkkojen arvojen mittaaminen on todella helppoa vain kahdessa tapauksessa: kokonaissumman ja alimmassa ryhmässä. Väliin jäävien ryhmien osalta ryhmän osuuden tarkan arvon saaminen edellyttää kyseisen ryhmän viivan korkeuden selvittämistä ja sen alapuolella olevan viivan korkeuden vähentämistä.
Tehtävä vaikeutuu entisestään, kun halutaan seurata muutoksia ajan kuluessa. Kuten ennenkin, tämä on helppoa kokonais- ja alimmalle ryhmälle. Väliin jääviä ryhmiä vaikeuttaa kuitenkin muuttuva perusviiva, jolloin tarkkojen vertikaalisten erojen hahmottaminen on vaikeaa. Alla oleva, tästä blogikirjoituksesta muokattu esimerkki tekee tämän selväksi. Vaikka keltaisen keskimmäisen ryhmän suuruus näyttää muuttuvan ajan myötä, itse asiassa korkeudet kussakin pisteessä ovat johdonmukaisia.
Jos haluat tietää tarkat ryhmäarvot ja niiden muutokset ajan myötä, tavallisen viivakaavion valitseminen on parempi vaihtoehto, kuten tässä Everyday Analytics -artikkelissa osoitetaan.
Yleisiä aluekaaviovaihtoehtoja
Prosenttinen pinottu aluekaavio
Yleinen aluekaaviovaihtoehto on prosentuaalinen eli suhteellisen frekvenssin pinottu aluekaavio. Sen sijaan, että pinottaisiin kunkin ryhmän absoluuttiset arvot jokaiseen pystysuuntaiseen viipaleeseen, pinotaan kunkin ryhmän suhteellinen tai prosentuaalinen osuus kokonaisarvosta niin, että kokonaiskorkeus on aina 100 %. Tämä kaaviotyyppi menettää tietoa absoluuttisten kokonaissummien suuntauksesta (ja tarvitsee siksi oman viivakaavionsa), mutta auttaa tuomaan esiin ryhmien välisten suhteellisten osuuksien vertailun. Bonuksena tämä kaaviotyyppi saa kaavion yläreunaan toisen perusviivan, jonka perusteella yksittäisen ryhmän osuudet voidaan arvioida.
viivakaavio
Viivakaavio on pinta-alakaaviotyypin pääasiallinen esiaste. Jos et ole varma, onko aluekaavio se, mistä olet kiinnostunut, viivakaavion käyttäminen ei todennäköisesti ohjaa sinua harhaan. Tämä pätee erityisesti päällekkäisiin aluekaavioihin, joissa päällekkäiset alueet voivat riistäytyä nopeasti käsistä. Toisena näkökohtana on aina mahdollista vain luoda useampia kaavioita, jos olet kiinnostunut tekemään useita vertailuja aineistossasi sen sijaan, että kokisit tarvetta valita vain yhden kaaviotyypin, jotta se kantaisi mahdollisimman paljon.
Pylväskaavio ja pinottu pylväskaavio
Aluekaavion toinen kantaisä on pylväskaavio. Tarkemmin sanottuna lähin yhteys on kuitenkin pinotun aluekaavion ja pinotun pylväskaavion välillä; päällekkäisen aluekaavion ja minkään pylväskaavion välillä ei oikeastaan ole hyvää analogiaa.
Pinotettu pylväskaavio on hyvin samankaltainen kuin pinottu aluekaavio, mutta siinä on viivojen sijasta palkkeja. Näin ollen monet pinotun aluekaavion rajoituksista koskevat myös pinottua pylväskaaviota. Yksi pinottujen palkkikaavioiden etu on kuitenkin se, että on paljon helpompi tehdä johdonmukainen arvionti kunkin vaaka-akselin binäärin sisällä. Aluekaavion tummennetut alueet voivat vääristyä, kuten edellä on nähty, varsinkin kun viiva vaihtaa suuntaa. Koska pinotussa pylväsdiagrammissa jokainen alue on suorakulmainen, tällaiselta vääristymiseltä vältytään.
Ridgeline plot
Yksi lisävaihtoehto päällekkäiselle aluekaaviolle on ridgeline plot. Sen sijaan, että kaikki viivat ja värilliset alueet piirretään samalle akselille, ridgeline-diagrammissa jokainen viiva sijoitetaan eri akselille, ja jokainen viiva on osittain pystysuorassa suhteessa muihin. Viivojen siirtyneen luonteen vuoksi pystysuuntaiset merkinnät jätetään yleensä pois harjaviivapiirroksesta. Tämä tarkoittaa sitä, että ridgeline plotit ovat hyödyllisimmillään silloin, kun yksittäisten sarjojen arvoissa on selkeä kuvio pelkästään niiden muotojen perusteella.
Virtakaavio
Aluekaavion mielikuvituksellinen sukulainen on virtakaavio. Pinotetussa aluekaaviossa kaikki viivat on pinottu päällekkäin pinon alaosassa olevan suoran perusviivan päälle. Virtaviivakuvaajassa perusviiva kulkee kuvaajan keskikohdan läpi, ja alueet kerääntyvät symmetrisesti keskiviivan ympärille. Tämän vuoksi on vaikea arvioida tarkkoja arvoja minkään ryhmän tai edes kokonaissumman osalta.
Kuten Andy Kirk väittää, stream-grafiikoita käytetään parhaiten interaktiivisessa muodossa silloin, kun halutaan esitellä paljon dataa laajalle yleisölle.
Kuten Andy Kirk väittää, stream-grafiikoita käytetään parhaiten interaktiivisessa muodossa silloin, kun halutaan esitellä paljon dataa laajalle yleisölle. Vuorovaikutteisuus on elintärkeää, jotta lukijat voivat perehtyä visualisointiin ja muodostaa omia havaintojaan. Kun kuitenkin halutaan tehdä tarkkoja arvioita tai staattinen esitys, on parempi pitäytyä perinteisemmässä visualisoinnissa, jossa tiedot kootaan yhteen tavalla, joka tuo parhaiten esiin ne seikat, jotka halutaan esittää.
Visualisointityökalut
Kahden yleisimmän kaaviotyypin (viiva- ja pylväskaavio) yhdistelmänä pinta-aladiagrammi on myös melko yleinen kaaviovaihtoehto visualisointityökaluissa. Jos aluekaavio esiintyy kaaviotyyppinä, tavallinen toteutus on pinottu aluekaavio. Päällekkäiset aluekaaviot eivät yleensä ole visualisointityökalujen sisäänrakennettu vaihtoehto, vaan ne on luotava mukautetusti viivakaavion pohjalta. Joissakin työkaluissa, usein ohjelmallisissa, kummankaan tyyppisen aluekaavion luominen ei ole peruskaaviotyyppivaihtoehto, ja aineistolle on tehtävä jonkin verran lisätyötä, jotta tummennetuista alueista ja viivoista voidaan luoda aluekaavio.
Aluekaavio on yksi monista erilaisista kaaviotyypeistä, joita voidaan käyttää tietojen visualisointiin. Lue lisää artikkeleistamme, jotka käsittelevät keskeisiä kaaviotyyppejä, datan visualisointityypin valitsemista tai selaamalla koko artikkelikokoelmaa Kaaviot-luokassa.