Che cos’è un grafico ad area?

Un grafico ad area combina il grafico a linee e il grafico a barre per mostrare come i valori numerici di uno o più gruppi cambiano sulla progressione di una seconda variabile, tipicamente quella del tempo. Un grafico ad area si distingue da un grafico a linee per l’aggiunta di un’ombreggiatura tra le linee e una linea di base, come in un grafico a barre.

Questo grafico ad area mostra il numero di utenti attivi per una società fittizia basata sul web, calcolati per mese. I valori per ogni mese possono essere misurati non solo dalla posizione verticale della cima della forma, ma anche dall’altezza colorata tra la linea di base e la cima. In questo grafico, possiamo vedere che il numero di utenti attivi è circa raddoppiato da novembre 2019 a febbraio 2020, e che il tasso di guadagno degli utenti è aumentato nel tempo.

Quando dovresti usare un grafico ad area

Mentre l’esempio precedente traccia solo una singola linea con area ombreggiata, un grafico ad area è tipicamente usato con più linee per fare un confronto tra gruppi (aka serie) o per mostrare come un insieme è diviso in parti componenti. Questo porta a due diversi tipi di grafico ad area, uno per ogni caso d’uso.

Cartogramma ad area sovrapposta

Nel caso in cui vogliamo confrontare i valori tra gruppi, ci ritroviamo con un grafico ad area sovrapposta. In un grafico ad aree sovrapposte, iniziamo con un grafico a linee standard. Per ogni gruppo, un punto è tracciato ad ogni valore orizzontale con l’altezza che indica il valore del gruppo sull’asse verticale variabile; una linea collega tutti i punti di un gruppo da sinistra a destra. Il grafico ad area aggiunge l’ombreggiatura tra ogni linea ad una linea di base zero. Poiché l’ombreggiatura per i gruppi di solito si sovrappone in una certa misura, una certa trasparenza è inclusa nell’ombreggiatura in modo che tutte le linee dei gruppi possano essere facilmente viste. L’ombreggiatura aiuta a sottolineare quale gruppo ha il valore più grande in base a quale colore puro del gruppo è visibile.

Fate attenzione che una serie non sia sempre più alta dell’altra, o il grafico potrebbe confondersi con l’altro tipo di grafico ad area: il grafico ad area impilato. In questi casi, attenersi semplicemente al grafico a linee standard sarà una scelta migliore.

Cartogramma ad aree sovrapposte

Generalmente, quando si usa il termine ‘grafico ad aree’, ciò che è effettivamente implicito è il grafico ad aree sovrapposte. Nel grafico ad aree sovrapposte, ogni linea era ombreggiata dal suo valore verticale ad una linea di base comune. Nel grafico ad aree sovrapposte, le linee sono tracciate una alla volta, con l’altezza del gruppo tracciato più di recente che serve come linea di base mobile. Come tale, l’altezza completamente impilata della linea più in alto corrisponderà al totale quando si sommano tutti i gruppi.

Utilizzerete un grafico ad area impilata quando volete tracciare non solo il valore totale, ma anche capire la ripartizione di quel totale per gruppi. Confrontando le altezze di ogni segmento della curva ci permette di avere un’idea generale di come ogni sottogruppo si confronta con gli altri nei loro contributi al totale.

La maggior parte degli utenti attivi proviene dagli account di base, ma gli utenti premium sembrano crescere proporzionalmente più velocemente.

Esempio di struttura dati

Mese Trials Basic Premium
2019-11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

I dati che devono essere rappresentati con un grafico ad area sono in genere aggregati in una tabella con due o più colonne. La prima colonna indica le posizioni sull’asse orizzontale dove ogni linea sarà tracciata. Ogni colonna che segue indicherà il contributo verticale per ogni punto, una colonna per ogni serie da tracciare. Questo formato è applicabile sia al grafico ad aree sovrapposte che a quello ad aree sovrapposte, con la principale differenza tra i grafici nel modo in cui i valori vengono interpretati per il rendering.

Per i grafici ad aree sovrapposte, alcuni strumenti di visualizzazione richiedono che le colonne non elenchino i singoli contributi, ma i contributi cumulativi. In questo caso, le colonne specificano direttamente le altezze delle linee, e i contributi di ogni gruppo sono impliciti nella differenza di valori tra le colonne.

Mese Trials + Basic + Premium
2019-11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Pratiche migliori per usare un grafico ad area

Includere una linea di base zero

Mentre un grafico a linee non è limitato a richiedere una linea di base zero, l’aggiunta di ombreggiatura significa che le altezze delle regioni colorate saranno usate per confrontare la dimensione dei valori di ogni gruppo. Così, come un grafico a barre, è obbligatorio che ci sia una linea di base zero rispetto alla quale l’ombreggiatura deve essere eseguita. Tagliare l’asse farebbe sì che il rapporto reale dei valori del gruppo non corrisponda a ciò che è implicito nel grafico generato.

Un’eccezione a questa regola può verificarsi quando confrontiamo due serie in un grafico ad area sovrapposta con una modifica alla regola dell’ombreggiatura. Se limitiamo l’ombreggiatura ad essere tra le linee, piuttosto che da entrambe le linee ad una linea di base comune, allora possiamo ingrandire i limiti dell’asse verticale nell’effetto di interesse senza una linea di base. L’ombreggiatura ora assume un significato diverso, con il colore che indica quale gruppo ha un valore maggiore, e la quantità di colore la dimensione della differenza.

Numero limite di serie in un grafico ad area sovrapposta

Più serie abbiamo in un grafico ad area sovrapposta, più combinazioni di colori ci saranno quando si sovrappongono. Il fatto che la maggior parte dei colori non sarà associata a un singolo gruppo può causare qualche difficoltà di interpretazione. Anche con solo tre serie, questo può a volte essere troppo da tracciare: tre colori individuali, tre sovrapposizioni a coppie, e un colore per tutti e tre i gruppi che si sovrappongono totalizzano sette colori in tutto.

Confrontare due serie è solitamente sicuro, anche se se una serie è sempre più grande dell’altra, il grafico può essere facilmente scambiato per un grafico ad aree sovrapposte. I lettori possono anche essere confusi dall’interpretazione dei colori sovrapposti, che non saranno presenti nella legenda generale. Come regola generale, se stai pensando di usare un grafico ad aree sovrapposte, limitati a due serie e pensa se l’uso di un grafico a linee mostrerà più chiaramente il confronto tra i gruppi.

Considera l’ordine delle linee nel grafico ad aree sovrapposte

Mentre la forma totale del grafico sarà la stessa indipendentemente dall’ordine in cui sono tracciate le linee dei gruppi, la lettura della visualizzazione può essere supportata da una buona scelta dell’ordine delle linee. Una buona regola generale è quella di mettere i gruppi più grandi o più stabili in basso, con i gruppi più variabili o più piccoli per ultimi e in alto. Come sarà menzionato nella sezione seguente, ci vuole lavoro per leggere i valori di ogni singolo gruppo eccetto il più basso, quindi è una buona idea rendere quello più importante.

Utilizzi comuni

Utilizzare un grafico ad area per tracciare una singola serie

Come notato all’inizio dell’articolo, il tipico caso d’uso del grafico ad area è fare un confronto o mostrare una divisione di quantità tra due o più serie. Quando abbiamo solo una singola serie di valori da tracciare, è spesso la scelta sbagliata usare un grafico ad area. L’opzione migliore è scegliere solo un grafico a barre o un grafico a linee, a seconda di ciò che si vuole imparare o comunicare sui dati.

Se vogliamo capire la progressione dei valori esatti nel tempo e non abbiamo troppi valori da tracciare sull’asse orizzontale, allora un grafico a barre è una buona scelta. Altrimenti, un grafico a linee è una scelta migliore. Le linee hanno un rapporto dati-inchiostro più efficiente e un aspetto più pulito con molti valori da tracciare rispetto alle barre. Inoltre, quando abbiamo molti valori, è probabile che siamo più interessati alla direzione e alla pendenza delle tendenze piuttosto che ai valori esatti, un caso in cui i grafici a linee funzionano meglio.

Interpretare i valori sui singoli gruppi in un grafico ad aree impilate

In un grafico ad aree impilate, misurare i valori esatti è veramente facile solo in due casi: per il totale generale e per il gruppo più in basso. Per i gruppi intermedi, ottenere il valore esatto del contributo di un gruppo richiede di trovare l’altezza della linea di quel gruppo e sottrarre l’altezza della linea sottostante.

Il compito diventa ancora peggiore quando vogliamo tracciare i cambiamenti nel tempo. Come prima, questo è facile per il totale e il gruppo più in basso. Tuttavia, i gruppi intermedi sono ostacolati da una linea di base che cambia, rendendo difficile percepire le differenze verticali esatte. L’esempio qui sotto, adattato da questo post del blog, lo rende chiaro. Mentre la grandezza del gruppo centrale giallo sembra cambiare nel tempo, in realtà, le altezze in ogni punto sono coerenti.

Se vuoi conoscere i valori esatti del gruppo e i loro cambiamenti nel tempo, allora scegliere un grafico a linee standard sarà un’opzione migliore, come dimostrato in questo articolo di Everyday Analytics.

Opzioni comuni per i grafici ad area

Percentuale impilata

Un’opzione comune per i grafici ad area è la percentuale, o frequenza relativa, impilata. Invece di impilare i valori assoluti di ogni gruppo ad ogni fetta verticale, impiliamo il contributo relativo o percentuale di ogni gruppo al totale, in modo che l’altezza complessiva sia sempre del 100%. Questo tipo di grafico perde informazioni sulla tendenza dei totali assoluti (e quindi avrà bisogno di un proprio grafico a linee) ma aiuta a mettere in evidenza il confronto dei contributi relativi tra i gruppi. Come bonus, questo tipo di grafico guadagna una seconda linea di base nella parte superiore del grafico sulla quale i contributi di un singolo gruppo possono essere misurati.

Cartogramma a linee

Il grafico a linee è il principale progenitore del tipo di grafico ad aree. Se non sei sicuro che un grafico ad area sia quello che ti interessa, è improbabile che usare un grafico a linee ti porti fuori strada. Questo è particolarmente vero per il grafico ad aree sovrapposte, dove le regioni sovrapposte possono rapidamente andare fuori controllo. Come altra considerazione, è sempre possibile generare semplicemente più grafici se sei interessato a fare più confronti nei tuoi dati piuttosto che sentire il bisogno di scegliere un solo tipo di grafico per portare il più possibile.

Grafico a barre e grafico a barre impilate

L’altro progenitore del grafico ad area è il grafico a barre. Più precisamente, tuttavia, il legame più stretto è tra il grafico ad area impilato e il grafico a barre impilate; non c’è davvero un buon analogo tra il grafico ad area sovrapposta e qualsiasi grafico a barre.

Il grafico a barre impilate è molto simile al grafico ad area impilato, solo con barre invece di linee. Quindi, molte delle limitazioni del grafico ad aree sovrapposte si applicano anche al grafico a barre sovrapposte. Tuttavia, un vantaggio delle barre impilate è che è molto più facile fare un giudizio coerente del valore all’interno di ogni bin dell’asse orizzontale. Le regioni ombreggiate in un grafico ad area possono diventare distorte come visto sopra, specialmente quando una linea cambia direzione. Dato che ogni regione è rettangolare in un grafico a barre impilato, questo tipo di distorsione viene evitata.

Plottaggio a linee di confine

Un’ulteriore alternativa al grafico ad aree sovrapposte è il plot a linee di confine. Piuttosto che tracciare tutte le linee e le regioni colorate sullo stesso asse, il grafico ridgeline mette ogni linea su un asse diverso, ognuno con un parziale offset verticale rispetto agli altri. A causa della natura dell’offset delle linee, le marcature verticali sono di solito lasciate fuori da un grafico ridgeline. Questo significa che i grafici ridgeline sono più utili quando c’è un chiaro modello nei valori delle singole serie basato solo sulle loro forme.

Grafico a flusso

Un parente fantasioso del grafico ad area è il grafico a flusso. In un grafico ad area impilato, tutte le linee sono impilate l’una sull’altra sopra una linea di base dritta in fondo alla pila. Con un grafico a flusso, la linea di base è impostata attraverso il centro del grafico, e le aree sono raccolte simmetricamente intorno alla linea centrale. A causa di questo, è difficile misurare valori precisi per qualsiasi gruppo o anche il totale complessivo.

Come sostenuto da Andy Kirk, i grafici a flusso sono meglio usati in forma interattiva quando molti dati devono essere presentati a un vasto pubblico. L’interattività è vitale per permettere ai lettori di scavare nella visualizzazione e formare le proprie conclusioni. Tuttavia, quando è necessario dare giudizi accurati o fare una presentazione statica, è meglio attenersi a una visualizzazione più convenzionale, aggregando i dati in un modo che meglio mette in evidenza i punti che si desidera presentare.

Questo grafico usa gli stessi dati del grafico a linee di cresta di cui sopra.

Strumenti di visualizzazione

Come combinazione di due dei più comuni tipi di grafico (linea e barra), il grafico ad area è anche un’opzione abbastanza comune negli strumenti di visualizzazione. Dove il grafico ad area è presente come tipo di grafico, l’implementazione usuale è come un grafico ad area impilato. I grafici ad area sovrapposti di solito non sono un’opzione integrata negli strumenti di visualizzazione e dovranno essere creati su misura partendo da un grafico a linee di base. Per alcuni strumenti, spesso programmatici, la creazione di entrambi i tipi di grafici ad area non è un’opzione di base, e sarà necessario eseguire un lavoro aggiuntivo sui dati per creare un grafico ad area da aree ombreggiate e linee.

Il grafico ad area è uno dei molti tipi di grafico che possono essere usati per visualizzare i dati. Scopri di più dai nostri articoli sui tipi di grafici essenziali, su come scegliere un tipo di visualizzazione dei dati, o sfogliando la collezione completa di articoli nella categoria grafici.

admin

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

lg