O que é um gráfico de área?

Um gráfico de área combina o gráfico de linhas e o gráfico de barras para mostrar como os valores numéricos de um ou mais grupos mudam ao longo da progressão de uma segunda variável, tipicamente a do tempo. Um gráfico de área é distinguido de um gráfico de linha pela adição de sombreamento entre linhas e uma linha de base, como em um gráfico de barras.

Este gráfico de área mostra o número de usuários ativos de uma empresa fictícia baseada na web, computada por mês. Os valores para cada mês podem ser medidos não apenas a partir da posição vertical do topo da forma, mas também a altura colorida entre a linha de base e o topo. Neste gráfico, podemos ver que o número de usuários ativos dobrou de novembro de 2019 a fevereiro de 2020, e que a taxa de ganhos de usuários aumentou ao longo do tempo.

Quando você deve usar um gráfico de área

Apesar do exemplo acima apenas traçar uma única linha com área sombreada, um gráfico de área é tipicamente usado com várias linhas para fazer uma comparação entre grupos (série aka) ou para mostrar como um todo é dividido em partes componentes. Isto leva a dois tipos diferentes de gráfico de área, um para cada caso de uso.

Gráficos de área com sombreamento

No caso em que queremos comparar os valores entre grupos, acabamos com um gráfico de área com sobreposição. Em um gráfico de área sobreposta, começamos com um gráfico de linhas padrão. Para cada grupo, um ponto é traçado em cada valor horizontal com altura indicando o valor do grupo na variável do eixo vertical; uma linha liga todos os pontos de um grupo da esquerda para a direita. O gráfico de área adiciona sombreamento entre cada linha a uma linha de base zero. Como o sombreamento para grupos geralmente se sobrepõe até certo ponto, alguma transparência é incluída no sombreamento para que todas as linhas do grupo possam ser facilmente vistas. O sombreamento ajuda a enfatizar qual grupo tem o maior valor baseado em qual cor pura do grupo é visível.

Tenha cuidado para que uma série não seja sempre maior que a outra, ou o gráfico pode se confundir com o outro tipo de gráfico de área: o gráfico de área empilhada. Nesses casos, apenas manter o gráfico de linha padrão será uma melhor escolha.

Gráficos de área empilhada

Generalmente, quando o termo ‘gráfico de área’ é usado, o que está realmente implícito é o gráfico de área empilhada. No gráfico de área sobreposta, cada linha foi sombreada de seu valor vertical para uma linha de base comum. No gráfico de área empilhada, as linhas são plotadas uma de cada vez, com a altura do grupo mais recentemente plotado servindo como uma linha de base móvel. Como tal, a altura totalmente empilhada da linha mais alta corresponderá ao total ao somar todos os grupos.

Você usará um gráfico de área empilhada quando quiser rastrear não apenas o valor total, mas também quando quiser entender a divisão desse total por grupos. Comparar as alturas de cada segmento da curva nos permite ter uma idéia geral de como cada subgrupo se compara ao outro em suas contribuições para o total.

A maioria dos usuários ativos vem de contas básicas, mas os usuários premium parecem estar crescendo proporcionalmente mais rápido.

Exemplo da estrutura de dados

Mês Trials Basic Premium
2019-11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

Os dados que devem ser representados com um gráfico de área são tipicamente agregados em uma tabela com duas ou mais colunas. A primeira coluna indica as posições no eixo horizontal onde cada linha será plotada. Cada coluna que se segue indicará a contribuição vertical para cada ponto, uma coluna por série a ser plotada. Este formato é aplicável tanto para o gráfico de área sobreposta quanto para o empilhado, sendo a principal diferença entre os gráficos a forma como os valores são interpretados para renderização.

Para gráficos de área empilhada, algumas ferramentas de visualização requerem que as colunas listem não as contribuições individuais, mas sim as contribuições cumulativas. Neste caso, as colunas especificam as alturas das linhas diretamente, e as contribuições de cada grupo estão implícitas pela diferença de valores entre as colunas.

Mês Trials + Básico + Premium
2019-11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Melhores práticas para usar um gráfico de área

Inclua uma linha de base zero

Embora um gráfico de linha não se restrinja a requerer uma linha de base zero, a adição de sombreamento significa que as alturas das regiões coloridas serão usadas para comparar o tamanho dos valores de cada grupo. Assim, como um gráfico de barras, é obrigatório que haja uma linha de base zero contra a qual o sombreamento deve ser realizado. Para cortar o eixo resultaria na relação real nos valores do grupo para não coincidir com o que está implícito no gráfico gerado.

Uma exceção a esta regra pode vir quando comparamos duas séries em um gráfico de área sobreposta com uma mudança na regra de sombreamento. Se limitarmos o sombreamento a estar entre as linhas, em vez de de ambas as linhas a uma linha de base comum, então podemos ampliar os limites do eixo vertical para o efeito de interesse sem uma linha de base. O sombreamento agora tem um significado diferente, com a cor indicando qual grupo como um valor maior, e a quantidade de cor o tamanho da diferença.

Número limite de séries em um gráfico de área sobreposta

Quantas mais séries tivermos em um gráfico sobreposto, mais combinações de cores haverá quando elas se sobrepuserem. O fato da maioria das cores não estar associada a um único grupo pode causar alguma dificuldade na interpretação. Mesmo com apenas três séries, isso às vezes pode ser demais para acompanhar: três cores individuais, três sobreposições de pares, e uma cor para todos os três grupos sobrepostos totaliza sete cores no total.

Comparar duas séries é normalmente seguro, embora se uma série é sempre maior que a outra, o gráfico pode ser facilmente confundido com um gráfico de área empilhada em vez disso. Os leitores também podem ser confundidos pela interpretação das cores sobrepostas, que não estarão presentes na lenda geral. Como regra geral, se você estiver pensando em usar um gráfico de área sobreposta, limite-se a duas séries e pense se usar um gráfico de linha mostrará mais claramente a comparação entre grupos.

Considerar a ordem das linhas no gráfico de área empilhada

Embora a forma total do gráfico seja a mesma independentemente da ordem em que as linhas dos grupos são plotadas, a leitura da visualização pode ser suportada através de uma boa escolha da ordem das linhas. Uma boa regra geral é colocar os grupos maiores ou mais estáveis na parte inferior, com os grupos mais variáveis ou menores por último e no topo. Como será mencionado na seção seguinte, é preciso trabalhar para ler valores para qualquer grupo individual, exceto para o mais inferior, então é uma boa idéia fazer com que esse seja o mais importante.

Explosões comuns

Usando um gráfico de área para plotar uma única série

Como observado perto do início do artigo, o caso típico de uso para o gráfico de área é fazer uma comparação ou mostrar uma divisão de quantidades entre duas ou mais séries. Quando temos apenas uma única série de valores para plotar, muitas vezes é a escolha errada de usar um gráfico de área. A melhor opção é escolher apenas um gráfico de barras ou gráfico de linhas, dependendo do que você quer aprender ou comunicar sobre os dados.

Se queremos entender a progressão dos valores exatos ao longo do tempo e não temos muitos valores para plotar através do eixo horizontal, então um gráfico de barras é uma boa escolha. Caso contrário, um gráfico de linhas é uma melhor escolha. As linhas têm uma relação de dados/linhas mais eficiente e uma aparência mais limpa com muitos valores para plotar em comparação com as barras. Além disso, quando temos muitos valores, é provável que estejamos mais interessados na direção e inclinação das tendências do que em valores exatos, um caso em que os gráficos de linhas têm melhor desempenho.

Interpretando valores em grupos individuais em um gráfico de área empilhada

Num gráfico de área empilhada, medir valores exatos só é realmente fácil para dois casos: para o total geral e para o grupo bottommost. Para grupos intermediários, obter o valor exato da contribuição de um grupo requer encontrar a altura da linha desse grupo, e subtrair a altura da linha abaixo dela.

A tarefa torna-se ainda pior quando queremos acompanhar as mudanças ao longo do tempo. Como antes, isto é fácil para o grupo total e para o bottommost. No entanto, grupos intermediários são dificultados por uma linha de base em mudança, tornando difícil perceber as diferenças verticais exatas. O exemplo abaixo adaptado deste post do blog deixa isso claro. Enquanto a magnitude do grupo central amarelo parece mudar com o tempo, na verdade, as alturas em cada ponto são consistentes.

Se você quiser saber sobre os valores exatos do grupo e suas mudanças ao longo do tempo, então escolher um gráfico de linhas padrão será uma opção melhor, como demonstrado neste artigo do Everyday Analytics.

Opções de gráfico de área comum

Gráficos de área empilhada por porcentagem

Uma opção comum para gráficos de área é o gráfico de área empilhada por porcentagem, ou freqüência relativa. Ao invés de empilhar os valores absolutos de cada grupo em cada fatia vertical, empilhamos a contribuição relativa ou percentual de cada grupo para o total, de modo que a altura total seja sempre 100%. Este tipo de gráfico perde informação sobre a tendência dos totais absolutos (e por isso precisará de um gráfico de linhas próprio), mas ajuda a trazer à tona a comparação das contribuições relativas entre os grupos. Como bônus, este tipo de gráfico ganha uma segunda linha de base através do topo do gráfico sobre a qual as contribuições de um grupo individual podem ser aferidas.

Gráficos de linhas

O gráfico de linhas é o principal progenitor para o tipo de gráfico de área. Se você não tem certeza se um gráfico de área é o que você está interessado, usando um gráfico de linha é improvável que você se engane. Isto é especialmente verdade para o gráfico de área sobreposta, onde regiões sobrepostas podem rapidamente ficar fora de controle. Como outra consideração, é sempre possível apenas gerar mais gráficos se você estiver interessado em fazer múltiplas comparações em seus dados ao invés de apenas sentir a necessidade de escolher apenas um único tipo de gráfico para carregar o máximo possível.

Gráfico de barras e gráfico de barras empilhadas

O outro progenitor para o gráfico de área é o gráfico de barras. Mais precisamente, porém, a ligação mais próxima é entre o gráfico de área empilhada e o gráfico de barras empilhadas; não há realmente um bom análogo entre o gráfico de área sobreposta e qualquer gráfico de barras.

O gráfico de barras empilhadas é muito semelhante ao gráfico de área empilhada, apenas com barras em vez de linhas. Assim, muitas das limitações do gráfico de área empilhada também se aplicam ao gráfico de barras empilhadas. No entanto, uma vantagem das barras empilhadas é que é muito mais fácil fazer um julgamento consistente do valor dentro de cada caixa do eixo horizontal. As regiões sombreadas em um gráfico de área podem ficar distorcidas como visto acima, especialmente quando uma linha muda de direção. Como cada região é retangular em um gráfico de barras empilhadas, este tipo de distorção é evitada.

>

Plotagem de linha lateral

Uma alternativa adicional ao gráfico de área sobreposta é a trama de linha lateral. Ao invés de plotar todas as linhas e regiões coloridas no mesmo eixo, o gráfico da linha da crista coloca cada linha em um eixo diferente, cada uma com um deslocamento vertical parcial em relação às outras. Devido à natureza do offset das linhas, as marcações verticais são geralmente deixadas de fora de um traçado de linha de crista. Isto significa que os gráficos da linha da crista são mais úteis quando existe um padrão claro nos valores individuais da série com base apenas nas suas formas.

Gráfico de corrente

Um parente fantasioso do gráfico de área é o gráfico de corrente. Em um gráfico de área empilhada, todas as linhas são empilhadas umas sobre as outras sobre uma linha de base reta na parte inferior da pilha. Com um gráfico de fluxo, a linha de base é definida através do centro do gráfico, e as áreas são simetricamente reunidas ao redor da linha central. Por causa disso, é difícil medir valores precisos para qualquer grupo ou mesmo o total geral.

Como argumentado por Andy Kirk, os gráficos de fluxo são melhor usados de forma interativa quando muitos dados devem ser apresentados a uma grande audiência. A interatividade é vital para permitir que os leitores possam se aprofundar na visualização e formar suas próprias descobertas. No entanto, quando é preciso fazer julgamentos precisos ou uma apresentação estática, é melhor ater-se a uma visualização mais convencional, agregando os dados de uma forma que melhor desenha os pontos que se deseja apresentar.

Este gráfico usa os mesmos dados do gráfico da linha da crista acima.

Ferramentas de visualização

Como uma combinação de dois dos tipos de gráficos mais comuns (linha e barra), o gráfico de área é também uma opção bastante comum entre as ferramentas de visualização. Quando o gráfico de área está presente como um tipo de gráfico, a implementação usual é como um gráfico de área empilhada. Gráficos de área sobrepostos normalmente não são uma opção integrada para ferramentas de visualização, e precisarão ser criados sob medida a partir de uma base de gráfico de linha. Para algumas ferramentas, muitas vezes programáticas, a criação de qualquer tipo de gráfico de área não é uma opção básica de tipo de gráfico, e algum trabalho adicional precisará ser realizado nos dados para criar um gráfico de área a partir de áreas sombreadas e linhas.

O gráfico de área é um dos muitos tipos diferentes de gráficos que podem ser usados para visualização de dados. Aprenda mais com nossos artigos sobre tipos de gráficos essenciais, como escolher um tipo de visualização de dados, ou navegando pela coleção completa de artigos na categoria de gráficos.

admin

Deixe uma resposta

O seu endereço de email não será publicado.

lg