Qu’est-ce qu’un diagramme de surface?

Un diagramme de surface combine le diagramme linéaire et le diagramme à barres pour montrer comment les valeurs numériques d’un ou de plusieurs groupes évoluent en fonction de la progression d’une seconde variable, généralement celle du temps. Un diagramme de zone se distingue d’un diagramme linéaire par l’ajout d’un ombrage entre les lignes et d’une ligne de base, comme dans un diagramme à barres.

Ce diagramme de zone montre le nombre d’utilisateurs actifs pour une entreprise fictive basée sur le Web, calculé par mois. Les valeurs pour chaque mois peuvent être mesurées non seulement à partir de la position verticale du sommet de la forme, mais aussi de la hauteur colorée entre la ligne de base et le sommet. Dans ce graphique, nous pouvons voir que le nombre d’utilisateurs actifs a à peu près doublé de novembre 2019 à février 2020, et que le taux de gain d’utilisateurs a augmenté au fil du temps.

Quand vous devriez utiliser un graphique de surface

Alors que l’exemple ci-dessus ne trace qu’une seule ligne avec une zone ombrée, un graphique de surface est généralement utilisé avec plusieurs lignes pour faire une comparaison entre des groupes (aka séries) ou pour montrer comment un tout est divisé en parties constituantes. Cela conduit à deux types différents de graphique de surface, un pour chaque cas d’utilisation.

Graphique de surface superposée

Dans le cas où nous voulons comparer les valeurs entre les groupes, nous nous retrouvons avec un graphique de surface superposée. Dans un graphique à aires superposées, nous commençons par un graphique linéaire standard. Pour chaque groupe, un point est tracé à chaque valeur horizontale, la hauteur indiquant la valeur du groupe sur la variable d’axe vertical ; une ligne relie tous les points d’un groupe de gauche à droite. Le diagramme de surface ajoute un ombrage entre chaque ligne à une ligne de base nulle. Comme les ombres des groupes se chevauchent généralement dans une certaine mesure, une certaine transparence est incluse dans l’ombrage afin que les lignes de tous les groupes soient facilement visibles. L’ombrage aide à souligner quel groupe a la plus grande valeur en fonction de la couleur pure du groupe qui est visible.

Faites attention à ce qu’une série ne soit pas toujours plus élevée que l’autre, ou le tracé peut être confondu avec l’autre type de graphique de surface : le graphique de surface empilé. Dans ces cas, s’en tenir au graphique linéaire standard sera un meilleur choix.

Graphique à aires empilées

Généralement, lorsque le terme « graphique à aires » est utilisé, ce qui est en fait impliqué est le graphique à aires empilées. Dans le graphique à aires superposées, chaque ligne était ombrée de sa valeur verticale à une ligne de base commune. Dans le graphique à aires empilées, les lignes sont tracées une par une, la hauteur du groupe le plus récemment tracé servant de ligne de base mobile. Ainsi, la hauteur entièrement empilée de la ligne la plus élevée correspondra au total lors de la sommation de tous les groupes.

Vous utiliserez un graphique à aires empilées lorsque vous voudrez suivre non seulement la valeur totale, mais aussi comprendre la répartition de ce total par groupes. Comparer les hauteurs de chaque segment de la courbe nous permet d’avoir une idée générale de la façon dont chaque sous-groupe se compare aux autres dans leurs contributions au total.

La plupart des utilisateurs actifs proviennent de comptes de base, mais les utilisateurs premium semblent croître proportionnellement plus vite.

Exemple de structure de données

Mois Essais Basic Premium
2019-…11 154 1180 201
2019-12 157 1186 219
2020-01 170 1195 270
2020-02 180 1213 285

Les données qui doivent être représentées avec un graphique de surface sont généralement agrégées dans un tableau comportant deux colonnes ou plus. La première colonne indique les positions sur l’axe horizontal où chaque ligne sera tracée. La colonne suivante indique la contribution verticale pour chaque point, une colonne par série à tracer. Ce format est applicable à la fois pour le graphique de zones superposées et pour le graphique de zones empilées, la principale différence entre les graphiques étant la façon dont les valeurs sont interprétées pour le rendu.

Pour les graphiques de zones empilées, certains outils de visualisation exigent que les colonnes énumèrent non pas les contributions individuelles, mais plutôt les contributions cumulées. Dans ce cas, les colonnes spécifient directement les hauteurs de ligne, et les contributions de chaque groupe sont impliquées par la différence de valeurs entre les colonnes.

Mois Trials + Basic + Premium
2019-11 154 1334 1535
2019-12 157 1343 1562
2020-01 170 1365 1635
2020-02 180 1393 1678

Bonnes pratiques pour l’utilisation d’un diagramme de surface

Inclure une ligne de base zéro

Bien qu’un diagramme linéaire ne soit pas restreint à la nécessité d’une ligne de base zéro, l’ajout d’ombrage signifie que les hauteurs des régions colorées seront utilisées pour comparer la taille des valeurs de chaque groupe. Ainsi, comme dans le cas d’un diagramme à barres, il est obligatoire d’avoir une ligne de base zéro par rapport à laquelle l’ombrage doit être effectué. Couper l’axe aurait pour conséquence que le rapport réel des valeurs des groupes ne corresponde pas à ce qui est impliqué par le graphique généré.

Une exception à cette règle peut survenir lorsque nous comparons deux séries dans un graphique à zones superposées avec une modification de la règle d’ombrage. Si nous limitons l’ombrage à être entre les lignes, plutôt que des deux lignes à une ligne de base commune, alors nous pouvons zoomer les limites de l’axe vertical dans l’effet d’intérêt sans ligne de base. L’ombrage prend maintenant une signification différente, avec la couleur indiquant quel groupe comme une plus grande valeur, et la quantité de couleur la taille de la différence.

Limiter le nombre de séries dans un graphique de zone de chevauchement

Plus nous avons de séries dans un graphique de zone de chevauchement, plus il y aura de combinaisons de couleurs lorsqu’elles se chevauchent. Le fait que la plupart des couleurs ne seront pas associées à un seul groupe peut causer quelques difficultés d’interprétation. Même avec seulement trois séries, cela peut parfois être trop à suivre : trois couleurs individuelles, trois chevauchements par paire, et une couleur pour les trois groupes qui se chevauchent totalisent sept couleurs en tout.

Comparer deux séries est généralement sûr, bien que si une série est toujours plus grande que l’autre, le graphique peut facilement être confondu avec un graphique d’aires empilées à la place. Les lecteurs peuvent également être confus en interprétant les couleurs superposées, qui ne seront pas présentes dans la légende générale. En règle générale, si vous envisagez d’utiliser un graphique à aires superposées, limitez-vous à deux séries et demandez-vous si l’utilisation d’un graphique linéaire permettra de montrer plus clairement la comparaison entre les groupes.

Considérer l’ordre des lignes dans un graphique à aires superposées

Bien que la forme totale du graphique sera la même quel que soit l’ordre dans lequel les lignes des groupes sont tracées, la lecture de la visualisation peut être facilitée par un bon choix de l’ordre des lignes. Une bonne règle empirique consiste à placer les groupes les plus grands ou les plus stables en bas, et les groupes les plus variables ou les plus petits en dernier et en haut. Comme il sera mentionné dans la section suivante, il faut du travail pour lire les valeurs de n’importe quel groupe individuel à l’exception du plus bas, c’est donc une bonne idée de faire en sorte que celui-ci soit le plus important.

Mauvais usages courants

Utilisation d’un graphique de surface pour tracer une seule série

Comme indiqué vers le début de l’article, le cas d’utilisation typique du graphique de surface est de faire une comparaison ou de montrer une division des quantités entre deux séries ou plus. Lorsque nous avons juste une seule série de valeurs à tracer, c’est souvent le mauvais choix d’utiliser un graphique de surface. La meilleure option est de choisir juste un diagramme à barres ou un diagramme linéaire, selon ce que vous voulez apprendre ou communiquer sur les données.

Si nous voulons comprendre la progression de valeurs exactes dans le temps et que nous n’avons pas trop de valeurs à tracer sur l’axe horizontal, alors un diagramme à barres est un bon choix. Sinon, un graphique en ligne est un meilleur choix. Les lignes présentent un rapport données/encre plus efficace et un aspect plus net lorsque le nombre de valeurs à représenter est élevé, contrairement aux barres. De plus, lorsque nous avons beaucoup de valeurs, nous sommes susceptibles d’être plus intéressés par la direction et la pente des tendances plutôt que par les valeurs exactes, un cas où les diagrammes linéaires sont plus performants.

Interpréter les valeurs sur les groupes individuels dans un diagramme de surface empilé

Dans un diagramme de surface empilé, jauger les valeurs exactes n’est vraiment facile que pour deux cas : pour le total global et pour le groupe le plus bas. Pour les groupes intermédiaires, obtenir la valeur exacte de la contribution d’un groupe nécessite de trouver la hauteur de la ligne de ce groupe, et de soustraire la hauteur de la ligne en dessous.

La tâche se complique encore lorsque nous voulons suivre les changements dans le temps. Comme précédemment, cela est facile pour le total et le groupe le plus bas. Cependant, les groupes intermédiaires sont gênés par une ligne de base changeante, ce qui rend difficile la perception des différences verticales exactes. L’exemple ci-dessous, adapté de cet article de blog, le montre clairement. Alors que l’ampleur du groupe jaune central semble changer au fil du temps, en fait, les hauteurs à chaque point sont cohérentes.

Si vous voulez connaître les valeurs exactes des groupes et leurs changements au fil du temps, alors choisir un graphique linéaire standard sera une meilleure option, comme le démontre cet article de Everyday Analytics.

Options courantes de diagramme de zone

Graphique de zone empilée en pourcentage

Une option courante pour les graphiques de zone est le graphique de zone empilée en pourcentage, ou en fréquence relative. Plutôt que d’empiler les valeurs absolues de chaque groupe à chaque tranche verticale, on empile la contribution relative ou en pourcentage de chaque groupe au total, de sorte que la hauteur globale soit toujours de 100 %. Ce type de graphique perd des informations sur la tendance des totaux absolus (et nécessite donc son propre graphique linéaire) mais permet de faire ressortir la comparaison des contributions relatives entre les groupes. En prime, ce type de graphique gagne une deuxième ligne de base en haut du tracé sur laquelle les contributions d’un groupe individuel peuvent être évaluées.

Graphique linéaire

Le graphique linéaire est le principal géniteur du type de graphique de surface. Si vous n’êtes pas sûr qu’un diagramme de zone soit ce qui vous intéresse, l’utilisation d’un diagramme linéaire a peu de chances de vous induire en erreur. Cela est particulièrement vrai pour le graphique de zones de chevauchement, où les régions qui se chevauchent peuvent rapidement devenir incontrôlables. Comme autre considération, il est toujours possible de juste générer plus de graphiques si vous êtes intéressé à faire des comparaisons multiples dans vos données plutôt que de juste sentir le besoin de choisir un seul type de graphique pour porter autant que possible.

Diagramme à barres et diagramme à barres empilées

L’autre progéniteur pour le diagramme de zone est le diagramme à barres. Plus précisément, cependant, le lien le plus étroit est entre le diagramme de zone empilé et le diagramme à barres empilées ; il n’y a pas vraiment de bon analogue entre le diagramme de zone empilé et n’importe quel diagramme à barres.

Le diagramme à barres empilées est très similaire au diagramme de zone empilé, juste avec des barres au lieu de lignes. Ainsi, de nombreuses limitations du graphique à aires superposées s’appliquent également au graphique à barres superposées. Cependant, l’un des avantages des barres empilées est qu’il est beaucoup plus facile de porter un jugement de valeur cohérent dans chaque case de l’axe horizontal. Les régions ombragées d’un diagramme de zone peuvent se déformer, comme nous l’avons vu ci-dessus, surtout lorsqu’une ligne change de direction. Puisque chaque région est rectangulaire dans un diagramme à barres empilées, ce type de distorsion est évité.

Tracé de ligne de crête

Une alternative supplémentaire au diagramme de zone de chevauchement est le tracé de ligne de crête. Plutôt que de tracer toutes les lignes et régions colorées sur le même axe, le tracé ridgeline place chaque ligne sur un axe différent, chacune avec un décalage vertical partiel par rapport aux autres. En raison de la nature décalée des lignes, les marques verticales sont généralement laissées de côté dans un tracé de ligne de crête. Cela signifie que les diagrammes de ligne de crête sont les plus utiles lorsqu’il existe un modèle clair dans les valeurs des séries individuelles sur la base de leurs formes seules.

Graphe de flux

Un parent fantaisiste du diagramme de zone est le graphique de flux. Dans un diagramme de surface empilé, toutes les lignes sont empilées les unes sur les autres sur une ligne de base droite au bas de la pile. Dans le cas d’un diagramme de flux, la ligne de base est fixée au centre du diagramme et les zones sont rassemblées symétriquement autour de la ligne centrale. De ce fait, il est difficile d’évaluer des valeurs précises pour tout groupe ou même le total général.

Comme le soutient Andy Kirk, les graphiques de flux sont mieux utilisés sous une forme interactive lorsque beaucoup de données doivent être présentées à un large public. L’interactivité est essentielle pour permettre aux lecteurs de creuser dans la visualisation et de former leurs propres conclusions. Cependant, lorsque des jugements précis doivent être portés ou qu’une présentation statique doit être faite, il est préférable de s’en tenir à une visualisation plus conventionnelle, en agrégeant les données de manière à faire ressortir au mieux les points que vous souhaitez présenter.

Ce tracé utilise les mêmes données que le tracé de ligne de crête ci-dessus.

Outils de visualisation

En tant que combinaison de deux des types de graphiques les plus courants (ligne et barre), le tracé de surface est également une option de graphique assez courante parmi les outils de visualisation. Lorsque le graphique en aires est présent en tant que type de graphique, l’implémentation habituelle est un graphique en aires empilées. Les graphiques à aires superposées ne sont généralement pas une option intégrée aux outils de visualisation, et doivent être créés sur mesure à partir d’un graphique linéaire. Pour certains outils, souvent programmatiques, la création de l’un ou l’autre type de graphique de zone n’est pas une option de type de graphique de base, et un travail supplémentaire devra être effectué sur les données pour créer un graphique de zone à partir de zones ombrées et de lignes.

Le graphique de zone est l’un des nombreux types de graphiques qui peuvent être utilisés pour visualiser des données. Apprenez-en davantage grâce à nos articles sur les types de graphiques essentiels, sur la façon de choisir un type de visualisation des données, ou en parcourant la collection complète d’articles de la catégorie des graphiques.

admin

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

lg