A modelação dimensional representa dados com uma operação em cubo, tornando mais adequada a representação lógica dos dados com a gestão de dados OLAP. A percepção da Modelagem Dimensional foi desenvolvida por Ralph Kimball e consiste em tabelas de “fatos” e “dimensões”.
Na modelagem dimensional, o registro da transação é dividido em “fatos”, que são freqüentemente dados de transação numéricos, ou “dimensões”, que são as informações de referência que dão contexto aos fatos. Por exemplo, uma transação de venda pode ser danificada em fatos como o número de produtos pedidos e o preço pago pelos produtos, e em dimensões como data do pedido, nome do usuário, número do produto, número do pedido de entrega e faturamento, e vendedor responsável pelo recebimento do pedido.
Objetivos da Modelagem Dimensional
Os objetivos da modelagem dimensional são:
- Produzir arquitetura de banco de dados que seja fácil para os clientes finais entenderem e escreverem consultas.
- Maximizar a eficiência das consultas. Atinge esses objetivos minimizando o número de tabelas e relações entre elas.
Vantagens da Modelagem Dimensional
Os benefícios da modelagem dimensional são:
A modelagem dimensional é simples: Os métodos de modelação dimensional permitem aos designers de armazém criar esquemas de base de dados que os clientes empresariais podem facilmente manter e compreender. Não há necessidade de uma vasta formação sobre como ler diagramas, e não há uma relação complicada entre os diferentes elementos de dados.
A modelagem dimensional promove a qualidade dos dados: O esquema em estrela permite que os administradores do armazém possam impor verificações de integridade referenciais no armazém de dados. Como a chave de informação de fatos é uma concatenação dos essenciais de suas dimensões associadas, um registro factual é carregado ativamente se os registros de dimensões correspondentes forem devidamente descritos e também existirem na base de dados.
Aplicando restrições de chave estrangeira como uma forma de verificação de integridade referencial, os DBAs do data warehouse adicionam uma linha de defesa contra dados corrompidos do data warehouse.
Otimização de desempenho é possível através de agregados: À medida que o tamanho do data warehouse aumenta, a otimização do desempenho evolui para uma preocupação premente. Os clientes que têm de esperar horas para obter uma resposta a uma consulta, rapidamente se desencorajam com os armazéns. Os agregados são um dos métodos mais fáceis pelos quais o desempenho da consulta pode ser otimizado.
Desvantagens da Modelagem Dimensional
- Para manter a integridade de fatos e dimensões, carregar os data warehouses com um registro de vários sistemas operacionais é complicado.
- É grave modificar a operação do data warehouse se a organização adotando a técnica dimensional mudar o método no qual ela faz negócios.
Elementos de Modelagem Dimensional
Fato
É uma coleção de itens de dados associados, consistindo de medidas e dados de contexto. Normalmente representa itens de negócios ou transações comerciais.
Dimensões
É uma coleção de dados que descrevem uma dimensão de negócio. As dimensões decidem o contexto dos fatos, e são a estrutura sobre a qual a OLAP é realizada.
Medida
É um atributo numérico de um fato, representando o desempenho ou comportamento do negócio em relação às dimensões.
Considerando o contexto relacional, existem dois modelos básicos que são usados na modelagem dimensional:
- Modelo Estrela
- Modelo Floco de Neve
Modelo Estrela é a estrutura subjacente a um modelo dimensional. Tem uma mesa central ampla (tabela de fatos) e um conjunto de mesas menores (dimensões) dispostas em um desenho radial em torno da mesa principal. O modelo floco de neve é a conclusão da decomposição de uma ou mais das dimensões.
Tabela de fatos
Tabelas de fatos são usadas para dados de fatos ou medidas no negócio. Fatos são os elementos de dados numéricos que são de interesse para a empresa.
Características da tabela de Fatos
A tabela de fatos inclui valores numéricos do que medimos. Por exemplo, um valor de fato de 20 pode significar que 20 widgets foram vendidos.
A tabela de fatos inclui as chaves das tabelas de dimensões associadas. Estas são conhecidas como chaves estrangeiras na tabela de fatos.
As tabelas de fatos normalmente incluem um pequeno número de colunas.
Quando comparadas com as tabelas de dimensões, as tabelas de fatos têm um grande número de linhas.
Tabela de dimensões
Tabelas de dimensões estabelecem o contexto dos fatos. Tabelas dimensionais armazenam campos que descrevem os fatos.
Características da tabela de dimensões
Tabelas dimensionais contêm os detalhes sobre os fatos. Isso, como exemplo, permite aos analistas de negócio entender melhor os dados e seus relatórios.
As tabelas de dimensões incluem dados descritivos sobre os valores numéricos na tabela de fatos. Ou seja, elas contêm os atributos dos fatos. Por exemplo, as tabelas de dimensões para uma função de análise de marketing podem incluir atributos como tempo, região de marketing e tipo de produto.
Desde que o registro em uma tabela de dimensões seja desnormalizado, ela normalmente tem um grande número de colunas. As tabelas de dimensões incluem significativamente menos linhas de informação do que a tabela de fatos.
Os atributos em uma tabela de dimensões são usados como títulos de linha e coluna em um documento ou exibição de resultados de consulta.
Exemplo: Uma cidade e um estado podem ver um resumo da loja em uma tabela de fatos. O resumo do item pode ser visualizado por marca, cor, etc. As informações do cliente podem ser visualizadas por nome e endereço.
tabela de fatos
DNI do tempo | DNI do produto | DNI do cliente | Unidade vendida |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
Neste exemplo, A coluna ID do cliente na tabela de fatos são as chaves estrangeiras que se unem à tabela de dimensões. Ao seguir os links, podemos ver que a linha 2 da tabela de fatos registra o fato de que o cliente 3, Gaurav, comprou dois itens no dia 8.
Tabelas de dimensão
ID do cliente | Nome | Gênero | Income | Educação | Região |
---|---|---|---|---|---|
1 | Rohan | Mal | 2 | 3 | 4 |
2 | Sandeep | Mal | 3 | 5 | 1 |
3 | Gaurav | Mal | 1 | 7 | 3 |
Hierarquia
Uma hierarquia é uma árvore dirigida cujos nós são atributos dimensionais e cujos arcos modelam muitos a uma associação entre equipe de atributos dimensionais. Ela contém uma dimensão, posicionada na raiz da árvore, e todos os atributos dimensionais que a definem.