La modellazione dimensionale rappresenta i dati con un’operazione a cubo, rendendo più adatta la rappresentazione logica dei dati con la gestione dei dati OLAP. La percezione della modellazione dimensionale è stata sviluppata da Ralph Kimball ed è composta da tabelle “fact” e “dimension”.

Nella modellazione dimensionale, il record della transazione è diviso in “fatti”, che sono spesso dati numerici della transazione, o “dimensioni”, che sono le informazioni di riferimento che danno contesto ai fatti. Per esempio, una transazione di vendita può essere danneggiata in fatti come il numero di prodotti ordinati e il prezzo pagato per i prodotti, e in dimensioni come la data dell’ordine, il nome dell’utente, il numero del prodotto, le località di spedizione e fatturazione dell’ordine, e il venditore responsabile della ricezione dell’ordine.

Obiettivi della modellazione dimensionale

Gli scopi della modellazione dimensionale sono:

  1. Per produrre un’architettura di database che sia facile da capire per i clienti finali e scrivere query.
  2. Per massimizzare l’efficienza delle query. Raggiunge questi obiettivi minimizzando il numero di tabelle e le relazioni tra loro.

Avantaggi della modellazione dimensionale

Seguono i vantaggi della modellazione dimensionale:

La modellazione dimensionale è semplice: I metodi di modellazione dimensionale permettono ai progettisti del magazzino di creare schemi di database che i clienti aziendali possono facilmente tenere e comprendere. Non c’è bisogno di una vasta formazione su come leggere gli schemi, e non ci sono relazioni complicate tra i diversi elementi di dati.

La modellazione dimensionale promuove la qualità dei dati: Lo schema a stella permette agli amministratori di magazzino di applicare controlli di integrità referenziale sul magazzino di dati. Dal momento che la chiave di informazione fattuale è una concatenazione degli elementi essenziali delle sue dimensioni associate, un record fattuale viene caricato attivamente se i record delle dimensioni corrispondenti sono debitamente descritti ed esistono anche nel database.

Facendo rispettare i vincoli di chiave esterna come forma di controllo di integrità referenziale, i DBA del data warehouse aggiungono una linea di difesa contro i dati del magazzino corrotti.

L’ottimizzazione delle prestazioni è possibile attraverso gli aggregati: Man mano che le dimensioni del data warehouse aumentano, l’ottimizzazione delle prestazioni diventa una preoccupazione pressante. I clienti che devono aspettare ore per ottenere una risposta a una query si scoraggiano rapidamente con i magazzini. Gli aggregati sono uno dei metodi più semplici con cui le prestazioni delle query possono essere ottimizzate.

Svantaggi della modellazione dimensionale

  1. Per mantenere l’integrità di fatti e dimensioni, caricare i magazzini di dati con un record da vari sistemi operativi è complicato.
  2. È difficile modificare il funzionamento del data warehouse se l’organizzazione che adotta la tecnica dimensionale cambia il metodo con cui fa affari.

Elementi della modellazione dimensionale

Fatto

È un insieme di elementi di dati associati, consistenti in misure e dati di contesto. Rappresenta tipicamente elementi di business o transazioni di business.

Dimensioni

È un insieme di dati che descrivono una dimensione di business. Le dimensioni decidono lo sfondo contestuale per i fatti, e sono il quadro su cui viene eseguito l’OLAP.

Misura

È un attributo numerico di un fatto, che rappresenta la performance o il comportamento del business rispetto alle dimensioni.

Considerando il contesto relazionale, ci sono due modelli di base che sono usati nella modellazione dimensionale:

  • Star Model
  • Snowflake Model

Il modello a stella è la struttura sottostante per un modello dimensionale. Ha un’ampia tabella centrale (tabella dei fatti) e un insieme di tabelle più piccole (dimensioni) disposte a raggiera intorno alla tabella primaria. Il modello a fiocco di neve è la conclusione della decomposizione di una o più dimensioni.

Tabella dei fatti

Le tabelle dei fatti sono usate per i dati di fatti o misure nel business. I fatti sono gli elementi di dati numerici che sono di interesse per l’azienda.

Caratteristiche della tabella dei fatti

La tabella dei fatti include valori numerici di ciò che si misura. Per esempio, un valore fact di 20 potrebbe significare che 20 widget sono stati venduti.

Ogni tabella fact include le chiavi delle tabelle di dimensione associate. Queste sono conosciute come chiavi esterne nella tabella dei fatti.

Le tabelle dei fatti includono tipicamente un piccolo numero di colonne.

Se paragonate alle tabelle delle dimensioni, le tabelle dei fatti hanno un grande numero di righe.

Tabella delle dimensioni

Le tabelle delle dimensioni stabiliscono il contesto dei fatti. Le tabelle dimensionali memorizzano i campi che descrivono i fatti.

Caratteristiche della tabella dimensionale

Le tabelle dimensionali contengono i dettagli sui fatti. Questo, per esempio, permette agli analisti di business di capire meglio i dati e i loro rapporti.

Le tabelle di dimensione includono dati descrittivi sui valori numerici nella tabella dei fatti. Cioè, contengono gli attributi dei fatti. Per esempio, le tabelle di dimensione per una funzione di analisi di marketing potrebbero includere attributi come tempo, regione di marketing e tipo di prodotto.

Siccome il record in una tabella di dimensione è denormalizzato, di solito ha un gran numero di colonne. Le tabelle di dimensione includono significativamente meno righe di informazioni rispetto alla tabella dei fatti.

Gli attributi in una tabella di dimensione sono usati come intestazioni di riga e colonna in un documento o nella visualizzazione dei risultati di una query.

Esempio: Una città e uno stato possono visualizzare un riepilogo del negozio in una tabella dei fatti. Il riepilogo degli articoli può essere visualizzato per marca, colore, ecc. Le informazioni sui clienti possono essere visualizzate per nome e indirizzo.

Tabella dei fatti

Identità temporale Identità prodotto Identità cliente Unità venduta
4 17 2 1
8 21 3 2
8 4 1 1

In questo esempio, La colonna ID cliente nella tabella dei fatti è la chiave esterna che si unisce alla tabella delle dimensioni. Seguendo i collegamenti, possiamo vedere che la riga 2 della tabella dei fatti registra il fatto che il cliente 3, Gaurav, ha comprato due articoli il giorno 8.

Tabelle delle dimensioni

Identificativo del cliente Nome Gender Reddito Istruzione Regione
1 Rohan Maschio 2 3 4
2 Sandeep Maschio 3 5 1
3 Gaurav Maschio 1 7 3

Gerarchia

Una gerarchia è un albero diretto i cui nodi sono attributi dimensionali e i cui archi modellano molte associazioni tra team di attributi dimensionali. Contiene una dimensione, posizionata alla radice dell’albero, e tutti gli attributi dimensionali che la definiscono.

admin

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

lg