Dimensionale modellering vertegenwoordigt gegevens met een kubus operatie, waardoor meer geschikt logische weergave van gegevens met OLAP data management. De perceptie van Dimensional Modeling werd ontwikkeld door Ralph Kimball en bestaat uit “feit” en “dimensie” tabellen.
In dimensionele modellering, wordt de transactierecord verdeeld in ofwel “feiten,” die vaak numerieke transactiegegevens zijn, of “dimensies,” die de referentie-informatie zijn die context geven aan de feiten. Bijvoorbeeld, een verkooptransactie kan worden beschadigd in feiten zoals het aantal bestelde producten en de prijs betaald voor de producten, en in dimensies zoals orderdatum, gebruikersnaam, productnummer, order ship-to, en bill-to locaties, en de verkoper die verantwoordelijk is voor het ontvangen van de bestelling.
Doelstellingen van dimensionale modellering
De doelstellingen van dimensionale modellering zijn:
- Een database-architectuur produceren die voor eindklanten gemakkelijk te begrijpen is en query’s te schrijven.
- De efficiëntie van query’s maximaliseren. Het bereikt deze doelen door het minimaliseren van het aantal tabellen en relaties tussen hen.
Voordelen van dimensionale modellering
Volgende zijn de voordelen van dimensionale modellering zijn:
Dimensionale modellering is eenvoudig: Dimensionele modelleringsmethoden maken het mogelijk voor magazijnontwerpers om databaseschema’s te maken die zakelijke klanten gemakkelijk kunnen vasthouden en begrijpen. Er is geen behoefte aan een uitgebreide opleiding over hoe diagrammen te lezen, en er is geen ingewikkelde relatie tussen verschillende gegevenselementen.
Dimensionale modellering bevordert de kwaliteit van gegevens: Het sterrenschema stelt magazijnbeheerders in staat om referentiële integriteitscontroles op het datawarehouse af te dwingen. Aangezien de feitelijke informatiesleutel een aaneenschakeling is van de essenties van de bijbehorende dimensies, wordt een feitelijk record actief geladen als de corresponderende dimensierecords naar behoren zijn beschreven en ook bestaan in de database.
Door het afdwingen van foreign key constraints als een vorm van referentiële integriteitscontrole, voegen datawarehouse DBA’s een verdedigingslinie toe tegen corrupte magazijngegevens.
Prestatieoptimalisatie is mogelijk door aggregaten: Naarmate de omvang van het datawarehouse toeneemt, ontwikkelt performance-optimalisatie zich tot een dringende zorg. Klanten die uren moeten wachten op een antwoord op een query zullen snel ontmoedigd raken over de magazijnen. Aggregaten zijn een van de gemakkelijkste methoden waarmee de prestaties van query’s kunnen worden geoptimaliseerd.
Voordelen van dimensionale modellering
- Om de integriteit van feiten en dimensies te handhaven, is het laden van de data warehouses met een record uit verschillende operationele systemen gecompliceerd.
- Het is moeilijk om de werking van het data warehouse te wijzigen als de organisatie die de dimensionale techniek toepast, de methode verandert waarop zij zaken doet.
Elementen van dimensionale modellering
Fact
Het is een verzameling van geassocieerde gegevensitems, bestaande uit maatregelen en contextgegevens. Het vertegenwoordigt gewoonlijk bedrijfsitems of bedrijfstransacties.
Dimensies
Het is een verzameling van gegevens die één bedrijfsdimensie beschrijven. Dimensies bepalen de contextuele achtergrond voor de feiten, en zij vormen het kader waarover OLAP wordt uitgevoerd.
Measure
Het is een numeriek attribuut van een feit, dat de prestaties of het gedrag van het bedrijf ten opzichte van de dimensies weergeeft.
Gezien de relationele context, zijn er twee basismodellen die worden gebruikt bij dimensionale modellering:
- Star Model
- Snowflake Model
Het stermodel is de onderliggende structuur voor een dimensioneel model. Het heeft één brede centrale tabel (feitentabel) en een reeks kleinere tabellen (dimensies) die in een radiaal ontwerp rond de primaire tabel zijn gerangschikt. Het sneeuwvlokmodel is de conclusie van de decompositie van een of meer van de dimensies.
Fact tabel
Fact tabellen worden gebruikt om gegevens feiten of maatregelen in het bedrijf. Feiten zijn de numerieke gegevenselementen die van belang zijn voor het bedrijf.
Karakteristieken van de feitentabel
De feitentabel bevat numerieke waarden van wat we meten. Bijvoorbeeld, een feitwaarde van 20 zou kunnen betekenen dat 20 widgets zijn verkocht.
Elke feitentabel bevat de sleutels tot geassocieerde dimensie tabellen. Deze staan bekend als foreign keys in de feitentabel.
Factentabellen bevatten doorgaans een klein aantal kolommen.
In vergelijking met dimensietabellen hebben feitentabellen een groot aantal rijen.
Dimensietabel
Dimensietabellen bepalen de context van de feiten. Dimensietabellen slaan velden op die de feiten beschrijven.
Karakteristieken van de Dimensietabel
Dimensietabellen bevatten de details over de feiten. Dat stelt bijvoorbeeld de bedrijfsanalisten in staat de gegevens en hun rapporten beter te begrijpen.
De dimensietabellen bevatten beschrijvende gegevens over de numerieke waarden in de feitentabel. Dat wil zeggen, ze bevatten de attributen van de feiten. De dimensietabellen voor een marketinganalysefunctie kunnen bijvoorbeeld attributen bevatten als tijd, marketingregio en producttype.
Omdat het record in een dimensietabel is gedenormaliseerd, heeft het gewoonlijk een groot aantal kolommen. De dimensietabellen bevatten aanzienlijk minder rijen informatie dan de feitentabel.
De attributen in een dimensietabel worden gebruikt als rij- en kolomkoppen in een document of weergave van queryresultaten.
Voorbeeld: Een stad en staat kunnen een winkeloverzicht in een feitentabel bekijken. Item overzicht kan worden bekeken op merk, kleur, enz. Klantgegevens kunnen worden bekeken op naam en adres.
Fact tabel
Tijd-ID | Product-ID | Klant-ID | Gekochte eenheid |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
In dit voorbeeld, Klant ID kolom in de feiten tabel is de foreign key die join met de dimensie tabel. Door de links te volgen, kunnen we zien dat rij 2 van de feitentabel het feit registreert dat klant 3, Gaurav, twee artikelen kocht op dag 8.
Dimensietabellen
Klant-ID | Naam | Geslacht | Inkomen | Onderwijs | Regio |
---|---|---|---|---|---|
1 | Rohan | Mannelijk | 2 | 3 | 4 |
2 | Sandeep | Mannelijk | 3 | 5 | 1 |
3 | Gaurav | Mannelijk | 1 | 7 | 3 |
Hiërarchie
Een hiërarchie is een gerichte boom waarvan de knopen dimensionale attributen zijn en waarvan de bogen veel op één associatie tussen dimensionale attributen team modelleren. Het bevat een dimensie, gepositioneerd aan de wortel van de boom, en alle dimensionale attributen die het definiëren.