Dimensionell modellering representerar data med en kuboperation, vilket gör den logiska datarepresentationen mer lämplig för OLAP-datahantering. Uppfattningen om dimensionell modellering utvecklades av Ralph Kimball och består av ”fakta-” och ”dimensionstabeller”.
I dimensionell modellering delas transaktionsregistret in i antingen ”fakta”, som ofta är numeriska transaktionsdata, eller ”dimensioner”, som är den referensinformation som ger sammanhang till fakta. En försäljningstransaktion kan till exempel delas upp i fakta som antalet beställda produkter och det pris som betalats för produkterna, och i dimensioner som beställningsdatum, användarnamn, produktnummer, plats för leverans och fakturering av beställningen, och säljare som ansvarar för att ta emot beställningen.
Syfte med dimensionell modellering
Syftet med dimensionell modellering är:
- Att ta fram en databasarkitektur som är lätt för slutkunder att förstå och skriva förfrågningar.
- Att maximera effektiviteten i förfrågningar. Man uppnår dessa mål genom att minimera antalet tabeller och relationer mellan dem.
Fördelar med dimensionell modellering
Följande är fördelarna med dimensionell modellering är:
Dimensionell modellering är enkel: Dimensionella modelleringsmetoder gör det möjligt för lagerkonstruktörer att skapa databasscheman som företagskunder lätt kan hålla och förstå. Det behövs ingen omfattande utbildning i hur man läser scheman, och det finns inget komplicerat förhållande mellan olika dataelement.
Dimensionell modellering främjar datakvalitet: Stjärnschemat gör det möjligt för lageradministratörer att genomdriva referentiell integritetskontroller i datalagret. Eftersom faktainformationsnyckeln är en sammanlänkning av de väsentliga delarna av dess associerade dimensioner, laddas en faktapost aktivt om motsvarande dimensionsposter är vederbörligen beskrivna och också finns i databasen.
Då datalager-databasförvaltare genom att genomdriva begränsningar med främmande nycklar som en form av referentiell integritetskontroll lägger de till en försvarslinje mot korrumperade lagerdata.
Performansoptimering är möjlig med hjälp av aggregat: I takt med att datalagrets storlek ökar utvecklas prestandaoptimering till ett angeläget problem. Kunder som måste vänta i timmar på att få svar på en fråga blir snabbt avskräckta av lagren. Aggregat är en av de enklaste metoderna för att optimera prestanda för förfrågningar.
Nackdelar med dimensionell modellering
- För att bibehålla integriteten hos fakta och dimensioner är det komplicerat att ladda datalager med en post från olika verksamhetssystem.
- Det är svårt att ändra datalagerverksamheten om den organisation som antar den dimensionella tekniken ändrar sin metod för att bedriva affärsverksamhet.
Element av dimensionell modellering
Fakta
Det är en samling associerade dataelement, som består av mått och kontextdata. Den representerar vanligtvis affärsobjekt eller affärstransaktioner.
Dimensioner
Det är en samling data som beskriver en affärsdimension. Dimensioner bestämmer den kontextuella bakgrunden för fakta och utgör den ram över vilken OLAP utförs.
Mått
Det är ett numeriskt attribut för ett faktum som representerar verksamhetens prestanda eller beteende i förhållande till dimensionerna.
Med tanke på det relationella sammanhanget finns det två grundläggande modeller som används vid dimensionell modellering:
- Stjärnmodellen
- Snowflake-modellen
Stjärnmodellen är den underliggande strukturen för en dimensionell modell. Den har en bred central tabell (faktatabell) och en uppsättning mindre tabeller (dimensioner) som är arrangerade i en radiell design runt den primära tabellen. Snöflingemodellen är slutsatsen av att dekomponera en eller flera av dimensionerna.
Fakttabell
Fakttabeller används för att data fakta eller åtgärder i verksamheten. Fakta är de numeriska dataelement som är av intresse för företaget.
Kännetecken för faktatabellen
Fakttabellen innehåller numeriska värden för det vi mäter. Till exempel kan ett faktavärde på 20 betyda att 20 widgets har sålts.
Varje faktatabell innehåller nycklar till tillhörande dimensionstabeller. Dessa kallas utländska nycklar i faktatabellen.
Fakttabeller innehåller vanligtvis ett litet antal kolumner.
När det jämförs med dimensionstabeller har faktatabeller ett stort antal rader.
Dimensionstabell
Dimensionstabeller fastställer sammanhanget för fakta. Dimensionstabeller lagrar fält som beskriver fakta.
Dimensionstabellens egenskaper
Dimensionstabeller innehåller detaljer om fakta. Det gör det till exempel möjligt för affärsanalytiker att förstå data och deras rapporter bättre.
Dimensionstabellerna innehåller beskrivande data om de numeriska värdena i faktatabellen. Det vill säga, de innehåller attribut för fakta. Dimensionstabellerna för en marknadsföringsanalysfunktion kan till exempel innehålla attribut som tid, marknadsföringsregion och produkttyp.
Då posten i en dimensionstabell är denormaliserad har den vanligtvis ett stort antal kolumner. Dimensionstabellerna innehåller betydligt färre informationsrader än faktatabellen.
Attributen i en dimensionstabell används som rad- och kolumnrubriker i en dokument- eller frågeresultatvisning.
Exempel: En stad och ett land kan visa en butikssammanfattning i en faktatabell. En artikelsammanfattning kan visas efter märke, färg osv. Kundinformation kan visas efter namn och adress.
Fakttabell
Tids-ID | Produkt-ID | Kund-ID | Såld enhet | |
---|---|---|---|---|
4 | 17 | 2 | 1 | |
8 | 21 | 3 | 2 | |
8 | 4 | 1 | 1 | 1 |
I detta exempel, Kolumnen kund-ID i tabellen fakta är de främmande nycklar som kopplas till dimensionstabellen. Genom att följa länkarna kan vi se att rad 2 i faktatabellen registrerar det faktum att kund 3, Gaurav, köpte två varor på dag 8.
Dimensionstabeller
Kund-ID | Namn | Kön | Kön | Inkomst | Utbildning | Region |
---|---|---|---|---|---|---|
1 | Rohan | Man | 2 | 3 | 4 | |
2 | Sandeep | Man | 3 | 5 | 1 | |
3 | Gaurav | Man | 1 | 7 | 3 |
Hierarki
En hierarki är ett riktat träd vars noder är dimensionella attribut och vars bågar modellerar många till ett samband mellan dimensionella attribut team. Den innehåller en dimension, placerad vid trädets rot, och alla dimensionella attribut som definierar den.