Dimensiomallinnus edustaa dataa kuutio-operaatiolla, mikä tekee siitä sopivamman loogisen datan esityksen OLAP-tiedonhallinnan kanssa. Ralph Kimball kehitti ulottuvuusmallinnuksen käsityksen, ja se koostuu ”fakta”- ja ”ulottuvuus”-taulukoista.
Dimensionaalisessa mallinnuksessa tapahtumatietue jaetaan joko ”faktoihin”, jotka ovat usein numeerisia tapahtumatietoja, tai ”ulottuvuuksiin”, jotka ovat viitetietoja, jotka antavat kontekstin faktoille. Esimerkiksi myyntitapahtuma voidaan jakaa tosiseikkoihin, kuten tilattujen tuotteiden lukumäärään ja tuotteista maksettuun hintaan, ja ulottuvuuksiin, kuten tilauspäivämäärä, käyttäjän nimi, tuotenumero, tilauksen toimitus- ja laskutuspaikat sekä tilauksen vastaanottamisesta vastaava myyjä.
Dimensiomallinnuksen tavoitteet
Dimensiomallinnuksen tavoitteet ovat:
- Tuottaa tietokanta-arkkitehtuuri, jota loppuasiakkaiden on helppo ymmärtää ja kirjoittaa kyselyitä.
- Maksimoida kyselyiden tehokkuus. Nämä tavoitteet saavutetaan minimoimalla taulukoiden ja niiden välisten suhteiden määrä.
Dimensiomallinnuksen edut
Seuraavat ovat dimensiomallinnuksen edut ovat:
Dimensiomallinnus on yksinkertaista: Dimensiomallinnusmenetelmät mahdollistavat sen, että varastosuunnittelijat voivat luoda tietokantakaavioita, joita yritysasiakkaat voivat helposti pitää hallussaan ja ymmärtää. Kaavioiden lukemiseen ei tarvita laajaa koulutusta, eikä eri tietoelementtien välillä ole monimutkaisia suhteita.
Dimensionaalinen mallintaminen edistää tiedon laatua: Tähtikaavioiden avulla tietovaraston ylläpitäjät voivat pakottaa tietovaraston viitteellisen eheyden tarkistukset. Koska faktatietoavain on siihen liittyvien ulottuvuuksien olennaisten tietojen ketjutus, faktatietue ladataan aktiivisesti, jos vastaavat ulottuvuustietueet on kuvattu asianmukaisesti ja ne ovat myös olemassa tietokannassa.
Valvomalla vierasavainrajoituksia viittausten eheyden tarkistuksen muotona tietovaraston DBA:t lisäävät puolustuslinjan korruptoituneita varastotietoja vastaan.
Tehon optimointi on mahdollista aggregaattien avulla: Tietovaraston koon kasvaessa suorituskyvyn optimoinnista tulee kiireellinen huolenaihe. Asiakkaat, jotka joutuvat odottamaan tuntikausia saadakseen vastauksen kyselyyn, lannistuvat nopeasti tietovarastoista. Aggregaatit ovat yksi helpoimmista menetelmistä, joilla kyselyn suorituskykyä voidaan optimoida.
Dimensiomallinnuksen haitat
- Faktojen ja dimensioiden eheyden säilyttämiseksi tietovarastojen lataaminen tietueella eri operatiivisista järjestelmistä on monimutkaista.
- Tietovarastotoiminnan muuttaminen on vaikeaa, jos dimensiotekniikan käyttöön ottava organisaatio muuttaa toimintatapaansa.
Dimensiomallinnuksen osatekijät
Fakta
Se on kokoelma toisiinsa liittyviä tietoeriä, jotka koostuvat mittaustiedoista ja kontekstitiedoista. Se edustaa tyypillisesti liiketoimintakohteita tai liiketoimintatapahtumia.
Dimensions
Se on kokoelma tietoja, jotka kuvaavat yhtä liiketoiminnan ulottuvuutta. Dimensiot päättävät faktojen kontekstitaustan, ja ne ovat kehys, jonka yli OLAP suoritetaan.
Mittaus
Se on faktan numeerinen attribuutti, joka edustaa liiketoiminnan suorituskykyä tai käyttäytymistä suhteessa dimensioihin.
Relaationaalinen konteksti huomioon ottaen on olemassa kaksi perusmallia, joita käytetään dimensiomallinnuksessa:
- Tähti-malli
- Lumihiutale-malli
Tähti-malli on dimensiomallin perusrakenne. Siinä on yksi laaja keskeinen taulukko (faktataulukko) ja joukko pienempiä taulukoita (dimensioita), jotka on järjestetty säteittäisesti ensisijaisen taulukon ympärille. Lumihiutalemalli on johtopäätös yhden tai useamman ulottuvuuden purkamisesta.
Tietotaulukko
Tietotauluja käytetään liiketoiminnan faktojen tai toimenpiteiden tiedottamiseen. Faktat ovat numeerisia tietoelementtejä, jotka kiinnostavat yritystä.
Faktataulukon ominaisuudet
Faktataulukko sisältää numeerisia arvoja siitä, mitä mittaamme. Esimerkiksi fakta-arvo 20 saattaa tarkoittaa, että 20 widgettiä on myyty.
Jokaiseen faktatauluun sisältyy avaimet niihin liittyviin dimensiotaulukoihin. Näitä kutsutaan faktataulukon vierasavaimiksi.
Faktataulukoissa on tyypillisesti pieni määrä sarakkeita.
Kun sitä verrataan dimensiotaulukoihin, faktataulukoissa on suuri määrä rivejä.
Dimensiotaulukko
Dimensiotaulukot luovat faktojen kontekstin. Dimensiotaulukoihin tallennetaan faktoja kuvaavia kenttiä.
Dimensiotaulukon ominaisuudet
Dimensiotaulukot sisältävät faktojen yksityiskohdat. Sen avulla esimerkiksi liiketoiminta-analyytikot voivat ymmärtää tietoja ja niiden raportteja paremmin.
Dimensiotaulukot sisältävät kuvailevia tietoja faktataulukon numeerisista arvoista. Toisin sanoen ne sisältävät faktojen attribuutteja. Esimerkiksi markkinointianalyysitoiminnon ulottuvuustaulukot voivat sisältää attribuutteja, kuten aika, markkinointialue ja tuotetyyppi.
Koska ulottuvuustaulukon tietue on denormalisoitu, siinä on yleensä suuri määrä sarakkeita. Dimensiotaulukoissa on huomattavasti vähemmän tietorivejä kuin faktataulukossa.
Dimensiotaulukon attribuutteja käytetään rivien ja sarakkeiden otsikoina asiakirjassa tai kyselytulosten näytössä.
Esimerkki: Kaupunki ja osavaltio voivat tarkastella myymälän yhteenvetoa faktataulussa. Tavaroiden yhteenvetoa voidaan tarkastella tuotemerkin, värin jne. mukaan. Asiakastietoja voidaan tarkastella nimen ja osoitteen mukaan.
Tietotaulukko
Aika-tunnus | Tuotetunnus | Asiakastunnus | Myyty yksikkö |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
Tässä esimerkissä, Asiakastunnus-sarake faktat-taulussa on vierasavain, joka yhdistyy dimensiotauluun. Linkkejä seuraamalla näemme, että faktataulukon rivi 2 tallentaa sen, että asiakas 3, Gaurav, osti kaksi tuotetta päivänä 8.
Dimensiotaulukot
Asiakkaan ID | Nimi | Sukupuoli | Tulot | Koulutus | Alue | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Rohan | Mies | 2 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 5 | 3 | 5 | 1 |
3 | Gaurav | Mies | 1 | 7 | 3 |
Hierarkia
Hierarkia on suunnattu puu, jonka solmut ovat dimensioattribuutteja ja jonka kaaret mallintavat monesta yhteen -yhteyttä dimensioattribuuttien ryhmän välillä. Se sisältää puun juureen sijoitetun ulottuvuuden ja kaikki sitä määrittävät ulottuvuusattribuutit.