A dimenziós modellezés az adatokat kocka művelettel ábrázolja, így az OLAP adatkezeléssel alkalmasabbá teszi a logikai adatreprezentációt. A dimenzionális modellezés felfogását Ralph Kimball fejlesztette ki, és “tény” és “dimenzió” táblákból áll.
A dimenzionális modellezésben a tranzakciós rekordot vagy “tényekre”, amelyek gyakran numerikus tranzakciós adatok, vagy “dimenziókra”, amelyek a tények kontextusát adó referenciainformációk. Például egy értékesítési tranzakciót olyan tényekre lehet bontani, mint a megrendelt termékek száma és a termékekért fizetett ár, valamint olyan dimenziókra, mint a rendelés dátuma, a felhasználó neve, a termék száma, a rendelés szállítási és számlázási helye, valamint a rendelés átvételéért felelős értékesítő.
A dimenziómodellezés céljai
A dimenziómodellezés céljai a következők:
- A végfelhasználók számára könnyen érthető és a lekérdezések megírását megkönnyítő adatbázis-architektúra létrehozása.
- A lekérdezések hatékonyságának maximalizálása. Ezeket a célokat a táblák és a köztük lévő kapcsolatok számának minimalizálásával éri el.
A dimenziós modellezés előnyei
A következők a dimenziós modellezés előnyei:
A dimenziós modellezés egyszerű: A dimenziós modellezési módszerek lehetővé teszik a raktártervezők számára, hogy olyan adatbázis-sémákat hozzanak létre, amelyeket az üzleti ügyfelek könnyen kézbe vehetnek és megérthetnek. Nincs szükség hatalmas képzésre a diagramok olvasásához, és nincs bonyolult kapcsolat a különböző adatelemek között.
A dimenziós modellezés elősegíti az adatminőséget: A csillagsémák lehetővé teszik a raktáradminisztrátorok számára, hogy referenciális integritás-ellenőrzéseket kényszerítsenek ki az adattárházban. Mivel a tényinformációs kulcs a hozzá tartozó dimenziók lényeges elemeinek összevonása, egy tényrekord akkor töltődik be aktívan, ha a megfelelő dimenziók rekordjai megfelelően le vannak írva, és szintén léteznek az adatbázisban.
A referenciális integritás ellenőrzésének egyik formájaként az idegenkulcs-kényszerek érvényesítésével az adattárházi DBA-k egy védelmi vonalat adnak a raktárak sérült adatai ellen.
A teljesítményoptimalizálás az aggregátumok révén lehetséges: Az adattárház méretének növekedésével a teljesítményoptimalizálás sürgető kérdéssé válik. Azok az ügyfelek, akiknek órákat kell várniuk arra, hogy választ kapjanak egy lekérdezésre, hamar elkedvetlenednek a raktárakkal szemben. Az aggregátumok az egyik legegyszerűbb módszer, amellyel a lekérdezések teljesítménye optimalizálható.
A dimenziós modellezés hátrányai
- A tény és a dimenziók integritásának megőrzése érdekében bonyolult az adattárházak betöltése egy rekorddal a különböző operatív rendszerekből.
- Súlyos az adattárház működésének módosítása, ha a dimenziós technikát alkalmazó szervezet megváltoztatja az üzleti tevékenységének módját.
A dimenziós modellezés elemei
Tény
Tény
Mértékekből és kontextusadatokból álló, kapcsolódó adatelemek gyűjteménye. Általában üzleti elemeket vagy üzleti tranzakciókat reprezentál.
Dimenziók
Egy üzleti dimenziót leíró adatok gyűjteménye. A dimenziók határozzák meg a tények kontextuális hátterét, és ezek jelentik azt a keretet, amelyen az OLAP végrehajtása történik.
Mérték
Egy tény numerikus attribútuma, amely az üzlet teljesítményét vagy viselkedését reprezentálja a dimenziókhoz képest.
A relációs kontextust figyelembe véve két alapvető modell létezik, amelyeket a dimenziós modellezésben használnak:
- csillagmodell
- Hópehelymodell
A csillagmodell a dimenziós modell alapstruktúrája. Egy széles központi táblával (ténytábla) és egy sor kisebb táblával (dimenziók) rendelkezik, amelyek sugárirányban vannak elrendezve az elsődleges tábla körül. A hópelyhes modell a dimenziók közül egy vagy több dimenzió szétbontásának a konklúziója.
Ténytábla
A ténytáblákat az üzleti tények vagy intézkedések adatainak megadására használják. A tények azok a numerikus adatelemek, amelyek a vállalat számára érdekesek.
A ténytábla jellemzői
A ténytábla tartalmazza azoknak a számszerű értékeit, amelyeket mérünk. Például egy 20-as tényérték azt jelentheti, hogy 20 widgetet adtak el.
Minden ténytábla tartalmazza a kapcsolódó dimenziótáblák kulcsait. Ezeket a ténytáblában idegen kulcsoknak nevezzük.
A ténytáblák jellemzően kis számú oszlopot tartalmaznak.
A dimenziós táblákkal összehasonlítva a ténytáblák nagy számú sorral rendelkeznek.
Dimenziós tábla
A dimenziós táblák létrehozzák a tények kontextusát. A dimenziós táblák a tényeket leíró mezőket tárolják.
A dimenziós tábla jellemzői
A dimenziós táblák a tények részleteit tartalmazzák. Ez például lehetővé teszi, hogy az üzleti elemzők jobban megértsék az adatokat és a jelentéseiket.
A dimenziós táblák leíró adatokat tartalmaznak a ténytáblában szereplő numerikus értékekről. Vagyis a tények attribútumait tartalmazzák. Például egy marketingelemzési funkció dimenziós táblái olyan attribútumokat tartalmazhatnak, mint az idő, a marketing régió és a terméktípus.
Mivel a dimenziós táblában lévő rekord denormalizált, általában nagyszámú oszlopot tartalmaz. A dimenziós táblák lényegesen kevesebb sornyi információt tartalmaznak, mint a ténytábla.
A dimenziós táblában szereplő attribútumok sor- és oszlopcímként használatosak a dokumentumban vagy a lekérdezés eredményeinek megjelenítésében.
Példa: A város és az állam megtekintheti a ténytáblában lévő áruházi összefoglalót. Az árucikkek összefoglalója megtekinthető márka, szín stb. szerint. Az ügyféladatokat név és cím szerint lehet megtekinteni.
Ténytábla
Időazonosító | Termékazonosító | Vevőazonosító | Eladott egység |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
Ebben a példában, A ténytábla ügyfél azonosító oszlopa az idegen kulcsok, amelyek a dimenzió táblához kapcsolódnak. A hivatkozásokat követve láthatjuk, hogy a ténytábla 2. sora rögzíti azt a tényt, hogy a 3. ügyfél, Gaurav két terméket vásárolt a 8. napon.
Dimenziós táblák
Vevő azonosítója | Név | Nem | Gender | Jövedelem | Elképzettség | Régió |
---|---|---|---|---|---|---|
1 | Rohan | Férfi | 2 | 3 | 4 | |
2 | Sandeep | Férfi | Férfi | 3 | 5 | 1 |
3 | Gaurav | Hím | 1 | 7 | 3 |
Hierarchia
A hierarchia egy irányított fa, amelynek csomópontjai dimenziós attribútumok, és amelynek ívei modellezik a dimenziós attribútumcsoportok közötti sok az egyhez kapcsolatot. Tartalmaz egy dimenziót, amely a fa gyökerénél helyezkedik el, és az összes dimenzióattribútumot, amely meghatározza azt.