A dimenziós modellezés az adatokat kocka művelettel ábrázolja, így az OLAP adatkezeléssel alkalmasabbá teszi a logikai adatreprezentációt. A dimenzionális modellezés felfogását Ralph Kimball fejlesztette ki, és “tény” és “dimenzió” táblákból áll.

A dimenzionális modellezésben a tranzakciós rekordot vagy “tényekre”, amelyek gyakran numerikus tranzakciós adatok, vagy “dimenziókra”, amelyek a tények kontextusát adó referenciainformációk. Például egy értékesítési tranzakciót olyan tényekre lehet bontani, mint a megrendelt termékek száma és a termékekért fizetett ár, valamint olyan dimenziókra, mint a rendelés dátuma, a felhasználó neve, a termék száma, a rendelés szállítási és számlázási helye, valamint a rendelés átvételéért felelős értékesítő.

A dimenziómodellezés céljai

A dimenziómodellezés céljai a következők:

  1. A végfelhasználók számára könnyen érthető és a lekérdezések megírását megkönnyítő adatbázis-architektúra létrehozása.
  2. A lekérdezések hatékonyságának maximalizálása. Ezeket a célokat a táblák és a köztük lévő kapcsolatok számának minimalizálásával éri el.

A dimenziós modellezés előnyei

A következők a dimenziós modellezés előnyei:

A dimenziós modellezés egyszerű: A dimenziós modellezési módszerek lehetővé teszik a raktártervezők számára, hogy olyan adatbázis-sémákat hozzanak létre, amelyeket az üzleti ügyfelek könnyen kézbe vehetnek és megérthetnek. Nincs szükség hatalmas képzésre a diagramok olvasásához, és nincs bonyolult kapcsolat a különböző adatelemek között.

A dimenziós modellezés elősegíti az adatminőséget: A csillagsémák lehetővé teszik a raktáradminisztrátorok számára, hogy referenciális integritás-ellenőrzéseket kényszerítsenek ki az adattárházban. Mivel a tényinformációs kulcs a hozzá tartozó dimenziók lényeges elemeinek összevonása, egy tényrekord akkor töltődik be aktívan, ha a megfelelő dimenziók rekordjai megfelelően le vannak írva, és szintén léteznek az adatbázisban.

A referenciális integritás ellenőrzésének egyik formájaként az idegenkulcs-kényszerek érvényesítésével az adattárházi DBA-k egy védelmi vonalat adnak a raktárak sérült adatai ellen.

A teljesítményoptimalizálás az aggregátumok révén lehetséges: Az adattárház méretének növekedésével a teljesítményoptimalizálás sürgető kérdéssé válik. Azok az ügyfelek, akiknek órákat kell várniuk arra, hogy választ kapjanak egy lekérdezésre, hamar elkedvetlenednek a raktárakkal szemben. Az aggregátumok az egyik legegyszerűbb módszer, amellyel a lekérdezések teljesítménye optimalizálható.

A dimenziós modellezés hátrányai

  1. A tény és a dimenziók integritásának megőrzése érdekében bonyolult az adattárházak betöltése egy rekorddal a különböző operatív rendszerekből.
  2. Súlyos az adattárház működésének módosítása, ha a dimenziós technikát alkalmazó szervezet megváltoztatja az üzleti tevékenységének módját.

A dimenziós modellezés elemei

Tény

Tény

Mértékekből és kontextusadatokból álló, kapcsolódó adatelemek gyűjteménye. Általában üzleti elemeket vagy üzleti tranzakciókat reprezentál.

Dimenziók

Egy üzleti dimenziót leíró adatok gyűjteménye. A dimenziók határozzák meg a tények kontextuális hátterét, és ezek jelentik azt a keretet, amelyen az OLAP végrehajtása történik.

Mérték

Egy tény numerikus attribútuma, amely az üzlet teljesítményét vagy viselkedését reprezentálja a dimenziókhoz képest.

A relációs kontextust figyelembe véve két alapvető modell létezik, amelyeket a dimenziós modellezésben használnak:

  • csillagmodell
  • Hópehelymodell

A csillagmodell a dimenziós modell alapstruktúrája. Egy széles központi táblával (ténytábla) és egy sor kisebb táblával (dimenziók) rendelkezik, amelyek sugárirányban vannak elrendezve az elsődleges tábla körül. A hópelyhes modell a dimenziók közül egy vagy több dimenzió szétbontásának a konklúziója.

Ténytábla

A ténytáblákat az üzleti tények vagy intézkedések adatainak megadására használják. A tények azok a numerikus adatelemek, amelyek a vállalat számára érdekesek.

A ténytábla jellemzői

A ténytábla tartalmazza azoknak a számszerű értékeit, amelyeket mérünk. Például egy 20-as tényérték azt jelentheti, hogy 20 widgetet adtak el.

Minden ténytábla tartalmazza a kapcsolódó dimenziótáblák kulcsait. Ezeket a ténytáblában idegen kulcsoknak nevezzük.

A ténytáblák jellemzően kis számú oszlopot tartalmaznak.

A dimenziós táblákkal összehasonlítva a ténytáblák nagy számú sorral rendelkeznek.

Dimenziós tábla

A dimenziós táblák létrehozzák a tények kontextusát. A dimenziós táblák a tényeket leíró mezőket tárolják.

A dimenziós tábla jellemzői

A dimenziós táblák a tények részleteit tartalmazzák. Ez például lehetővé teszi, hogy az üzleti elemzők jobban megértsék az adatokat és a jelentéseiket.

A dimenziós táblák leíró adatokat tartalmaznak a ténytáblában szereplő numerikus értékekről. Vagyis a tények attribútumait tartalmazzák. Például egy marketingelemzési funkció dimenziós táblái olyan attribútumokat tartalmazhatnak, mint az idő, a marketing régió és a terméktípus.

Mivel a dimenziós táblában lévő rekord denormalizált, általában nagyszámú oszlopot tartalmaz. A dimenziós táblák lényegesen kevesebb sornyi információt tartalmaznak, mint a ténytábla.

A dimenziós táblában szereplő attribútumok sor- és oszlopcímként használatosak a dokumentumban vagy a lekérdezés eredményeinek megjelenítésében.

Példa: A város és az állam megtekintheti a ténytáblában lévő áruházi összefoglalót. Az árucikkek összefoglalója megtekinthető márka, szín stb. szerint. Az ügyféladatokat név és cím szerint lehet megtekinteni.

Ténytábla

Időazonosító Termékazonosító Vevőazonosító Eladott egység
4 17 2 1
8 21 3 2
8 4 1 1

Ebben a példában, A ténytábla ügyfél azonosító oszlopa az idegen kulcsok, amelyek a dimenzió táblához kapcsolódnak. A hivatkozásokat követve láthatjuk, hogy a ténytábla 2. sora rögzíti azt a tényt, hogy a 3. ügyfél, Gaurav két terméket vásárolt a 8. napon.

Dimenziós táblák

.

Vevő azonosítója Név Nem Gender Jövedelem Elképzettség Régió
1 Rohan Férfi 2 3 4
2 Sandeep Férfi Férfi 3 5 1
3 Gaurav Hím 1 7 3

Hierarchia

A hierarchia egy irányított fa, amelynek csomópontjai dimenziós attribútumok, és amelynek ívei modellezik a dimenziós attribútumcsoportok közötti sok az egyhez kapcsolatot. Tartalmaz egy dimenziót, amely a fa gyökerénél helyezkedik el, és az összes dimenzióattribútumot, amely meghatározza azt.

admin

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

lg