Modelarea dimensională reprezintă datele cu o operație de cub, făcând mai potrivită reprezentarea logică a datelor cu gestionarea datelor OLAP. Percepția modelării dimensionale a fost dezvoltată de Ralph Kimball și este formată din tabele de „fapte” și tabele de „dimensiuni”.
În modelarea dimensională, înregistrarea tranzacției este împărțită fie în „fapte”, care sunt frecvent date numerice ale tranzacției, fie în „dimensiuni”, care sunt informațiile de referință care oferă context faptelor. De exemplu, o tranzacție de vânzare poate fi deteriorată în fapte, cum ar fi numărul de produse comandate și prețul plătit pentru produse, și în dimensiuni, cum ar fi data comenzii, numele utilizatorului, numărul produsului, locațiile de expediere a comenzii și de facturare, precum și vânzătorul responsabil de primirea comenzii.
Obiectivele modelării dimensionale
Obiectivele modelării dimensionale sunt:
- Pentru a produce o arhitectură a bazei de date care este ușor de înțeles și de scris interogări pentru clienții finali.
- Pentru a maximiza eficiența interogărilor. Realizează aceste obiective prin minimizarea numărului de tabele și a relațiilor dintre ele.
Vantajele modelării dimensionale
Acestea sunt avantajele modelării dimensionale:
Modelarea dimensională este simplă: Metodele de modelare dimensională fac posibil ca proiectanții de depozite să creeze scheme de baze de date pe care clienții de afaceri le pot deține și înțelege cu ușurință. Nu este nevoie de o pregătire vastă privind modul de citire a diagramelor și nu există o relație complicată între diferitele elemente de date.
Modelarea dimensională promovează calitatea datelor: Schema în stea permite administratorilor de depozite să impună verificări de integritate referențială asupra depozitului de date. Deoarece cheia de informare a faptelor este o concatenare a elementelor esențiale ale dimensiunilor sale asociate, o înregistrare faptică este încărcată în mod activ dacă înregistrările dimensiunilor corespunzătoare sunt descrise în mod corespunzător și există, de asemenea, în baza de date.
Prin aplicarea constrângerilor de chei străine ca o formă de verificare a integrității referențiale, administratorii de baze de date DBA adaugă o linie de apărare împotriva datelor corupte din depozite.
Optimizarea performanțelor este posibilă prin agregate: Pe măsură ce dimensiunea depozitului de date crește, optimizarea performanței se transformă într-o preocupare urgentă. Clienții care trebuie să aștepte ore întregi pentru a primi un răspuns la o interogare vor deveni rapid descurajați de depozite. Agregatele sunt una dintre cele mai simple metode prin care se poate optimiza performanța interogărilor.
Dezavantajele modelării dimensionale
- Pentru a menține integritatea faptelor și dimensiunilor, încărcarea depozitelor de date cu o înregistrare din diverse sisteme operaționale este complicată.
- Este severă modificarea funcționării depozitului de date dacă organizația care adoptă tehnica dimensională schimbă metoda în care își desfășoară activitatea.
Elemente de modelare dimensională
Fact
Este o colecție de elemente de date asociate, constând din măsuri și date de context. De obicei, reprezintă elemente de afaceri sau tranzacții de afaceri.
Dimensiuni
Este o colecție de date care descriu o dimensiune de afaceri. Dimensiunile decid fundalul contextual al faptelor și reprezintă cadrul pe care se realizează OLAP.
Măsură
Este un atribut numeric al unui fapt, reprezentând performanța sau comportamentul afacerii în raport cu dimensiunile.
Considerând contextul relațional, există două modele de bază care sunt utilizate în modelarea dimensională:
- Modelul stea
- Modelul fulg de zăpadă
Modelul stea este structura de bază pentru un model dimensional. Acesta are un tabel central larg (tabel de date) și un set de tabele mai mici (dimensiuni) dispuse radial în jurul tabelului principal. Modelul fulgului de zăpadă este concluzia descompunerii uneia sau mai multor dimensiuni.
Tabele de date
Tabele de date sunt utilizate pentru datele faptelor sau măsurilor din cadrul afacerii. Faptele sunt elementele de date numerice care sunt de interes pentru companie.
Caracteristici ale tabelului de fapte
Tabloul de fapte include valori numerice ale ceea ce măsurăm. De exemplu, o valoare fact de 20 ar putea însemna că au fost vândute 20 de widget-uri.
Care tabel fact include cheile către tabelele de dimensiuni asociate. Acestea sunt cunoscute sub numele de chei străine în tabelul de fapte.
Tabelele de fapte includ de obicei un număr mic de coloane.
Când este comparat cu tabelele de dimensiuni, tabelele de fapte au un număr mare de rânduri.
Tabele de dimensiuni
Tabele de dimensiuni stabilesc contextul faptelor. Tabelele dimensionale stochează câmpurile care descriu faptele.
Caracteristicile tabelei de dimensiuni
Tabelele de dimensiuni conțin detalii despre fapte. Aceasta, de exemplu, permite analiștilor de afaceri să înțeleagă mai bine datele și rapoartele lor.
Tabele dimensionale includ date descriptive despre valorile numerice din tabelul de fapte. Adică, ele conțin atributele faptelor. De exemplu, tabelele de dimensiuni pentru o funcție de analiză de marketing pot include atribute cum ar fi timpul, regiunea de marketing și tipul de produs.
Din moment ce înregistrarea dintr-un tabel de dimensiuni este denormalizată, aceasta are, de obicei, un număr mare de coloane. Tabelele de dimensiuni includ semnificativ mai puține rânduri de informații decât tabelul de date.
Atributele dintr-un tabel de dimensiuni sunt utilizate ca titluri de rânduri și coloane într-un document sau în afișarea rezultatelor unei interogări.
Exemplu: Un oraș și un stat pot vizualiza un rezumat al magazinului într-un tabel de date. Rezumatul articolelor poate fi vizualizat în funcție de marcă, culoare etc. Informațiile despre clienți pot fi vizualizate după nume și adresă.
Fact Table
Time ID | Product ID | Customer ID | Unit Sold | |
---|---|---|---|---|
4 | 17 | 2 | 1 | |
8 | 21 | 3 | 2 | |
8 | 4 | 1 | 1 | 1 |
În acest exemplu, Coloana ID client din tabelul facts este cheia externă care se unește cu tabelul de dimensiuni. Urmărind legăturile, putem vedea că rândul 2 al tabelului de fapte înregistrează faptul că clientul 3, Gaurav, a cumpărat două articole în ziua 8.
Tabele dimensionale
Customer ID | Name | Gender | Income | Education | Region | Education | Region |
---|---|---|---|---|---|---|---|
1 | Rohan | Bărbat | 2 | 3 | 4 | ||
2 | Sandeep | Bărbat | Bărbat | 3 | 5 | 1 | |
3 | 3 | Gaurav | Bărbat | 1 | 7 | 3 |
.
Hierarhie
O ierarhie este un arbore dirijat ale cărui noduri sunt atribute dimensionale și ale cărui arce modelează asocierea multiplă între atributele dimensionale echipă. Ea conține o dimensiune, poziționată la rădăcina arborelui, și toate atributele dimensionale care o definesc.
.