Modelowanie wymiarowe reprezentuje dane za pomocą operacji kostki, czyniąc bardziej odpowiednią logiczną reprezentację danych z zarządzaniem danymi OLAP. Postrzeganie modelowania wymiarowego zostało opracowane przez Ralpha Kimballa i składa się z tabel „faktów” i „wymiarów”.
W modelowaniu wymiarowym rekord transakcji jest podzielony albo na „fakty”, które są często numerycznymi danymi transakcji, albo na „wymiary”, które są informacjami referencyjnymi, które nadają kontekst faktom. Na przykład transakcja sprzedaży może zostać uszkodzona na fakty, takie jak liczba zamówionych produktów i cena zapłacona za produkty, oraz na wymiary, takie jak data zamówienia, nazwa użytkownika, numer produktu, lokalizacje ship-to i bill-to zamówienia oraz sprzedawca odpowiedzialny za otrzymanie zamówienia.
Cele modelowania wymiarowego
Celami modelowania wymiarowego są:
- Produkowanie architektury bazy danych, która jest łatwa do zrozumienia dla klientów końcowych i pisania zapytań.
- Maksymalizacja wydajności zapytań. Osiąga te cele przez minimalizację liczby tabel i relacji między nimi.
Zalety modelowania wymiarowego
Następujące zalety modelowania wymiarowego to:
Modelowanie wymiarowe jest proste: Metody modelowania wymiarowego umożliwiają projektantom hurtowni tworzenie schematów baz danych, które klienci biznesowi mogą łatwo utrzymać i zrozumieć. Nie jest potrzebne rozległe szkolenie w zakresie czytania schematów, nie ma też skomplikowanych relacji między różnymi elementami danych.
Modelowanie wymiarowe promuje jakość danych: Schemat gwiaździsty umożliwia administratorom hurtowni wymuszenie kontroli integralności referencyjnej w hurtowni danych. Ponieważ klucz informacji o faktach jest konkatenacją istotnych elementów powiązanych wymiarów, rekord faktograficzny jest aktywnie ładowany, jeśli odpowiadające mu rekordy wymiarów są należycie opisane i również istnieją w bazie danych.
Wymuszając ograniczenia klucza obcego jako formę sprawdzania integralności referencyjnej, administratorzy hurtowni danych dodają linię obrony przed uszkodzonymi danymi hurtowni.
Optymalizacja wydajności jest możliwa dzięki agregatom: Wraz ze wzrostem rozmiaru hurtowni danych optymalizacja wydajności staje się palącym problemem. Klienci, którzy muszą czekać godzinami na odpowiedź na zapytanie, szybko zniechęcają się do hurtowni. Agregaty są jedną z najprostszych metod, za pomocą których można zoptymalizować wydajność zapytań.
Wady modelowania wymiarowego
- Aby zachować integralność faktów i wymiarów, ładowanie hurtowni danych rekordem z różnych systemów operacyjnych jest skomplikowane.
- Poważna jest modyfikacja działania hurtowni danych, jeśli organizacja przyjmująca technikę wymiarową zmieni metodę prowadzenia działalności.
Elements of Dimensional Modeling
Fact
Jest to zbiór powiązanych elementów danych, składający się z miar i danych kontekstowych. Zazwyczaj reprezentuje elementy biznesowe lub transakcje biznesowe.
Wymiary
Jest to zbiór danych, które opisują jeden wymiar biznesowy. Wymiary określają kontekstowe tło dla faktów i stanowią ramy, na których wykonywany jest OLAP.
Measure
Jest to atrybut numeryczny faktu, reprezentujący wydajność lub zachowanie przedsiębiorstwa w stosunku do wymiarów.
Patrząc na kontekst relacyjny, istnieją dwa podstawowe modele, które są używane w modelowaniu wymiarowym:
- Model gwiazdy
- Model płatka śniegu
Model gwiazdy jest strukturą bazową dla modelu wymiarowego. Ma on jedną szeroką tabelę centralną (tabela faktów) i zestaw mniejszych tabel (wymiarów) ułożonych promieniście wokół tabeli głównej. Model płatka śniegu jest wnioskiem z dekompozycji jednego lub więcej wymiarów.
Tabela faktów
Tabele faktów są używane do danych faktów lub środków w biznesie. Fakty są numerycznymi elementami danych, które są interesujące dla firmy.
Charakterystyka tabeli faktów
Tabela faktów zawiera wartości numeryczne tego, co mierzymy. Na przykład wartość faktów równa 20 może oznaczać, że sprzedano 20 widżetów.
Każda tabela faktów zawiera klucze do powiązanych tabel wymiarów. Są one znane jako klucze obce w tabeli faktów.
Tabele faktów zawierają zazwyczaj niewielką liczbę kolumn.
W porównaniu z tabelami wymiarów, tabele faktów mają dużą liczbę wierszy.
Tabele wymiarów
Tabele wymiarów ustanawiają kontekst faktów. Tabele wymiarowe przechowują pola, które opisują fakty.
Charakterystyka tabeli wymiarowej
Tabele wymiarowe zawierają szczegóły dotyczące faktów. To, jako przykład, pozwala analitykom biznesowym lepiej zrozumieć dane i ich raporty.
Tabele wymiarów zawierają dane opisowe o wartościach liczbowych w tabeli faktów. Oznacza to, że zawierają atrybuty faktów. Na przykład tabele wymiarów dla funkcji analizy marketingowej mogą zawierać takie atrybuty, jak czas, region marketingowy i typ produktu.
Ponieważ rekord w tabeli wymiarów jest zdenormalizowany, zwykle ma dużą liczbę kolumn. Tabele wymiarów zawierają znacznie mniej wierszy informacji niż tabela faktów.
Atrybuty w tabeli wymiarów są używane jako nagłówki wierszy i kolumn w dokumencie lub wyświetlaniu wyników zapytania.
Przykład: Miasto i stan mogą wyświetlić podsumowanie sklepu w tabeli faktów. Podsumowanie artykułu może być przeglądane według marki, koloru, itp. Informacje o kliencie mogą być przeglądane według nazwy i adresu.
Tablica faktów
Identyfikator czasu | Identyfikator produktu | Identyfikator klienta | Unit Sold |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
W tym przykładzie, Kolumna ID klienta w tabeli faktów jest kluczem obcym, który łączy się z tabelą wymiarów. Podążając za odnośnikami, możemy zobaczyć, że wiersz 2 tabeli faktów rejestruje fakt, że klient 3, Gaurav, kupił dwa przedmioty w dniu 8.
Tabele wymiarów
Identyfikator klienta | Nazwisko | Płeć | Dochód | Wykształcenie | Region | |
---|---|---|---|---|---|---|
1 | Rohan | Mężczyzna | 2 | 3 | 4 | |
2 | Sandeep | Mężczyzna | Mężczyzna | 3 | 5 | 1 |
3 | Gaurav | Mężczyzna | 1 | 7 | 3 |
.
Hierarchia
Hierarchia jest drzewem skierowanym, którego węzły są atrybutami wymiarowymi, a łuki modelują wiele do jednego asocjacji między zespołem atrybutów wymiarowych. Zawiera wymiar, umieszczony w korzeniu drzewa, oraz wszystkie atrybuty wymiarowe, które go definiują.
.