Dimensionale Modellierung stellt Daten mit einer Würfeloperation dar, wodurch die logische Datendarstellung mit OLAP-Datenmanagement besser geeignet ist. Das Konzept der dimensionalen Modellierung wurde von Ralph Kimball entwickelt und besteht aus „Fakten-“ und „Dimensionstabellen“.

Bei der dimensionalen Modellierung wird der Transaktionsdatensatz entweder in „Fakten“ unterteilt, bei denen es sich häufig um numerische Transaktionsdaten handelt, oder in „Dimensionen“, bei denen es sich um die Referenzinformationen handelt, die den Fakten einen Kontext geben. Zum Beispiel kann eine Verkaufstransaktion in Fakten wie die Anzahl der bestellten Produkte und den für die Produkte gezahlten Preis und in Dimensionen wie Bestelldatum, Benutzername, Produktnummer, Liefer- und Rechnungsempfänger und den für den Erhalt der Bestellung verantwortlichen Verkäufer unterteilt werden.

Ziele der dimensionalen Modellierung

Die Ziele der dimensionalen Modellierung sind:

  1. Eine Datenbankarchitektur zu erstellen, die für Endkunden leicht zu verstehen ist und in der Abfragen geschrieben werden können.
  2. Die Effizienz von Abfragen zu maximieren. Diese Ziele werden erreicht, indem die Anzahl der Tabellen und der Beziehungen zwischen ihnen minimiert wird.

Vorteile der dimensionalen Modellierung

Nachfolgend sind die Vorteile der dimensionalen Modellierung aufgeführt:

Die dimensionale Modellierung ist einfach: Die Methoden der dimensionalen Modellierung ermöglichen es den Lagerdesignern, Datenbankschemata zu erstellen, die von den Geschäftskunden leicht gehalten und verstanden werden können. Es ist keine umfangreiche Schulung zum Lesen von Diagrammen erforderlich, und es gibt keine komplizierten Beziehungen zwischen verschiedenen Datenelementen.

Dimensionale Modellierung fördert die Datenqualität: Das Sternschema ermöglicht es Warehouse-Administratoren, Prüfungen der referentiellen Integrität im Data Warehouse durchzusetzen. Da der Informationsschlüssel eines Fakts eine Verkettung der wesentlichen Elemente der zugehörigen Dimensionen ist, wird ein Faktdatensatz aktiv geladen, wenn die zugehörigen Dimensionsdatensätze ordnungsgemäß beschrieben und ebenfalls in der Datenbank vorhanden sind.

Durch die Durchsetzung von Fremdschlüssel-Beschränkungen als eine Form der referenziellen Integritätsprüfung fügen Data-Warehouse-DBAs eine Verteidigungslinie gegen beschädigte Warehouse-Daten hinzu.

Performance-Optimierung ist durch Aggregate möglich: Mit zunehmender Größe des Data Warehouses entwickelt sich die Leistungsoptimierung zu einem dringenden Anliegen. Kunden, die stundenlang auf eine Antwort auf eine Abfrage warten müssen, werden von den Warehouses schnell entmutigt. Aggregate sind eine der einfachsten Methoden, mit denen die Abfrageleistung optimiert werden kann.

Nachteile der dimensionalen Modellierung

  1. Um die Integrität von Fakten und Dimensionen zu wahren, ist das Laden der Data Warehouses mit einem Datensatz aus verschiedenen operativen Systemen kompliziert.
  2. Es ist schwierig, den Data-Warehouse-Betrieb zu ändern, wenn das Unternehmen, das die dimensionale Technik anwendet, seine Geschäftsmethoden ändert.

Elemente der dimensionalen Modellierung

Fakt

Es handelt sich um eine Sammlung zusammengehöriger Datenelemente, die aus Kennzahlen und Kontextdaten bestehen. Sie stellt typischerweise Geschäftselemente oder Geschäftsvorgänge dar.

Dimensionen

Sie ist eine Sammlung von Daten, die eine Geschäftsdimension beschreiben. Dimensionen bestimmen den kontextuellen Hintergrund für die Fakten und bilden den Rahmen, in dem OLAP durchgeführt wird.

Maßnahme

Es handelt sich um ein numerisches Attribut eines Fakts, das die Leistung oder das Verhalten des Unternehmens im Verhältnis zu den Dimensionen darstellt.

Betrachtet man den relationalen Kontext, so gibt es zwei grundlegende Modelle, die bei der Dimensionsmodellierung verwendet werden:

  • Sternmodell
  • Snowflake-Modell

Das Sternmodell ist die einem Dimensionsmodell zugrunde liegende Struktur. Es hat eine große zentrale Tabelle (Faktentabelle) und eine Reihe kleinerer Tabellen (Dimensionen), die radial um die Haupttabelle angeordnet sind. Das Schneeflockenmodell ist das Ergebnis der Zerlegung einer oder mehrerer Dimensionen.

Faktentabelle

Faktentabellen werden zur Erfassung von Fakten oder Maßnahmen im Unternehmen verwendet. Fakten sind die numerischen Datenelemente, die für das Unternehmen von Interesse sind.

Charakteristika der Faktentabelle

Die Faktentabelle enthält numerische Werte dessen, was wir messen. Ein Faktenwert von 20 kann beispielsweise bedeuten, dass 20 Widgets verkauft wurden.

Jede Faktentabelle enthält die Schlüssel zu den zugehörigen Dimensionstabellen. Diese sind als Fremdschlüssel in der Faktentabelle bekannt.

Faktentabellen enthalten in der Regel eine geringe Anzahl von Spalten.

Im Vergleich zu Dimensionstabellen haben Faktentabellen eine große Anzahl von Zeilen.

Dimensionstabelle

Dimensionstabellen stellen den Kontext der Fakten her. Dimensionstabellen speichern Felder, die den Sachverhalt beschreiben.

Merkmale der Dimensionstabelle

Dimensionstabellen enthalten die Details über den Sachverhalt. Dies ermöglicht es beispielsweise den Geschäftsanalysten, die Daten und ihre Berichte besser zu verstehen.

Die Dimensionstabellen enthalten beschreibende Daten über die numerischen Werte in der Faktentabelle. Das heißt, sie enthalten die Attribute der Fakten. Beispielsweise könnten die Dimensionstabellen für eine Marketinganalysefunktion Attribute wie Zeit, Marketingregion und Produkttyp enthalten.

Da der Datensatz in einer Dimensionstabelle denormalisiert ist, hat er normalerweise eine große Anzahl von Spalten. Die Dimensionstabellen enthalten wesentlich weniger Informationszeilen als die Faktentabelle.

Die Attribute in einer Dimensionstabelle werden als Zeilen- und Spaltenüberschriften in einem Dokument oder einer Abfrageergebnisanzeige verwendet.

Beispiel: Eine Stadt und ein Bundesland können in einer Faktentabelle eine Ladenübersicht anzeigen. Eine Artikelübersicht kann nach Marke, Farbe usw. angezeigt werden. Kundeninformationen können nach Name und Adresse angezeigt werden.

Faktentabelle

Zeit-ID Produkt-ID Kunden-ID Verkaufte Einheit
4 17 2 1
8 21 3 2
8 4 1 1

In diesem Beispiel, Die Spalte Kunden-ID in der Faktentabelle ist der Fremdschlüssel für die Verknüpfung mit der Dimensionstabelle. Anhand der Verknüpfungen können wir sehen, dass Zeile 2 der Faktentabelle die Tatsache aufzeichnet, dass Kunde 3, Gaurav, am Tag 8 zwei Artikel gekauft hat.

Dimensionstabellen

Kunden-ID Name Geschlecht Einkommen Ausbildung Region
1 Rohan Mann 2 3 4
2 Sandeep Mann 3 5 1
3 Gaurav Männlich 1 7 3

Hierarchie

Eine Hierarchie ist ein gerichteter Baum, dessen Knoten Dimensionsattribute sind und dessen Bögen viele bis eine Assoziation zwischen Dimensionsattributen modellieren Team. Sie enthält eine Dimension, die sich an der Wurzel des Baums befindet, und alle Dimensionsattribute, die sie definieren.

admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

lg