Data Vault: Konzepte, Architektur und Modellierung

Referent: Bodo Hüsemann

Kurzinformationen

12. Jun. 2017 - 13. Jun. 2017
Münster
EUR 1790.00 zzgl. MwSt
EUR 2130.10 inkl. MwSt
Auf Anfrage
25. Sep. 2017 - 26. Sep. 2017
Münster
EUR 1790.00 zzgl. MwSt
EUR 2130.10 inkl. MwSt
Auf Anfrage
6. Nov. 2017 - 7. Nov. 2017
Münster
EUR 1790.00 zzgl. MwSt
EUR 2130.10 inkl. MwSt
Auf Anfrage

Detailinformationen

In Data-Warehouse-Systemen sind für anfrageorientierte Schichten (Data Marts) multidimensionale Modellierungsmethoden State-of-the-Art. Bei den vorgelagerten Integrationsschichten (Core Warehouse, Enterprise Data Warehouse) kommen hingegen klassische Modellierungsmethoden (ER-Modellierung, Normalisierung) zum Einsatz, die ursprünglich für transaktionsorientierte Systeme entwickelt wurden.

Diese Kern-Technologien und Standard-Vorgehensweisen sind langjährig erprobt und haben sich in der Praxis bewährt. Auf der anderen Seite sind aktuelle Anforderungen hinsichtlich kürzerer Aktualisierungsintervalle, höherer Ladeperformance bei wachsender Datenmenge und gleichzeitig agiler Adaptierbarkeit mit den traditionellen Methoden oft nicht mehr effizient umsetzbar. Hier müssen neben neuen technologischen Pfaden (z.B. In-Memory-Datenbanken, Big-Data-Technologie) auch konzeptionell und methodisch neue Wege beschritten werden.

Ein Lösungsansatz zur Optimierung eines Core Warehouse ist die von Dan Linstedt entwickelte Modellierungsmethode Data Vault, die seit vielen Jahren erprobt ist und zunehmend auch im deutschsprachigen Raum Verwendung findet. Data Vault bietet:

  • ein einfaches Datenmodell mit wenigen Basiskonzepten
  • Struktur-Entkopplung und Impact-Isolation für Modelländerungen und -erweiterungen
  • massiv parallelisierbare Ladeprozessemit Realtime-Unterstützung
  • und flexible Strukturerweiterung bei gleichzeitiger Historisierungsoption

Der Seminarinhalt

  • Gründe und Argumente für den Einsatz
  • Grundkonzepte der Modellierung im Data-Vault-2.0-Standard
  • Modellierungsmethode
  • ETL-Prozesse und Generatoren zur Erstellung
  • Architektur und Integration von Big-Data-Systemen
  • Erweiterte Modellierungsoptionen aus der Praxis
  • Best Practice Ansätze und Lösungen typischer Umsetzungsprobleme
  • Kritische Erfolgsfaktoren

Warum Sie dieses Seminar nicht verpassen sollten:

  • Agile Entwicklungsmethoden sind in traditionellen Data-Warehouse-Systemen schwer umsetzbar? Lernen Sie anhand von Data Vault, wie Sie BI-Projekte beschleunigen und Entwicklungszyklen verkürzen können.
  • Der Aufwand für Impactanalyse und Regressionstest steigt in Data-Warehouse-Systemen mit der Komplexität des Data Warehouse stetig an? Data Vault führt zur Entkopplung von inkrementellen Datenmodell- und ETL-Änderungen, sodass bestehende Systembestandteile nicht verändert werden müssen.
  • ETL-Ladenetze weisen hohe Abhängigkeiten und schlechte Ladezeiten auf, obwohl die Systeme technisch nicht voll ausgelastet sind? Data Vault ermöglicht eine massive Parallelisierung der Ladeprozesse und sehr gute Skalierbarkeit.

Agenda

Tag 1:

08:30 - 09:00 Begrüßungskaffee (optional), Empfang der Unterlagen

09:00 - 09:15 Begrüßung und Warm-Up

09:15 - 09:45 Einführung und Terminologie

  • Typische Probleme in klassischen Data-Warehouse-Systemen
  • Gründe für den Einsatz von Data Vault
  • Was ist Data Vault (Begriffe/Definition, Kernkonzepte, Historie, Data Vault 2.0)
09:45 - 10:15 Data-Vault-Basiskomponenten
  • Konzept der Dekomposition
  • Hubs
  • Satellites
  • Links
10:15 - 10:30 Kaffeepause vormittags

10:30 - 11:15 Modellierung eines Data Vaults
  • Modellierungsprozess
  • Entwurfsregeln für Hubs, Links und Satellites
11:15 - 12:00 Übungsaufgabe

12:00 - 13:00 Mittagessen

13:00 - 14:00 Lade- und Abfrageprozesse eines Data Vaults
  • ETL-Logik für das Beladen eines Data Vaults
  • Scheduling und Ladeprozess
14:00 - 15:00 Data-Vault-Architekturen
  • Klassische Architektur vs. Data-Vault-Architektur
  • Raw Vault / Business Rule Vault
    • Zentralisierung von Businesslogik
    • Virtual Data Integration und Self-Service-Business-Intelligence
  • Weitere Konzepte erklärt: Error Vault, Meta Vault, Metrik Vault, Operational Vault
15:00 - 15:15 Kaffeepause nachmittags

15:15 - 16:00 Big-Data-Systeme und Data Vault
  • Grundlagen Big-Data-Systeme und NoSQL/NewSQL-Systeme
  • Integration von Data Vault und Big Data Systeme
16:00 - 17:30 Praxisbeispiele und Diskussion

17:30 Tagesende

Tag 2:

08:30 - 09:30 Advanced Concepts

  • Hubs
  • Links
  • Satellites
  • Hilfstabellen
09:30 - 10:15 1. Teil Übungsszenario

10:15 - 10:30 Kaffeepause vormittags

10:30 - 11:30 Best Practices
  • Berechnung von Hashwerten
  • Auflösen von Link-to-Link-Beziehungen
  • Gruppierung von Attributen
  • Umgang mit unvollständigen Daten
  • Model Driven vs. Data Driven Structure
  • Anchor Modeling
  • Namenskonventionen
11:30 - 12:00 2. Teil Übungsszenario

12:00 - 13:00 Mittagessen

13:00 - 15:00 Data-Vault-Generatoren
  • Generierung von Datenmodellen und ETL-Prozessen
  • Vorhandene Lösungen
  • Generierung am Beispiel Quipu
  • Generierung am Beispiel Informatica
15:00 - 15:15 Kaffeepause nachmittags

15:15 - 17:00 Data-Vault-Praxis
  • SCRUM als Projektmethode
  • Data-Vault-Testmethoden
  • Projekterfahrungen
17:00 - 17:30 Abschlussdiskussion

17:30 Seminarende

Bodo Hüsemann

Dr. Bodo Hüsemann ist seit 2005 als Experte für Data Warehouse Systeme und Business Intelligence für die Informationsfabrik GmbH in Münster tätig. Er studierte Wirtschaftsinformatik und promovierte an der Universität Münster. Seit 2009 ist er Partner der Informationsfabrik und berät Unternehmen bei der Konzeption und Umsetzung komplexer Data Warehouse Lösungen. Darüber hinaus führt er als erfahrener Trainer BI-Schulungen und Praxisworkshops für Unternehmen sowie für die Universität Münster durch.

weiter >

Seminarziel

In diesem Seminar lernen die Teilnehmer die wesentlichen Grundbausteine des Data-Vault-Modells und die Hauptargumente für den Einsatz kennen. Zusätzlich werden Vorgehensweisen zur Umsetzung von Data-Vault-ETL-Prozessen und modernen Data-Warehouse-Architekturen vorgestellt. Darüber hinaus sind die Teilnehmer nach dem Seminarbesuch in der Lage, auf der Basis von Data Vault agile Entwicklungsmethoden effizient in der Praxis umzusetzen. Das Seminar ermöglicht den Teilnehmern auch, den Einsatz von Data Vault für eigene Projekte zu bewerten oder effektiv als Entwickler in einem Data-Vault-Projekt zu starten.

Zielgruppe

  • Datenmodellierer, Designer, Architekten, Projektleiter

Voraussetzungen

Vorausgesetzt wird Grundlagenwissen über  Datenbanken, relationale Datenmodellierung, Grundkenntnisse DWH-Architekturen und ETL-Prozesse.

Sprachen

Seminar: Deutsch

Methode

Die Inhalte werden in Vortragsform vermittelt und anhand von Beispielen und Übungsaufgaben durch die Teilnehmer weiter vertieft.

Alle TDWI-Intensivseminare werden mit einer Teilnehmergruppengröße ab mind. 3 Teilnehmern garantiert durchgeführt.

Informationen

In der Teilnehmergebühr sind folgende Leistungen enthalten: 

  • Seminarvortrag über 2 Tage, ein persönlicher Schulungsordner mit ausführlichen, begleitenden Seminarunterlagen 
  • Ihre persönliche Teilnahmebescheinigung 
  • Catering an allen Seminartagen, inkl. Begrüssungskaffee, Mittagessen plus 2 Getränke, diverse Tagungsgetränke sowie 2 Kaffeepausen mit Snacks 
  • ein kostenloses, 1-jähriges Abonnement der Fachzeitschrift BI-Spektrum

Ihre Frühbucher-Vorteile:

  • Frühbucher-Rabatt: 100 Euro Rabatt - gültig für alle Anmeldungen bis 4 Wochen vor Seminarbeginn! 
  • TDWI-Germany e.V.-Mitgliederpreis + Frühbucher-Rabatt

Informieren Sie sich hier über die Teilnehmergebühren!

Dieses Seminar ist auch als Inhouse-Seminar durchführbar!
Weitere Informationen über Inhouse-Schulungen finden Sie hier!


Lizenzpartner von TDWI Logo Sigs Datacom