Von Matthias Jung auf Mittwoch, 15. Januar 2025
Kategorie: Data Governance

Data Governance #02 – A Beautiful Mind, ähm Data Domain: Strukturen brauchen die Daten 1/2

Zur Klärung der zentralen Begriffe haben wir ein Glossar zur Beitragsreihe Data Governance für Sie eingerichtet. 

Nach unserem ersten Teil, in dem wir die Grundlagen von Data Governance und die Rolle eines Data Catalogs beleuchtet haben, gehen wir nun einen Schritt weiter.

In der Welt der Data Governance ist der Begriff der Data Domain von zentraler Bedeutung. Doch was genau steckt dahinter? Sie bildet die organisatorische Struktur für den Umgang mit den Daten(-objekten) und definiert, wer innerhalb dieser Organisation für diese Daten verantwortlich ist. Dabei kann es sich um eine Vielzahl von Themen handeln – von Kundendaten über Finanzdaten bis hin zu Logistik- oder Produktionsdaten, die in einer Data Domain verwaltet werden.

Der Aufbau einer Data Domain lässt sich als eine strukturierte und systematische Vorgehensweise vorstellen, bei der eine Organisation bestimmte Datenbereiche klar definiert, verwaltet und für die Nutzung durch verschiedene Abteilungen und Stakeholder bereitstellt. Dabei wird nicht nur auf technische Aspekte geachtet, sondern auch auf organisatorische Verantwortlichkeiten, Prozesse und Richtlinien, die die Qualität und den Nutzen der Daten sicherstellen.

Im Kontext der MySQL sakila-Datenbank könnte eine Data Domain beispielsweise die Verwaltung der Kundendaten und deren Verleihaktivitäten umfassen. Hierbei wäre die customer-Tabelle die zentrale Quelle für alle relevanten Informationen zu Kunden, die in der Datenbank gespeichert sind. Aber auch die Verleihdaten (aus der rental-Tabelle) könnten eine eigene Data Domain bilden, die speziell für die Analyse der Mietaktivitäten verantwortlich ist.

Wie baut man eine Data Domain auf?

Der Aufbau einer Data Domain ist vor allem eine organisatorische Aufgabe und kein technisches Thema. Es geht darum, zu bestimmen, welche Datenbereiche in der Organisation wichtig sind und wer für die Verwaltung und Pflege dieser Daten verantwortlich ist. Dies geschieht in enger Zusammenarbeit zwischen verschiedenen Abteilungen, da jede Data Domain im Wesentlichen von den Fachabteilungen genutzt wird. Im Falle der sakila-Datenbank wären beispielsweise Marketing und Kundenservice direkt an der Verwaltung der Kundendaten interessiert, während die IT-Abteilung die technische Infrastruktur bereitstellt.

Die wichtigsten Schritte beim Aufbau einer Data Domain sind:

1. Definition der Datenbereiche: Bestimmen Sie die wesentlichen Datenbereiche innerhalb Ihrer Organisation. Welche Datentypen sind für die Geschäftsprozesse entscheidend? Welche Daten müssen gepflegt und geschützt werden? Bei der sakila-Datenbank könnte dies beispielsweise die Unterscheidung zwischen Kundendaten, Filmdaten und Rechnungsdaten sein.

2. Festlegung von Verantwortlichkeiten: Jede Data Domain benötigt klare Verantwortliche, die für die Qualität, Sicherheit und Nutzung der Daten zuständig sind. Dies sind oft die sogenannten Data Stewards. Diese Rolle ist innerhalb der Data Governance entscheidend, da sie sicherstellt, dass alle Daten korrekt und konsistent sind sowie den festgelegten Standards entsprechen.

3. Prozesse und Richtlinien etablieren: Für jede Data Domain müssen klare Prozesse und Richtlinien definiert werden, wie mit den Daten umgegangen wird – von der Erhebung über die Speicherung bis hin zur Nutzung. Hier spielen sowohl technische Maßnahmen (wie Datenbank-Constraints) als auch organisatorische Maßnahmen (wie regelmäßige Datenbereinigungen) eine Rolle.

4. Verknüpfung der Data Domains: Besonders in größeren Organisationen kann es mehrere Data Domains geben, die miteinander interagieren. Ein zentraler Punkt bei der Gestaltung einer Data Domain ist es, Schnittstellen zu definieren, um Daten zwischen verschiedenen Domänen zu integrieren. Im Fall der sakila-Datenbank könnte dies bedeuten, dass die Kundendaten aus der customer-Tabelle mit den Verleihdaten aus der rental-Tabelle verbunden werden.

Warum ist die Data Domain ein organisatorisches Thema?

Die Data Domain ist primär ein organisatorisches Konzept, da sie klar definiert, welche Personengruppen für welche Daten verantwortlich sind und welche Prozesse für deren Pflege und Verwaltung notwendig sind. Dies betrifft die Zusammenarbeit zwischen Fachabteilungen, Datenverantwortlichen und IT. Ein gutes Beispiel aus der Praxis ist die Rolle des Data Stewards, der als organisatorischer Brückenbauer fungiert und dafür sorgt, dass die Daten innerhalb einer Data Domain nach den definierten Regeln gepflegt werden.

Technologische Maßnahmen (wie Datenbank-Constraints) spielen zwar eine Rolle, doch letztlich müssen diese in einem organisatorischen Kontext implementiert und überwacht werden. Wenn also die Adressdaten in der customer-Tabelle durch technische Constraints wie "NOT NULL" geschützt werden, stellt der Data Steward sicher, dass keine fehlerhaften Adressen eingegeben werden und dass im Falle eines Umzugs der Kunden die Daten entsprechend aktualisiert werden. Ohne einen klaren organisatorischen Rahmen und Verantwortlichkeiten ist es jedoch schwierig, die Datenqualität langfristig zu gewährleisten. 

Wir bauen eine Data Domain

Wie könnte eine Data Domain für unsere „Blockbuster Bytes"-Datenbank „sakila" aussehen? In einer lebhaften Diskussion mit der Führungsebene und Fachabteilungen haben wir uns entschlossen unsere Daten den folgenden vier Domain-Bereichen und damit auch vier verantwortlichen Data Domain Owner unterzuordnen:

  1. Movies
  2. Customer
  3. Staff & Store
  4. Payments

Jede dieser Domains stellt einen logischen Bereich innerhalb unserer Organisation (und unserer aktuell einzigen Datenbank) dar. Der jeweilige Data Domain Owner ist für die strategische Ausrichtung und Governance einer bestimmten Daten-Domain verantwortlich. Er sorgt dafür, dass die Daten den Unternehmenszielen entsprechen und überwacht deren Nutzung und Compliance. Der Data Steward hingegen ist operativ tätig und kümmert sich um die tägliche Pflege der Datenqualität, wie die Erfassung und Validierung von Daten. Während der Data Domain Owner die Gesamtstrategie für eine Daten-Domain festlegt, stellt der Data Steward sicher, dass die Daten im Einklang mit diesen Vorgaben korrekt und konsistent genutzt werden.

Fazit

Die Data Domain ist ein entscheidendes Konzept in der Data Governance, das nicht allein durch technische Maßnahmen definiert wird, sondern vor allem organisatorisch gestaltet werden muss. Es geht darum, die richtigen Verantwortlichen zu bestimmen, klare Prozesse zu etablieren und die Daten auf einer strukturierten und systematischen Basis zu verwalten. Gerade in komplexeren Unternehmen ist es wichtig, dass die Data Domains mit klaren Verantwortlichkeiten und gut etablierten Arbeitsabläufen ausgestattet werden, um die Qualität und den Wert der Daten langfristig zu sichern.

P.S. A Beautiful Mind (2001); https://www.imdb.com/title/tt0268978/mediaviewer/rm955373313/?ref_=tt_ov_m_sm 

Seminarempfehlungen

Kommentare hinterlassen