BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!

Melden Sie sich für unsere Newsletter an und erhalten Sie exklusive Updates zu IT-Trends, spannenden Seminaren und Neuigkeiten der ORIDX AG.

BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!

Melden Sie sich für unsere Newsletter an und erhalten Sie exklusive Updates zu IT-Trends, spannenden Seminaren und Neuigkeiten der ORDIX AG.

11 Minuten Lesezeit (2110 Worte)

Data Governance #10 – Der Club der toten Dichter oder die Fähigkeit (Data Literacy) Daten zu verstehen.

Zur Klärung der zentralen Begriffe haben wir ein Glossar zur Beitragsreihe Data Governance für Sie eingerichtet. 


Data Literacy: Warum sie der Schlüssel zum Erfolg im Datenzeitalter ist

In der heutigen, zunehmend datengetriebenen Welt ist es nicht nur wichtig, Daten zu sammeln, sondern auch zu verstehen, wie man sie richtig nutzt. Die Fähigkeit, mit Daten zu arbeiten, wird als Data Literacy bezeichnet und ist eine essenzielle Kompetenz, die zunehmend nicht nur von Data Scientists, sondern von allen Mitarbeitenden in einer Organisation gefordert wird. Data Literacy umfasst nicht nur das technische Wissen über Datenbanken oder Analysetools, sondern eine Vielzahl von Fähigkeiten, die zusammenwirken, um Daten richtig zu lesen, zu interpretieren und zu nutzen. 

Wir greifen auch in diesem Beitrag auf unsere fiktive Firma Blockbuster Bytes AG und ihr MySQL-Datenmodell (die sakila-Datenbank) zurück, welche wir bereits in den letzten Blog-Beiträgen (hier die Liste der Beiträge) vorgestellt haben.

Was ist Data Literacy?

Data Literacy ist die Fähigkeit, Daten zu lesen, zu verstehen, zu analysieren und effektiv zu nutzen, um fundierte Entscheidungen zu treffen. Diese Fähigkeit geht weit über den Umgang mit Zahlen (Daten) und/oder Tabellen hinaus. Sie umfasst mehrere spezifische Dimensionen, die zusammen den umfassenden Begriff der Data Literacy ausmachen.

Dazu gehören aus unserer Sicht unter anderem:

  • Information Literacy
  • Statistical Literacy
  • Computational Skills
  • Visual Literacy
  • Digital Literacy
  • Critical Thinking
  • Ethical/Legal Literacy

Diese Kompetenzen sind nicht isoliert zu betrachten, sondern ergänzen sich und sind notwendig, um die komplexen Herausforderungen des Datenmanagements zu bewältigen.

Die verschiedenen Ebenen der Data Literacy

1. Information Literacy: Die Grundlage der Datenkompetenz

Information Literacy bezieht sich auf die Fähigkeit, Daten zu suchen, zu identifizieren, zu bewerten und effektiv zu nutzen. Im Kontext von Data Governance bedeutet dies, dass Unternehmen sicherstellen müssen, dass ihre Mitarbeitenden die relevanten Datenquellen verstehen und gezielt darauf zugreifen können. In der sakila-Datenbank beispielsweise ist es entscheidend, dass ein Data Consumer weiß, welche Tabellen (wie „customer", „rental" oder „film") die benötigten Informationen enthalten und wie diese miteinander verbunden sind. Nur so können präzise Abfragen formuliert und die richtigen Inhalte extrahiert werden, um fundierte Entscheidungen zu treffen.

Ein praktisches Beispiel: Wenn ein:e Mitarbeitende:r herausfinden möchte, wie viele Filme in einem bestimmten Zeitraum ausgeliehen wurden, muss er wissen, dass diese Information in der Tabelle „rental" gespeichert ist und mit der Tabelle „film" über die Film-ID und mit der Tabelle „customer" über die Kunden-ID verknüpft ist. Um dies effizient und korrekt zu tun, ist eine gute Kenntnis der Struktur der Datenbank und ihrer Beziehungen entscheidend.

Hier kommt Data Governance ins Spiel: Durch den Einsatz von Data Catalogs und Metadatenmanagement können Unternehmen sicherstellen, dass die Daten (bzw. die Quellen) richtig dokumentiert und kategorisiert sind. So wissen alle Mitarbeitenden, welche Daten ihnen zur Verfügung stehen, wie diese genutzt werden dürfen und wie sie miteinander verknüpft sind. Standards in der Nomenklatur und klare Definitionen von Datenfeldern und -beziehungen helfen, Missverständnisse zu vermeiden und die Suche nach relevanten Informationen zu erleichtern.

Kurz gesagt ist Information Literacy die Kompetenz, die man braucht, um aus Daten Informationen zu gewinnen. 

2. Statistical Literacy: Die Fähigkeit, Daten richtig zu interpretieren

Statistical Literacy ist das Verständnis und die Anwendung von statistischen Methoden zur Analyse von Daten. In der sakila-Datenbank könnte dies das Ermitteln von Durchschnittswerten oder das Erkennen von Mustern bei Ausleihdaten umfassen. Ein:e Mitarbeitende:r könnte statistische Modelle einsetzen, um zu prüfen, ob bestimmte Filme häufiger ausgeliehen werden oder saisonale Schwankungen in den Ausleihzahlen bestehen.

Beispiel: Ein:e BI-Mitarbeitende:r könnte Daten zu den meistverkauften Filmen über das Jahr hinweg analysieren und dabei statistische Methoden wie den Mittelwert oder den Median verwenden, um Trends zu erkennen und fundierte Entscheidungen über zukünftige Filmbestellungen zu treffen.

Mit Skills aus dieser Kategorie ist es unter anderem möglich, aus Informationen Erkenntnisse zu gewinnen. 

3. Computational Skills: Die Fähigkeit, mit Rechnern und Programmiertools zu arbeiten

Computational Skills (Rechenkompetenz) bezieht sich auf die Fähigkeit, Daten mithilfe von Computern und Programmiertools zu sammeln, zu verarbeiten und zu analysieren. Dies umfasst z. B. das Schreiben von SQL-Abfragen, das Erstellen von Programmen, die Nutzung von Datenanalysetools sowie fortgeschrittene Datenverarbeitungsmethoden mit Programmiersprachen wie Python, R oder Tools wie Apache Spark. Computational Skills sind entscheidend für das effiziente Arbeiten mit großen und komplexen Datensätzen, insbesondere wenn es darum geht, Daten zu extrahieren, zu transformieren und zu analysieren.

In der sakila-Datenbank beispielsweise könnte ein Data Architect das Datenmodell weiterentwickeln, um Daten besser zu strukturieren, zu indizieren oder den Zugriff zu optimieren. Ein Data Consumer wiederum könnte SQL nutzen, um präzise Abfragen zu formulieren und so wertvolle Erkenntnisse zu extrahieren. 

Beispiel: SQL – Komplexe Datenabfragen und Views

Ein Data Consumer könnte ein SQL-Statement verwenden, um die meistverkauften Filme eines bestimmten Zeitraums zu ermitteln und diese Daten für Marketingzwecke weiterzuverarbeiten. Ein Beispiel für eine SQL-Abfrage, die die Anzahl der Ausleihaktionen pro Film im Jahr 2024 ermittelt:  

SELECT f.title, COUNT(r.rental_id) AS rental_count 
FROM film f 
JOIN inventory i ON f.film_id = i.film_id 
JOIN rental r ON i.inventory_id = r.inventory_id 
WHERE YEAR(r.rental_date) = 2024 
GROUP BY f.title 
ORDER BY rental_count DESC 
LIMIT 10;  

Im nächsten Schritt könnte der Data Consumer könnte diese Informationen für eine Marketingkampagne verwenden, die auf den beliebtesten Filmen basiert. Zusätzlich könnte er diese Abfrage als View in der Datenbank speichern, um sie regelmäßig zu nutzen, ohne die Abfrage immer wieder neu ausführen zu müssen. Natürlich könnte er diese View auch als Data Product in einem Data Catalog beschreiben und anderen Consumenten zur Nutzung anbieten. 

CREATE VIEW top_rented_movies_2023 AS 
SELECT f.title, COUNT(r.rental_id) AS rental_count 
FROM film f 
JOIN inventory i ON f.film_id = i.film_id 
JOIN rental r ON i.inventory_id = r.inventory_id 
WHERE YEAR(r.rental_date) = 2024 
GROUP BY f.title 
ORDER BY rental_count DESC;  

4. Visual/Visualisation Literacy: Daten verständlich darstellen

Visual Literacy, oder visuelle Kompetenz, bezeichnet die Fähigkeit, Daten so aufzubereiten und darzustellen, dass sie für die Betrachter klar verständlich und problemlos interpretierbar sind. Auch dies ist ein Stilmittel, um möglichst einfach zugänglich Daten in Informationen und/oder Erkenntnisse zu wandeln.

Ein:e Business Intelligence (BI)-Mitarbeitende:r könnte beispielsweise die Umsatzdaten des Jahres 2024 für Filme in einem anschaulichen Diagramm visualisieren, um Entscheidungsträgern die relevanten Informationen schnell und klar zu übermitteln. Dies ermöglicht es, strategische Entscheidungen effizienter und fundierter zu treffen.

Ein Beispiel für eine SQL-Abfrage, die die relevanten Umsatzdaten aus der sakila-Datenbank für das Jahr 2024 extrahiert, könnte wie folgt aussehen: 

SELECT 
    EXTRACT(YEAR FROM p.payment_date) AS year, 
    EXTRACT(MONTH FROM p.payment_date) AS month, 
    SUM(p.amount) AS total_revenue 
FROM 
    payment p 
WHERE 
    EXTRACT(YEAR FROM p.payment_date) = 2024 
GROUP BY 
    EXTRACT(YEAR FROM p.payment_date), 
    EXTRACT(MONTH FROM p.payment_date) 
ORDER BY 
    month;  

Diese Daten können dann in einer Excel-Tabelle weiterverarbeitet werden, um eine visuelle Darstellung zu erzeugen, die für das Management zugänglich und verständlich ist.

Wenn wir das Ergebnis auf Management-Ebene präsentieren, kann die Reaktion auf die gleiche Datengrundlage je nach visueller Aufbereitung stark variieren. Betrachtet das Management zunächst ein einfaches Diagramm, das die Umsätze über das Jahr hinweg darstellt, könnte es feststellen, dass der Umsatz relativ stabil ist und keine signifikante Veränderung zeigt. Die Stimmung wäre wahrscheinlich neutral, da stagnierende Umsätze als akzeptabel angesehen werden, ohne dass akuter Handlungsbedarf besteht. 

Doch eine einfache Anpassung an der Skalierung der Y-Achse (Verschieben des Startpunktes) kann die Wahrnehmung dieser Daten wohlmöglich dramatisch verändern. 

Dieser einfache, aber effektive Wechsel in der Darstellung (Startpunkt der y-Achse) die nach wie vor gleichen Daten zeigt, zeigt wie wichtig es ist, visuelle Darstellungsmöglichkeiten bewusst zu wählen, um die richtige Botschaft zu vermitteln und die gewünschte Entscheidungsebene zu beeinflussen oder eben auch nicht. Auch diese Fähigkeit (der Manipulation) beschreibt das Themengebiet der „Visual Literacy". 

5. Digital Literacy: Den Umgang mit digitalen Tools und Technologien verstehen

Digital Literacy bedeutet, dass eine Person in der Lage ist, verschiedene digitale Werkzeuge und Technologien zu verwenden, um Daten zu sammeln, zu speichern und zu analysieren.

Ein Data Security Officer könnte sicherstellen, dass die richtigen Technologien verwendet werden, um sicherzustellen, dass Daten geschützt und die DSGVO-Anforderungen erfüllt werden. Auch das Verständnis, wie Daten in Cloud-Umgebungen gespeichert und gesichert werden, gehört zu den digitalen Fähigkeiten.

Beispiel: Ein Data Owner könnte sicherstellen (prüfen), dass bei der Nutzung der sakila-Datenbank alle Datenverschlüsselungsstandards eingehalten werden, um die Datensicherheit und den Schutz der Privatsphäre zu gewährleisten. Dies kann durch die Implementierung von Sicherheitsmaßnahmen wie Encryption at Rest (Verschlüsselung von Daten, wenn sie gespeichert sind) und Encryption in Transit (Verschlüsselung von Daten während der Übertragung) erreicht werden. So können Anwender:innen instruiert werden nur noch Clients einzusetzen, die eben diese Standards auch halten können.

6. Critical Thinking: Daten kritisch hinterfragen

Critical Thinking im Kontext von Data Literacy bezieht sich auf die Fähigkeit, Daten systematisch und kritisch zu hinterfragen, um fundierte, logische und gut begründete Entscheidungen zu treffen. Es geht darum, Daten nicht nur zu sammeln und zu analysieren, sondern sie auch im Hinblick auf ihre Qualität, Relevanz und mögliche Verzerrungen zu bewerten.

Im Data Literacy Kontext bedeutet dies:

Fragen stellen: Ein:e kritische:r Mitarbeitende:r stellt Fragen zu den Daten. Woher kommen die Daten? Wer hat sie gesammelt? Sind sie zuverlässig? Welche Bias (Verzerrungen) könnten die Daten enthalten? Warum wurden bestimmte Daten ausgewählt und andere nicht? Sind die Daten repräsentativ für das gesamte Phänomen, das untersucht wird?

Für unsere Beispielfirma Blockbuster Bytes AG könnten die Fragen wie folgt lauten:

  • Sind alle relevanten Zahlungen in der payment-Tabelle erfasst? Haben wir keine verpassten Transaktionen, wie z. B. Rückerstattungen oder Stornierungen?
  • Welche Annahmen wurden bei der Erhebung dieser Zahlungen gemacht? Gibt es Unterschiede im Zahlungsverhalten je nach Filmkategorie (z. B. Blockbuster vs. weniger bekannte Filme)?
  • Hat die Datenbank eventuell fehlerhafte oder doppelte Einträge, die den Umsatz verfälschen könnten? Wurden alle Transaktionen ordnungsgemäß aufgezeichnet (z. B. keine fehlenden Werte)?

Datenvalidierung: Critical Thinking erfordert die Fähigkeit, die Genauigkeit und Vertrauenswürdigkeit der Daten zu überprüfen. Es geht darum, die Quellen zu hinterfragen und sicherzustellen, dass die Daten vollständig und aktuell sind. Zum Beispiel könnte ein:e Analyst:in bei einer Datenanalyse für eine Verkaufsprognose sicherstellen, dass keine fehlenden Werte oder Outliers (Ausreißer) die Ergebnisse verfälschen.

Kontextualisierung: Eine kritische Denkweise verlangt, dass die Daten im richtigen Kontext interpretiert werden. Ein Unternehmen könnte beispielsweise die monatlichen Umsätze überwachen, aber ohne den Kontext (wie saisonale Schwankungen oder besondere Marktbedingungen) könnten die Daten missverstanden werden. Critical Thinking hilft dabei, diese Kontextfaktoren zu identifizieren und in die Analyse mit einzubeziehen.

In unserem Fall könnte man sich die folgenden Fragen stellen:

  • Werden bestimmte Monate, wie zum Beispiel die Ferienzeit oder Feiertage, höhere Umsätze verzeichnen?
  • Gibt es andere Faktoren, wie Marketingkampagnen, besondere Filmveröffentlichungen oder Preisänderungen, die den Umsatz beeinflusst haben könnten.

Bewusstsein für Verzerrungen: Ein:e kritische:r Denker:in erkennt potenzielle Verzerrungen oder Fallstricke in der Datenerhebung und -analyse, wie z. B. Confirmation Bias (die Tendenz, nur die Daten zu suchen, die die eigenen Annahmen bestätigen) oder Sampling Bias (wenn die Daten nicht repräsentativ sind). Critical Thinking bedeutet, diese Verzerrungen zu identifizieren und zu versuchen, sie zu minimieren. 

7. Ethical/Legal Literacy: Der verantwortungsvolle Umgang mit Daten

Ethical/Legal Literacy umfasst das Verständnis der ethischen und rechtlichen Anforderungen im Umgang mit Daten. Insbesondere geht es darum, die Datenschutzbestimmungen zu respektieren und sicherzustellen, dass Daten auf ethische Weise erhoben, genutzt und geteilt werden. Ein Data Security Officer spielt hierbei eine wichtige Rolle, indem er sicherstellt, dass die Datenschutzvorgaben, wie die DSGVO, eingehalten werden, und dass die Datenverarbeitung keine schädlichen Auswirkungen auf die Privatsphäre von Einzelpersonen hat.

Beispiel: Der Data Security Officer könnte Mitarbeitende schulen, wie man personenbezogene Daten (PII) schützt und sicherstellt, dass nur autorisierte Personen Zugang zu sensiblen Daten haben. Ein weiterer Aspekt könnte die Überprüfung der Nutzung der sakila-Datenbank auf rechtliche Konformität mit geltenden Vorschriften sein, um zu gewährleisten, dass keine Daten illegal verwendet oder geteilt werden. 

Data Literacy entwickeln: Ein kontinuierlicher Lernprozess

Die Förderung der Data Literacy ist eine langfristige Aufgabe, die kontinuierliches Lernen erfordert. Schulungen, Workshops, Success Stories und der Zugang zu geeigneten Tools sind dabei unerlässlich. Die sakila-Datenbank stellt nur ein einfaches Beispiel dar – in realen Szenarien werden Unternehmen mit viel komplexeren Datenstrukturen und höheren Anforderungen konfrontiert. 

Fazit: Data Literacy als Grundlage für datengetriebenes Arbeiten

In einer zunehmend datengetriebenen Welt ist Data Literacy kein optionales Skillset mehr, sondern eine essenzielle Voraussetzung für den unternehmerischen Erfolg. Die Fähigkeit, Daten zu verstehen, zu interpretieren und sicher zu nutzen, ist der Schlüssel, um aus Daten strategischen Mehrwert zu ziehen. Letztlich hängt der Erfolg von Data Literacy davon ab, wie gut wir die gesamte Organisation in diesen kontinuierlichen Lernprozess einbinden und befähigen, datenbasierte Entscheidungen zu treffen.

P.S.: Der Club der toten Dichter (1989); https://www.imdb.com/de/title/tt0097165/

Seminarempfehlungen

Principal Consultant bei ORDIX

Ähnliche Beiträge

 

Kommentare

Derzeit gibt es keine Kommentare. Schreibe den ersten Kommentar!
Montag, 21. April 2025

Sicherheitscode (Captcha)