Road to Dashboards: Datenintegration

13.03.2024

Wie entstehen Dashboards und welche Bausteine sind dafür unerlässlich?

Dashboards sind ein unverzichtbares Instrument, um aus der Überfülle an Daten informative Einsichten zu gewinnen und ermöglichen es uns datengetriebene Entscheidungen zu treffen.

In diesem Beitrag lenken wir zunächst den Fokus auf den Grundstein von Dashboards: die Datenintegration. Denn in der komplexen Welt der Datenanalyse bilden Dashboards nur die sichtbare Spitze des Eisbergs, während die Datenintegration und -transformation die tragenden Säulen darunter bilden.

Grundsteine auf dem Weg zu einem Dashboard
Abbildung 1: Grundsteine von Dashboards, Quelle: Eigene Darstellung

 

Datengetriebene Entscheidungsfindung

Als praxisnahen Anwendungsfall soll der Umsatz eines Medizintechnik Anbieters untersucht werden. Dabei stellen sich einige Fragen:

  • Wie haben sich die Umsätze entwickelt?
  • Wie lief es im Vergleich zum Vorjahr?
  • Wie setzen sich die Umsätze zusammen?
  • Wie viel Umsatz hat Kundengruppe X im Monat Y generiert?
  • Welche Zusammenhänge gibt es zwischen Kundengruppen und Produkten?

Im Folgenden präsentieren wir ein Muster-Dashboard, das konzeptionell zeigt, wie mithilfe von Dashboards Informationen aus komplexen Umsatzdaten gewonnen werden.

 

  1. Umsatzerlöse nach Kunde
Dashboard zur Visualisierung der Umsatzerlöse nach Kunden
Abbildung 2: Muster-Dashboard Umsatzerlöse nach Kunden, Quelle: Eigene Darstellung
  • Ganzheitliches Verständnis der Umsatzentwicklung durch das gestapelte Säulendiagramm
  • Gleichzeitiger Vergleich mit Vorjahreswerten durch die grauen Säulen
  • Umsatzaufteilung durch eine farbliche Trennung der Kunden
  • Detaillierter Einblick in die Umsatzzahlen durch die Tabelle
  • Trenderkennung durch eindeutige Höhe- und Tiefpunkte
  • Filteroptionen für eine Detailanalyse (Umsatz nach Kunde, Produkt/Dienstleistung, Geschäftsjahr und Kennzahl)

 

  1. Umsatzerlöse nach Produkt/Dienstleistung
Dashboard zur Visualisierung der Umsatzerlöse nach Produkten
Abbildung 3: Umsatzerlöse nach Produkt/Dienstleistung, Quelle: Eigene Darstellung
  • Prozentualer Anteil der Kunden und Produkte/Dienstleistungen durch das Kuchendiagramm einfach zu erkennen
  • Zusammenhang zwischen Kunde und Produkt/Dienstleistung:
    • Das Sankey-Diagramm kreiert eine visuelle Verbindung zwischen den Kundengruppen und der Produkte/Dienstleistungen
    • Durch die verknüpften Dimensionen kann nachverfolgt werden für welche Produkte/Dienstleistungen sich die Kunden interessiert haben

 

Datenintegration

Bevor eine tiefgehende Datenanalyse möglich ist, müssen die relevanten Daten erhoben werden. Ziel der Datenintegration ist es dabei, sowohl strukturierte als auch unstrukturierte Datensätze in einen konsistenten Datensatz zu überführen. Im Folgenden wird ein beispielhafter Prozess der Datenerhebung skizziert, der jedoch abhängig von den spezifischen Anforderungen variieren kann.

 

Collect

Der erste Schritt des Integrationsprozesses ist die Identifizierung der Quellsysteme sowie deren zugehörigen Schnittstellen. Dies ermöglicht eine genaue Extraktion der Daten, die üblicherweise durch direkte Abfragen, API-Schnittstellen und Datenexporte erfolgt. Dabei sollte das Datenvolumen und eine potenzielle Netzwerkbelastung im Auge behalten werden, um Performanz zu gewährleisten. Zudem ist die Sicherstellung einer hohen Datenqualität von größter Bedeutung; hierbei spielen Vollständigkeit, Genauigkeit und die Relevanz der Daten eine zentrale Rolle. Ein weiteres entscheidendes Element ist die Wahl zwischen der Echtzeiterfassung von Daten oder der Sammlung in periodischen Batches, die stark vom spezifischen Anwendungsfall abhängt.

 

Store

Abschließend werden die unterschiedlich abstammenden Daten kombiniert und an einem zentralen Speicherort, wie einem Data Warehouse zusammengeführt. Über die Datenpipeline geschieht dann die endgültige Übertragung an die Zieldatenbank. Hier gilt auch zu beachten, ob die Daten effizient abgerufen werden können, oder eine Anpassung der Rohdaten notwendig ist.

Daten werden an zentralem Speicherort zusammengeführt
Abbildung 4: Daten an zentralem Speicherort (z.B. Data Warehouse) zusammenführen, Quelle: Eigene Darstellung

 

Was, wenn notwendige Daten fehlen?

Es ist nicht unüblich, dass Daten fehlen. Meist handelt es sich dabei um ein Problem mit den Daten selbst oder um technische Herausforderungen.

Mögliche Ursachen und Lösungen:

  • Fehlerhafte Extraktion
  • Extraktionslogik und Skripte auf Fehler überprüfen
  • Verfügbarkeit, Zugriffsberechtigung und Konfiguration der Datenquelle überprüfen
  • Datenformat überprüfen
  • Daten fehlen bereits bei der Datenquelle
  • Quellsystem nachpflegen
  • Quellsystem wurde verändert
  • Strukturänderung der Datenerfassung beachten
  • Updates überprüfen

Alternativ ist es möglich fehlende Informationen durch Datenbereicherungen zu ergänzen. Dabei können die Werte abgeleitet werden, indem entweder zusätzliche Datenquellen einbezogen, sie neu berechnet oder geschätzt werden.

 

Fazit

Die Datenintegration markiert den ersten entscheidenden Schritt, um ein solides Datenfundament zu schaffen. Sie ermöglicht es, aus verschiedenen Quellen stammende Daten effizient zusammenzuführen und bereitet den Weg für die folgenden Phasen: die Datentransformation und -visualisierung. Durch die erfolgreiche Integration von Daten legen wir somit den Grundstein für ein tiefgreifendes Verständnis und die Fähigkeit, datengetrieben handeln zu können.

Im nächsten Schritt müssen wir uns Frage widmen, wie aus den gesammelten Daten aussagekräftige Informationen für die Datenvisualisierung gewonnen werden können. Dazu aber mehr im nächsten Beitrag!

Zurück zur Übersicht

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*Pflichtfelder

*