Confluence Daten visualisieren mit Power BI
Dieser Beitrag ist im Rahmen einer Werkstudenten Tätigkeit von Daryna Vitkovska verfasst worden.
“You can have data without information, but you cannot have information without data.” – Daniel Keys Moran
Datenbasierte Entscheidungen gewinnen in Zeiten von vernetzten Produkten und dem etablieren von Machine Learning und KI Methoden in Unternehmen immer mehr an Bedeutung.
Das Sammeln, Auswerten und Integrieren von Daten aus verschiedenen Quellen kann zusätzliche Informationen liefern, die zu fundierten Entscheidungen führen. Diese können z.B. die zukünftige Ausrichtung des Unternehmens oder die Unternehmensstrategie bestimmen. Mittlerweile nutzt fast jedes Unternehmen Confluence von Atlassian für sein Firmenwiki. Hier ist eine Menge an Informationen zentral und transparent verfügbar. Nach einer Weile kann sich hieraus ein richtiges Datenarchiv entwickeln.
Dieser Beitrag beschäftigt sich damit, wie man diese Daten aus Confluence nutzbar macht und somit relevante Informationen für das Unternehmen generiert. Schließlich ist nichts einfacher und sinnvoller, als bestehende Daten für den Erkenntnisgewinn und die Weiterentwicklung des eigenen Unternehmens zu nutzen.
Confluence Daten vorbereiten für die Visualisierung
Confluence bietet die Möglichkeit die Daten und Informationen in unterschiedlicher Form abzulegen: einfacher Text, Tabellen, Bilder, Anhänge etc. Für die Weiterverarbeitung dieser Daten gibt es unterschiedliche Wege. Eine davon ist mittels REST API.
Anhand eines internen Datensatzes von Diplom- und Thesisarbeiten bei doubleSlash werden wir zeigen, wie man die Daten aus einer Confluence-Seite erhalten und analysieren kann.
Die Daten sind auf einer Confluence Seite in Form von mehreren Tabellen vorhanden, die seit über 20 Jahren gepflegt wurden (Abbildung 1).
Als Schnittstelle hierzu wurde die Postman API Plattform benutzt. Mittels eines GET-Requests (Abbildung 2) werden hier die Daten im JSON-Format abgerufen. Da diese Daten manuell von Mitarbeitern über Jahren hinweg eingetragen wurden, sehen sie nicht immer einheitlich aus. Es ist aber notwendig die Daten in einer einheitlichen Tabelle zu speichern, um sie in Power BI zu integrieren. Dafür bietet Postman die Möglichkeit, die Daten mittels Java-Script in die benötigte Form zu bringen (Abbildung 3).
Auch die Confluence User Daten sind einfach per GET-Request zu holen. Die Daten können dann automatisch über CLI (Newman Command Line) mittels Newman Pakets von Postman aktualisiert werden. Hierfür wird ein kleines Node.js-Projekt angelegt, dass die aus Postman exportierte Test-Collection mit GET-Requests ausführt.
Somit hat man alle relevanten Daten gesammelt und gespeichert.
Confluence Daten visualisieren
Die Visualisierung der Daten wurde mit Hilfe von Power BI umgesetzt. Power BI bietet diverse Konnektoren fürs Anbinden der Datenquellen an. Des Weiteren hat man auch die Möglichkeit, die Daten vor der Nutzung zu transformieren und zu bereinigen.
Aufbau des Confluence Dashboards in Power BI
Das Dashboard besteht aus sieben Seiten, die einzelne Details zur Diplom- und Thesisarbeiten liefern.
Gesamtüberblick der geschriebenen Diplom- und Thesisarbeiten
Bereits im Jahr 1995 wurde die erste Arbeit bei doubleSlash geschrieben. Bis heute sind das 158 Arbeiten, die 148 Thesanten aus 33 unterschiedlichen Hochschulen und 32 Fachbereichen, in Kooperation mit 73 doubleSlash-Betreuern von geschrieben haben.
Wie sieht die Kurve der Diplom- und Thesisarbeiten bei doubleSlash in zehn Jahren aus? Das Confluence Dashboard liefert eine Antwort
Mit den Daten ist es auch möglich, eine Prognose der Diplom- und Theisarbeiten zu berechnen und diese graphisch darzustellen. Die Abbildung auf der rechten Seite das Liniendiagramm mit der Anzahl an Arbeiten, abhängig von dem ausgewählten Zeitraum.
Die Top Bereiche: Angewandte Informatik, Informatik und Wirtschaftsinformatik
Wie in der Tag Cloud rechts zu sehen ist, sind Angewandte Informatik, Informatik und Wirtschaftsinformatik die Fachbereiche, in denen die meisten Arbeiten geschrieben wurden. Die einzelnen Arbeiten zu den Fachbereichen sind hier auch aufgelistet. Und falls es mehr Interesse zu einem oder anderen Thema gibt, kann man den Betreuer des Themas hier sehen und bei Bedarf später kontaktieren.
Die TOP Five
Die Hochschule Ravensburg-Weingarten ist die Hochschule, an der am häufigsten eine Arbeit geschrieben wurde.
Auch die fünf doubleSlash Betreuer mit den meisten Arbeiten sowie die Fachbereiche sind hier dargestellt.
TreeMap
Hier kann man einfach eine oder mehrere Hochschulen sowie Fachbereich der Diplom- oder Thesisarbeiten auswählen und sich die dazugehörigen Daten ansehen. Ein klarer Favorit ist hier die Angewandte Informatik mit ganzen 35 geschrieben Arbeiten.
doubleSlash europaweit – eine Standortverteilung
Nicht nur bei deutschen Hochschulen werden Diplom- und Thesisarbeiten geschrieben, sondern z.B. auch in unserem Nachbarland Lichtenstein.
Trotz der Entfernung, teilweise über 400 km, schreiben mehrere Studierende ihre Diplom- oder Thesisarbeiten bei doubleSlash vor Ort.
Dieser Beitrag zeigt, wie man Confluence Daten schnell und einfach visualisieren kann.
Der Erkenntnis Gewinn kann enorm für das Unternehmen sein. Also zögern Sie nicht, auch mal in Ihren Confluence Datenarchiven zu stöbern und die Informationen zu teilen und zu nutzen.