Confluence Daten visualisieren mit Power BI

26.10.2021

Dieser Beitrag ist im Rahmen einer Werkstudenten Tätigkeit von Daryna Vitkovska verfasst worden.
“You can have data without information, but you cannot have information without data.” – Daniel Keys Moran

Datenbasierte Entscheidungen gewinnen in Zeiten von vernetzten Produkten und dem etablieren von Machine Learning und KI Methoden in Unternehmen immer mehr an Bedeutung.

Das Sammeln, Auswerten und Integrieren von Daten aus verschiedenen Quellen kann zusätzliche Informationen liefern, die zu fundierten Entscheidungen führen. Diese können z.B. die zukünftige Ausrichtung des Unternehmens oder die Unternehmensstrategie bestimmen. Mittlerweile nutzt fast jedes Unternehmen Confluence von Atlassian für sein Firmenwiki. Hier ist eine Menge an Informationen zentral und transparent verfügbar. Nach einer Weile kann sich hieraus ein richtiges Datenarchiv entwickeln.
Dieser Beitrag beschäftigt sich damit, wie man diese Daten aus Confluence nutzbar macht und somit relevante Informationen für das Unternehmen generiert. Schließlich ist nichts einfacher und sinnvoller, als bestehende Daten für den Erkenntnisgewinn und die Weiterentwicklung des eigenen Unternehmens zu nutzen.

Confluence Daten vorbereiten für die Visualisierung

Confluence bietet die Möglichkeit die Daten und Informationen in unterschiedlicher Form abzulegen: einfacher Text, Tabellen, Bilder, Anhänge etc. Für die Weiterverarbeitung dieser Daten gibt es unterschiedliche Wege. Eine davon ist mittels REST API.
Anhand eines internen Datensatzes von Diplom- und Thesisarbeiten bei doubleSlash werden wir zeigen, wie man die Daten aus einer Confluence-Seite erhalten und analysieren kann.
Die Daten sind auf einer Confluence Seite in Form von mehreren Tabellen vorhanden, die seit über 20 Jahren gepflegt wurden (Abbildung 1).

Historisch angelegte Confluence Tabelle über Diplom- und Thesisarbeiten
Abbildung 1: Historisch angelegte Confluence Tabelle über Diplom- und Thesisarbeiten; Quelle: doubleSlash

 

Als Schnittstelle hierzu wurde die Postman API Plattform benutzt. Mittels eines GET-Requests (Abbildung 2) werden hier die Daten im JSON-Format abgerufen. Da diese Daten manuell von Mitarbeitern über Jahren hinweg eingetragen wurden, sehen sie nicht immer einheitlich aus. Es ist aber notwendig die Daten in einer einheitlichen Tabelle zu speichern, um sie in Power BI zu integrieren. Dafür bietet Postman die Möglichkeit, die Daten mittels Java-Script in die benötigte Form zu bringen (Abbildung 3).

Vereinheitlichung der Daten via Postman API
Abbildung 2: Vereinheitlichung der Daten via Postman API; Quelle: doubleSlash

 

Auch die Confluence User Daten sind einfach per GET-Request zu holen. Die Daten können dann automatisch über CLI (Newman Command Line) mittels Newman Pakets von Postman aktualisiert werden. Hierfür wird ein kleines Node.js-Projekt angelegt, dass die aus Postman exportierte Test-Collection mit GET-Requests ausführt.
Somit hat man alle relevanten Daten gesammelt und gespeichert.

Confluence Daten visualisieren

Die Visualisierung der Daten wurde mit Hilfe von Power BI umgesetzt. Power BI bietet diverse Konnektoren fürs Anbinden der Datenquellen an. Des Weiteren hat man auch die Möglichkeit, die Daten vor der Nutzung zu transformieren und zu bereinigen.

Aufbau des Confluence Dashboards in Power BI

Das Dashboard besteht aus sieben Seiten, die einzelne Details zur Diplom- und Thesisarbeiten liefern.

Gesamtüberblick der geschriebenen Diplom- und Thesisarbeiten

Bereits im Jahr 1995 wurde die erste Arbeit bei doubleSlash geschrieben. Bis heute sind das 158 Arbeiten, die 148 Thesanten aus 33 unterschiedlichen Hochschulen und 32 Fachbereichen, in Kooperation mit 73 doubleSlash-Betreuern von geschrieben haben.

Gesamtzahlen von Diplom- und Thesisarbeiten
Abbildung 3: Gesamtzahlen von Diplom- und Thesisarbeiten; Quelle: doubleSlash

 

Wie sieht die Kurve der Diplom- und Thesisarbeiten bei doubleSlash in zehn Jahren aus? Das Confluence Dashboard liefert eine Antwort

Mit den Daten ist es auch möglich, eine Prognose der Diplom- und Theisarbeiten zu berechnen und diese graphisch darzustellen. Die Abbildung auf der rechten Seite das Liniendiagramm mit der Anzahl an Arbeiten, abhängig von dem ausgewählten Zeitraum.

Prognose für die nächsten 10 Jahre
Abbildung 4: Prognose für die nächsten 10 Jahre; Quelle: doubleSlash

 

Die Top Bereiche: Angewandte Informatik, Informatik und Wirtschaftsinformatik

Wie in der Tag Cloud rechts zu sehen ist, sind Angewandte Informatik, Informatik und Wirtschaftsinformatik die Fachbereiche, in denen die meisten Arbeiten geschrieben wurden. Die einzelnen Arbeiten zu den Fachbereichen sind hier auch aufgelistet. Und falls es mehr Interesse zu einem oder anderen Thema gibt, kann man den Betreuer des Themas hier sehen und bei Bedarf später kontaktieren.

Fachbereiche von Diplom- und Thesisarbeiten bei doubleSlash
Abbildung 5: Fachbereiche von Diplom- und Thesisarbeiten bei doubleSlash; Quelle: doubleSlash

 

Die TOP Five

Die Hochschule Ravensburg-Weingarten ist die Hochschule, an der am häufigsten eine Arbeit geschrieben wurde.
Auch die fünf doubleSlash Betreuer mit den meisten Arbeiten sowie die Fachbereiche sind hier dargestellt.

Top 5 Hochschulen, Betreuer und Fachbereiche
Abbildung 6: Top 5 Hochschulen, Betreuer und Fachbereiche; Quelle: doubleSlash

TreeMap

Hier kann man einfach eine oder mehrere Hochschulen sowie Fachbereich der Diplom- oder Thesisarbeiten auswählen und sich die dazugehörigen Daten ansehen. Ein klarer Favorit ist hier die Angewandte Informatik mit ganzen 35 geschrieben Arbeiten.

Diplom- und Thesisarbeiten nach Fachbereich und Hochschule
Abbildung 7: Diplom- und Thesisarbeiten nach Fachbereich und Hochschule; Quelle: doubleSlash

doubleSlash europaweit – eine Standortverteilung

Nicht nur bei deutschen Hochschulen werden Diplom- und Thesisarbeiten geschrieben, sondern z.B. auch in unserem Nachbarland Lichtenstein.
Trotz der Entfernung, teilweise über 400 km, schreiben mehrere Studierende ihre Diplom- oder Thesisarbeiten bei doubleSlash vor Ort.

Verteilung der Diplom- und Thesisarbeiten über Standorte
Abbildung 8: Verteilung der Diplom- und Thesisarbeiten über Standorte; Quelle: doubleSlash

 

Fazit: In Confluence Daten schlummern oft interessante Informationen

Dieser Beitrag zeigt, wie man Confluence Daten schnell und einfach visualisieren kann.
Der Erkenntnis Gewinn kann enorm für das Unternehmen sein. Also zögern Sie nicht, auch mal in Ihren Confluence Datenarchiven zu stöbern und die Informationen zu teilen und zu nutzen.

Mehr zu Datenvisualisierung erfahren

Zurück zur Übersicht

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*Pflichtfelder

*