Was macht eigentlich ein Data Scientist?

Laut FAZ wurden rund 90 Prozent der bisher jemals verfügbaren Computerdaten in den letzten zwei Jahren generiert – mit exponentiell verlaufender Wachstumskurve. Das verändert nicht nur Geschäftsprozesse, sondern auch die Arbeitswelt. Um aus Daten zu lernen und darauf basierende Geschäftsmodelle zu entwickeln, ist das Berufsbild des Data Scientist wichtiger denn je. Wir haben mit unseren Experten Markus Beller und Danny Claus über ihr Berufsbild gesprochen.

Data Scientist Aufgaben

Das Bestreben, aus Daten zu lernen und neue Erkenntnisse zu gewinnen, war schon immer da – Data Scientists gibt es nicht erst seit Big Data. Aber im Gegensatz zu früher bauen heute zunehmend Geschäftsmodelle darauf auf, aus Daten Informationen zu generieren und diese gewinnbringend zu nutzen. Sie dienen dazu, Vorhersagen abzuleiten und datengetriebene Entscheidungen zu treffen. Ein Beispiel dafür ist das Feld der Predictive Maintenance, wo schon erfolgreich Maschinendaten gesammelt werden, um zukünftige Fehlerquellen oder Ausfälle vorherzusagen und damit beispielsweise die Lebensdauer der Maschinen zu verlängern.

„Durch die Cloud gibt es ganz andere Möglichkeiten, Datenmengen zu verarbeiten, zu speichern und zu nutzen“, sagt Markus Beller, Data Scientist bei doubleSlash. „Heute existieren Rechenzentren mit einer Leistung, von der man früher nur träumen konnte.

Durch die nun entstehenden Datenmengen können auch extrem komplexe Algorithmen angewendet werden.“ Mit neuen Technologien wie Apache Spark, in denen bereits Machine Learning Komponenten stecken, lassen sich diese großen Datenmengen auch schnell verarbeiten. „Es entsteht gerade eine Dynamik, die das Thema befeuert. Zudem ist der Bedarf am Markt da, um die Daten gewinnbringend zu nutzen“, sagt doubleSlash Machine Learning Experte Danny Claus.

Der Data Scientist: Schweizer Taschenmesser unter Consultants und Softwareentwicklern

Doch was genau macht so ein Data Scientist? Beim Blick auf das Aufgabenspektrum wird schnell klar: Hier ist ein Spezialist gefragt, der trotzdem Allrounder ist – ein bisschen so wie ein Schweizer Taschenmesser. „Man beschäftigt sich intensiv mit Technologien und der Auswahl und Funktionsweise von Algorithmen. Programmier-Skills wie Python schaden da nicht“, weiß Beller. Wichtig ist zudem das Wissen darüber, wie Datenmanagement funktioniert. Wie werden diese Datenmengen integriert und gespeichert? Und wie programmiert man eine Lösung, die durch den Einsatz von Algorithmen wie Regressionen, Cluster Analysen oder Text Mining einen Mehrwert bringt?

Daneben ist Expertise in Mathematik und Statistik gefragt. Denn werden Algorithmen im falschen Kontext mit den verkehrten Parametern eingesetzt, ist das Ergebnis am Ende nicht aussagekräftig oder sogar irreführend. „Man sollte in der Lage sein, die Ergebnisse kritisch zu hinterfragen“, sagt Danny Claus. Und dann ist da noch das Domänenwissen – schließlich geht es darum, spezifische Probleme zu lösen. Ein guter Data Scientist stellt dem Fachbereich die richtigen Fragen und übersetzt das dann in fachliche und technische Daten. Darüber hinaus kümmert er sich um die passende Visualisierung.

Kompetenzen von Data ScientistenAbbildung 1: Kompetenzen von Data Scientisten (Bildquelle: drewconway.com/)

Was bedeutet das am Beispiel Predictive Maintenance? Um an die Daten zu kommen, müssen die betroffenen Komponenten oder Systeme technisch angebunden bzw. vernetzt werden. Weitere Datenquellen können historische Maschinenstatus-Daten sein oder aus weiteren Quellsystemen kommen. Darauf aufbauend wird mit Hilfe der fachlichen Expertise des Data Scientist bestimmt, welche mathematischen und stochastischen Mittel (Algorithmen) genutzt werden können, um aus den verfügbaren Daten belastbare Vorhersagen zum Verhalten – beispielsweise einer Maschine – treffen zu können.

Guter Mix aus Teamwork und Expertentum

In der Realität können die Anforderungen aus Technologieverständnis, Algorithmen und Domänenwissen selten von derselben Person erfüllt werden. „Die Entwicklung wird dahin gehen, dass es Experten für technologische und fachliche Domänen gibt“, vermutet Beller. „Mich reizt genau dieser Mix: Im Team mit den entsprechenden Experten gemeinsam eine Lösung zu konzipieren“, so Beller. Er ist überzeugt: „Data Science wird die Softwareentwicklung sehr stark prägen.“ Denn das angestrebte Ziel ist, eine Software zu bauen, die intelligent ist, mitlernt und immer cleverer darin wird, Probleme zu lösen.

Auf Datenanalysten warten vielfältige Einsatzgebiete

Data Scientisten werden in sämtlichen Bereichen benötigt, z.B. wenn es darum geht, Vorhersagen zu treffen. In der Fertigung können durch Datenanalysen beispielsweise aneinander gekoppelte Fertigungsschritte besser aufeinander abgestimmt werden. Und im Supply Chain Management werden Logistikdaten ausgewertet, um die Fahrereinsätze zu optimieren.

Auch im Alltag begegnet uns Data Science: Netflix weiß, welche Serien wir schauen und spricht proaktive Empfehlungen aus. Sie basieren auf dem Nutzerverhalten anderer, die ähnliche Filme und Serien gesehen haben. Ebenso beruhen Bild- und Spracherkennungen, z.B. von Microsoft, oder das Aufdecken von Kreditkartenbetrug auf immer wieder trainierten Algorithmen.

„Es schadet nicht, sich damit zu beschäftigen, wie das alles im Hintergrund funktioniert“, erklärt Markus Beller seinen Antrieb, sich mit dem Thema auseinanderzusetzen.

Aufgaben eines Data Scientist im Überblick

  1. Fragen formulieren um herauszufinden, welcher konkrete Anwendungsfall bzw. welches Business Problem gelöst werden soll.
  2. Ideale Daten beschreiben: Welche Daten werden benötigt, um das Problem zu lösen?
  3. Potenzielle Datenquellen erkunden: Liegen die benötigten Daten vor oder müssen sie erst ermittelt werden?
  4. Daten beschaffen und so speichern, dass darauf zugegriffen werden kann.
  5. Daten bereinigen: In welcher Form werden die Daten benötigt, um das Problem zu lösen?
  6. Erkennen und analysieren: Ein Gefühl für die Güte der Daten bekommen. Sind sie nutzbar?
  7. Statistische Modelle und Vorhersagen erstellen: Algorithmen anwenden, die passend zur Problemstellung genutzt
    werden können.
  8. Ergebnisse interpretieren und mit der Problemstellung abgleichen.
  9. Ergebnisse validieren: Wurden die richtigen Daten und der richtige Algorithmus verwendet?
  10. Ergebnisse verständlich aufbereiten: Basierend auf den Ergebnissen Handlungsoptionen aufzeigen und visualisieren.
  11. Reproduzierbaren Code erstellen um zu skalieren und zu automatisieren.
  12. Ergebnisse zugänglich machen: Reporting aufbauen, um verlässlich zu lernen.

Die Anwendungsfälle werden künftig noch breiter werden und immer größeren Nutzen generieren – ob im Straßenverkehr, in Unternehmensprozessen oder im privaten Umfeld. Für Unternehmen wird es im Rahmen der digitalen Transformation zu einer Kernaufgabe, sich mit Data Science auseinander zu setzen. „Aus Daten etwas Intelligentes zu schaffen, ist einfach etwas sehr Faszinierendes“, sagt Danny Claus. Eine bessere Antwort, auf die Frage, warum Data Scientist ein Wunschberuf ist, kann es kaum geben.


Quellen: faz.net/

 

doubleSlash Newsletter

Zurück zur Übersicht

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*Pflichtfelder

*