Was ist eigentlich Data Science?

Oft werden die Begriffe Big Data, Data Science sowie NoSQL fälschlicherweise als Synonyme verwendet. Wir erklären in diesem Beitrag, was Data Science wirklich ist und was ein Data Scientist für seinen beruflichen Erfolg mitbringen muss.
Data Science ist nicht so jung wie es scheint
Data Science wird häufig in Verbindung mit Big Data genannt, dabei ist diese „Wissenschaft“ nicht auf diesen Kontext beschränkt. Vielmehr bezeichnet Data Science den Vorgang, bei dem rohe Daten in wertvolle Informationen umgewandelt werden, aus denen ein Unternehmen Entscheidungen treffen kann. Anders ausgedrückt: Ein Data Scientist extrahiert Wissen aus Daten.
Anders als erwartet, ist der Begriff Data Science jedoch keine Erfindung dieses Jahrzehnts. Bereits 1960 hat Peter Naur diesen Begriff als Synonym für die Informatik genutzt. Oft verwendet wird es jedoch erst seit einem halben Jahrzehnt. Heute ist der Begriff auch vielschichtiger als noch vor 50 Jahren. Denn ein Data Scientist muss viele Fähigkeiten und Kenntnisse mitbringen, um Handlungsempfehlungen aus Daten abzuleiten, die das Unternehmen dazu befähigen, effektiver zu agieren.

Diese Fähigkeiten sollte ein Data Scientist mitbringen:
Mathe und Statistik:
Zunächst bilden Mathematik und Statistik in Form von Modellen und Methoden die Grundlage, um Daten analysieren und interpretieren zu können. Die Herausforderungen in diesem Bereich sind die Qualität der Daten, die Merkmale der Stichprobe, die Gültigkeit der Verallgemeinerung, das Vertrauen an die erzielten Ergebnisse und die Balance zwischen Mensch und Computer.
Computer Science
bringt diese Theorie aus Mathe und Statistik in Aktion. Um eine Analyse großer Datenmengen zu ermöglichen, ist es notwendig, nicht nur effektive, sondern effiziente Algorithmen zu entwickeln, die auf die speziellen Datentypen zugeschnitten sind. Ohne Informatik ist die Datenwissenschaft kaum möglich und sogar unvorstellbar, wenn es um Big Data geht.
Domain Knowledge:
Last but not least ist Branchen-Wissen in diesem Bereich unerlässlich. Das ist notwendig, um die Daten und die (Geschäfts-) Prozesse des Unternehmens zu verstehen, die von der Analyse profitieren können. Außerdem sind für einen Data Scientist gute Kommunikationsfähigkeiten ein Muss, damit dieser die Sprache der Branchenexperten versteht und auch die Ergebnisse seiner Analyse verständlich kommunizieren kann. Eine Analyse ist bedeutungslos, wenn sie niemanden überzeugt, Maßnahmen zu ergreifen. Darüber hinaus erfordert Data Science Kreativität, um analytische Methoden an neue Problemstellungen in unterschiedlichen Umgebungen anzupassen.