1. Data Science – die Kunst – aus Daten Informationen zu extrahieren

Data Science – Datenwissenschaft. Dabei handelt es sich ebenso um ein derzeit häufig zu hörendes Schlagwort wie um eine gleichsam neue und bedeutende Disziplin. Denn Daten enthalten wertvolle, hochpotente Informationen. Aufgrund der Vielfalt und Menge, die selbst in einem kleinen Unternehmen auftreten können, sind deshalb vielfach nur noch wissenschaftliche Methoden zielführend.

Digitalisierung und Daten

Mit dem Begriff Daten werden landläufig häufig ausschließlich digitale Informationen bezeichnet; etwa den Inhalt einer Tabellenkalkulations- oder Kundendatei. Tatsächlich gibt es jedoch keinen großen Unterschied zwischen analoger und digitaler Welt, wenn man den Datenbegriff etwas distanzierter betrachtet:
 

  • Beobachtungen
  • Fakten
  • Messergebnisse
  • Personendaten
  • Texte
  • Zahlenwerte
  • Zeitangaben

Das alles und noch vieles mehr sind „Daten“ – also rohe, nicht sortierte, gesichtete oder ausgewertete Angaben. Erst, wenn sie diesen Prozess durchlaufen haben, werden daraus Informationen.

Der wesentliche Unterschied bei der Digitalisierung: Hier fallen um mehrere Potenzen größere Datenmengen – ganz besonders heute, wo die Digitalisierung sowohl extrem umfassend als auch vielfältig geworden ist.
 

  • Einerseits können daraus sehr viel umfassendere, detailliertere und dadurch präzisere Informationen und darauf basierende Erkenntnisse und Vorhersagen extrahiert werden.
  • Andererseits ist es mit herkömmlichen Methoden (selbst solchen digitaler Natur) vielfach nicht mehr möglich, die heute auftretenden Datenmengen zu bearbeiten.

An diesem Punkt kommt Data Science ins Spiel.

Eine multidisziplinäre Wissenschaft

Noch nie wurden so umfassende Daten erhoben und konnten Unternehmen, Institutionen, Politiker und andere Stellen dadurch so massive Vorteile erzielen. Allerdings war es noch nie so schwierig, Daten nutzen zu können – aufgrund ihrer Masse und Vielfalt.

Data Science ist deshalb eine wissenschaftliche Disziplin, die viele Felder gleichermaßen abdecken muss:

  • IT
  • Maschinenlernen
  • Mathematik
  • Prognostik
  • Programmierung
  • Statistik
  • Stochastik
  • Wirtschaftswissenschaft

Diese und weitere Bereiche vereinen sich in der Datenwissenschaft zu einem interdisziplinären Feld, das Datenwissenschaftler und Teams von Spezialisten mit verschiedenen Schwerpunkten umfasst.

Was Data Science ist – und was nicht

Dieser interdisziplinäre Ansatz sorgt häufig für Verwirrung – sowohl hinsichtlich der Arbeitsweise als auch der Zielsetzung und den Möglichkeiten von Datenwissenschaft.

Im Kern geht es bei Data Science um konkrete Punkte:

1. Daten unterschiedlicher Art und Menge analysieren.

2. Muster erkennen und relevante Informationen extrahieren.

3. Ist- und Soll-Zustände abgleichen und definieren.

4. Handlungsempfehlungen formulieren

5.Vorgehensweisen und Prozesse optimieren.

Data Science mag deshalb zwar ein junges wissenschaftliches Feld sein, das erst in diesem Jahrtausend heranwuchs. Aber, und das sei unterstrichen, es handelt sich dabei in jeglicher Hinsicht um harte Wissenschaft, deren Teilbereiche schon seit langem etabliert sind.

Insofern kann Data Science nur so viel, wie die zugrundeliegenden Daten und die Werkzeuge zu ihrer Nutzung hergeben. Sie kann präzise analysieren und vorhersagen – jedoch nicht mehr.

Data Science ist deshalb keine Form von unseriöser Wahrsagerei. Sie ist ebenfalls nicht mit Maschinenlernen zu verwechseln – Datenwissenschaftler nutzen Maschinenlernen lediglich als eines von vielen Werkzeugen.

Nicht zuletzt ist Datenwissenschaft definitiv kein Allheilmittel für Unternehmen, die noch nie irgendetwas analysiert oder strukturiert Daten gesammelt haben und nun glauben, geradezu „magische“ Einsichten erhalten zu können.

 


2. Data, Datenwissenschaft und die Wirtschaft

„Was bringt Datenwissenschaft mir als Unternehmer?“ Bereits die Informationen aus dem vorherigen Kapitel haben bereits einige Hinweise hierauf gegeben. In diesem Kapitel möchten wir uns konkreter diesem Kontext widmen.

Die unternehmerischen Datenströme von heute

Nicht alle, aber sehr viele Unternehmen erheben heute eine große Menge von Daten. Hauptsächlich liegt das daran, weil durch digitale Herangehensweisen zwangsläufig viele Daten aufkommen. Denken wir an Demografie und die verschiedensten Faktoren unter der Rubrik „Kaufverhalten“.

Je nach Art des Unternehmens, Zahl seiner Kunden, Partner und ähnlicher Parameter treten dabei extrem viele Datensätze auf. Beispielsweise mag sich mit relativ simplen Methoden herausfinden lassen, was die durchschnittliche Kaufsumme eines bestimmten Kunden ist oder welche Produkte von welcher Altersgruppe besonders oft gekauft werden.

Die Grenze liegt jedoch dort, wo es um viel komplexere Fragestellungen geht. Etwa:
 

  • Warum kauft eine bestimmte Kundengruppe dieses Produkt eben nicht, obwohl es sich eigentlich an sie richtet?
  • Mit welcher Wahrscheinlichkeit wird ein Kunde X ein Produkt Y zu Preis Z kaufen?
  • Welches Produkt wird ein Kunde wann als nächstes kaufen?

Vielfach steckt die Antwort auf solche Fragen in einer undurchschaubaren Masse von Rohdaten verborgen – im Falle von Big Data sogar eine gigantische Masse.

Erschöpfend und seriös kann hier nur noch jene erwähnte harte Wissenschaft weiterhelfen. Eben Data Science.

Was Data Science im unternehmerischen Umfeld leisten kann

Datenwissenschaftler liefern Antworten. Allerdings ist es mit einem solchen Allgemeinplatz nicht getan. Besser wäre die Aussage, Datenwissenschaftler können sehr unterschiedliche, hochpräzise Antworten liefern – wie präzise hängt von Menge und Qualität der Rohdaten ab.
 

  • Explorative Datenanalyse: Überprüfung einer These auf Richtigkeit. 
                Beispiel: Es wird geprüft, ob die Zielgruppe wirklich perfekt ausdefiniert   wurde.
  • Prädiktive Datenanalyse: Vorhersage von Wahrscheinlichkeiten oder Werten.
                Beispiel: Basierend auf zurückliegendem Kaufverhalten wird eruiert, wie      erfolgreich ein neues Produkt sein könnte.
  • Anomalie-Erkennung: Aufdecken von Unregelmäßigkeiten in den Daten.
                Beispiel: Herausfinden, warum eine bestimmte Marketingmaßnahme aus   nicht augenscheinlich nachvollziehbaren Gründen nicht verfängt.
  • Zusammenhang-Erkennung: Finden von Gemeinsamkeiten und Verknüpfungen.
                Beispiel: Durchleuchtung eines logistischen Prozesses und aller daran beteiligten Faktoren zwecks Optimierung.
  • Mediale Analyse: Untersuchung, Auswertung und Klassifizierung von Schrift, Sprache sowie bewegten und unbewegten Bildern.
                Beispiel: Analysieren von Kundenrezensionen, um daraus Rückschlüsse auf      Positives und Negatives ziehen zu können.

Die große Stärke von Datenwissenschaft ist ihre sehr universelle, branchenunabhängige Einsetzbarkeit. Solange es ein vergleichsweise hohes Datenaufkommen gibt, lässt sich Data Science anwenden und nutzen, um dadurch eine wissenschaftlich fundierte und hochpräzise Entscheidungsfindung zu ermöglichen. Anders ausgedrückt: Praktisch jede Branche kann auf diese Fachkräfte setzen und von ihrer Arbeit profitieren.

Das ist gleichsam das hauptsächliche Ziel von Datenwissenschaft in einem unternehmerischen Kontext: den Führungskräften die bestmöglichen Informationen liefern, damit diese die richtigen Entscheidungen treffen können.

Dann braucht es nur den Willen, mitunter gegen jegliche eigene Erfahrung und jedes Bauchgefühl, derartige Eingaben umzusetzen – denn Daten lügen nicht.

3. Data Scientists: Die Fachleute hinter der Datenflut im Portrait

So vielfältig wie die Disziplinen, die Datenwissenschaft ausmachen, sind die wissenschaftlichen Backgrounds der daran Beteiligten. Und obwohl es völlig korrekt „die Datenwissenschaft“ heißt, gibt es in der Praxis gleich mehrere Berufe, die derart arbeiten – und stets verschiedene Schnittmengen haben.

Der berufliche Weg in die Datenwissenschaft

Eine der letzten Handlungen der scheidenden Kanzlerin Merkel bestand darin, Ein Programm zum Aufbau von Datenlaboren in allen Bundesministerien und im Kanzleramt auf den Weg zu bringen – abgeschlossen ist dieses Programm bis heute noch nicht. Auch in der Verwaltung ist Datenwissenschaft derzeit eher noch theoretischer Natur.  

Daher darf die Abwesenheit einheitlicher Vorgaben und Definitionen nicht verwundern. Datenwissenschaft kennt bislang nur wenige eigene Studiengänge. Häufig läuft es je nach Berufswunsch auf mathematische, betriebs- bzw. volkswirtschaftliche oder computerwissenschaftliche Bachelor- und Master-Studiengänge hinaus.

Die absolute Masse aller datenwissenschaftlichen Berufe findet sich derzeit in der Privatwirtschaft. Hier existieren Firmen, die als B2B-Dienstleister andere Unternehmen datenwissenschaftliche Leistungen offerieren und dazu ständig nach fähigen Kräften für verschiedene Positionen suchen – wobei Datenwissenschaftler durch die Bank auf sehr attraktive Einstiegsgehälter und weitere Annehmlichkeiten bauen dürfen. Fünf der wichtigsten Berufe in diesem Metier stellen wir nun abschließend schematisch vor.

Data Scientist

Data Science ist nicht nur der allgemeine Oberbergriff, sondern in Form des Data Scientist einer der Berufe der Datenwissenschaften. Sein Hauptmerkmal: Dieser Beruf ist am stärksten wissenschaftlich-theoretisch geprägt. Data Scientists arbeiten ausschließlich mit Rohdaten (oft aus dem Big-Data-Bereich) und sind dadurch typischerweise diejenigen, die den „nachgeordneten“ Datenwissenschaftlern anderer Berufsgruppen erst deren nötige Daten zur Verfügung stellen.

 

 

Kostenlose Whitepaper
Alles Wichtige aus der B2B Welt erfahren Sie hier bei uns.
 

  • aktuell und kompakt
  • alle wichtigen Daten
  • immer einen Schritt voraus
     

Data Analyst und Business Analyst

Zwei Berufe, die sich sehr stark auf diese Art der Vorarbeit stützen sind der Data Analyst und der Business Analyst. Beide Berufe haben eine gleichartige Zielsetzung: Sie sind typischerweise unmittelbare Informationslieferanten für Entscheider. Darunter gibt es jedoch Unterschiede:
 

  • Der Business Analyst analysiert sehr umfassend alle unternehmerischen Daten und Kenngrößen, wohingegen der Data Analyst stärker digital aufgestellt ist.
  • Beim Business Analyst geht es konkret um das Beraten für strategische Ziele, während der Business Analyst deutlich breiter aufgestellt ist.
  • Der Business Analyst erstellt typischerweise umfassende Vorschläge und begleitet deren Umsetzung, während sein Kollege eher rein informierend auftritt.

Beides sind Datenwissenschaftler, der eine tendiert jedoch viel stärker in eine betriebswirtschaftliche Richtung, während der andere mehr nach der technischen Seite tendiert.

Data Architect und Data Engineer

Diese beiden Berufe lassen sich am besten mit dem Verweis auf Architekten und Bauingenieure erläutern:

Der Data Architect ist ein Planer, oft ein Visionär. Sein Fokus besteht darin, Datenarchitekturen für Unternehmen zu planen, damit sie genau auf deren Wünsche und Zielsetzungen sowie die Ziele anderer Datenwissenschaftler passen.

Der Dateningenieur ist dann derjenige, der sich der technischen, konzeptuellen Umsetzung dieser Planungen widmet.

4. Fazit

Daten enthalten Informationen. Informationen sind gleich Wissen. Wissen ist gleich Macht. Angesichts dessen gibt es heute für Unternehmen kaum eine wichtigere Disziplin als diejenige der Datenwissenschaften. Denn die Digitalisierung wird unaufhaltsam nur noch größere Datenmengen erzeugen.

Selbst im größten „Heuhaufen“ unstrukturierter Daten verbergen sich immer zahlreiche „Nadeln“, von denen jede ein zentraler Schlüssel für weiteren unternehmerischen Erfolg sein kann. Data Science ist deshalb ein Feld, das kein Unternehmer unbeobachtet lassen sollte, denn in den Datensätzen stecken gigantische Chancen – es braucht nur Profis, um diese zu finden und zu extrahieren.