Unser Ansatz

Informatik unterscheidet sich von anderen Wissenschaften. Informatiker konzentrieren sich in der Regel stärker auf Algorithmen und weniger auf die verwendeten Datensätze. Zudem ist in der Informatik alles entweder falsch oder wahr – in anderen wissenschaftlichen Disziplinen ist dies selten der Fall (Skiena 2017).

Data Science ähnelt in dieser Hinsicht eher den anderen Wissenschaften. Es ist in der Regel sehr kompliziert, Datensätze zu konstruieren, und probabilistische Ansätze spielen eine wichtige Rolle.

Der erste Ansatz ist das hypothesengetriebene Paradigma. Eine Forschungsarbeit beginnt üblicherweise mit einer Hypothese auf Basis der Literatur.

Der zweite Ansatz ist das datengetriebene Paradigma, das mit einem Datensatz beginnt und fragt, welche interessanten Fragen damit adressiert werden können. Ergebnisse aus diesem Ansatz sollten stets mit Vorsicht betrachtet werden.

Es gibt zwei häufige Problemstellungen: Klassifikation und Vorhersage. Der neue datengetriebene Ansatz verändert das traditionelle Betriebsmodell grundlegend. Daten stehen im Zentrum des Geschäftsmodells.