Datenanalytik in Aktion

Die Dynamik der Datenanalyse: Methoden, Prozesse und Anforderungen an Datenanalytiker:innen.
datenprofis-2000x1125-min-6630a197e1e42017404931.jpeg

Wenn Hypothesen nicht von Daten gestützt werden, drohen Fehler. In der Datenanalyse steckt die Kunst, aus abstrakten Informationen wertvolle Erkenntnisse zu gewinnen und so solide Entscheidungen zu treffen. Ihr Anwendungsspektrum reicht dabei nicht nur von der Marktforschung bis zur medizinischen Diagnostik, auch Chatbots zur Paketverfolgung, Film- und Musikempfehlungen, Gesichtserkennung oder selbstfahrende Autos sind ein Teil der Datenanalyse.

Laut dem „The Future of Jobs Report 2023“ des Weltwirtschaftsforums ist Datenanalyse eines der aussichtsreichsten Berufsfelder. Es wird erwartet, dass 80 % der befragten Unternehmen in den nächsten fünf Jahren immer mehr Big-Data-Technologien einsetzen werden, da die Datenanalyse für ihr Unternehmenswachstum und ihre digitale Transformation von entscheidender Bedeutung ist.

Laut dem statistischen Bundesamt nimmt die Menge generierter Daten ständig zu, sodass immer mehr Analyst:innen benötigt werden, die wissen, wie man Rohdaten in Insights verwandelt. Aber was steckt eigentlich hinter dem Begriff Datenanalyse und was sind die Aufgabenfelder von Datenanalyst:innen?

Welche Arten der Datenanalyse gibt es?

Es gibt verschiedene Ansätze, um die Arten der Datenanalyse zu definieren. Die wichtigsten lauten wie folgt:

  1. Deskriptive Analyse
    Sie klärt die Frage „Was ist passiert?“, indem sie quantitative Daten analysiert und darstellt. Eine deskriptive Analyse kann z. B. die Verteilung der Verkäufe nach Vertriebsteam und den durchschnittlichen Verkauf pro Teammitglied zeigen.
  2. Diagnostische Analyse
    Sie beschäftigt sich mit der Frage „Warum ist das passiert?“. Angenommen, es kommen viele Patient:innen gleichzeitig ins Krankenhaus. Die diagnostische Datenanalyse könnte zeigen, dass die Patient:innen zum Beispiel gemeinsame Symptome eines bestimmten Virus aufweisen. Dies würde helfen zu bestimmen, ob und welches Virus die Epidemie ausgelöst hat und somit das Warum beantworten.
  3. Prädiktive Analyse
    Im Gegensatz zu den vorhergehenden Analysearten, bei denen Daten untersucht und Schlussfolgerungen aus der Vergangenheit gezogen werden, werden bei der prädiktiven Analyse Daten verwendet, um die Zukunft vorherzusagen. Sie beantwortet die Frage „Was könnte in der Zukunft passieren?”. So ist es beispielsweise hilfreich zu wissen, dass eine App zum Abnehmen im Frühling häufiger heruntergeladen wird, während die Zahl der Downloads im Winter sinkt. Daher ist es besser, Updates im Winter zu planen, damit weniger Benutzer:innen von möglichen Ausfällen betroffen sind.
  4. Präskriptive Analyse
    Die präskriptive Analyse fasst die Ergebnisse der ersten drei Analysearten zusammen und formuliert daraus Handlungsempfehlungen für Unternehmen. Sie beantwortet die Frage „Was machen wir damit?“. Auf der Grundlage der Ergebnisse dieser Analyse kann ein Unternehmen eine Strategie für 5 bis 10 Jahre entwickeln.

Methoden der Datenanalyse

  1. Clusteranalyse ordnet Daten nach Gemeinsamkeiten und wird oft genutzt, um versteckte Muster in Daten aufzudecken. Marketingexpert:innen können beispielsweise Kund:innen anhand von demografischen Informationen oder anderen Kriterien in Cluster aufteilen, um Angebote zu personalisieren. Eine individuelle Zuordnung für einzelne Kund:innen ist dabei allerdings nicht möglich.
  2. Kohortenanalyse hilft dabei, das Verhalten von Benutzer:innen zu untersuchen. Sie kann nützlich sein, um den Einfluss von Kampagnen auf bestimmte Kund:innengruppen aufzuzeigen. Ein Unternehmen kann zum Beispiel unterschiedliche E-Mail-Alternativen für den Versand an dieselbe Gruppe entwickeln und überprüft anschließend die Effektivität jeder Version.
  3. Regressionsanalyse verwendet historische Daten, um zu verstehen, ob bestimmte Variablen die Ergebnisse beeinflussen. Beispielsweise hat ein Unternehmen seinen Jahresumsatz 2022 analysiert und festgestellt, dass die Produktqualität, das Ladendesign und der Kund:innenservice das Umsatzergebnis beeinflusst haben. Mithilfe der Regression kann auch analysiert werden, welche dieser Variablen sich im Laufe des Jahres 2024 verändert haben, gegenseitig beeinflusst haben, oder ob neue Variablen hinzugekommen sind.
  4. Faktorenanalyse ist ein Analyseverfahren zur Optimierung bestimmter Produkt- oder Serviceeigenschaften. Ein Beispiel wäre die Bewertung eines Produktes durch den Kund:innen: Auf welche Faktoren achten Kund:innen beim Kauf eines Produktes?
  5. Textanalyse beinhaltet das Strukturieren umfangreicher Datenmengen in Schriftform, um sie besser zugänglich zu machen. Dies umfasst auch das Durchsuchen der Daten, um genau die Informationen zu extrahieren, die für einen spezifischen Zweck relevant sind.

Prozess der Datenanalyse

Die einzelnen Phasen der Datenanalyse umfassen das Sammeln, Verarbeiten und Überprüfen von Informationen, um genaue Muster zu finden. Der Prozess setzt sich aus folgenden Schritten zusammen:

  1. Definition der Anforderungen und Ziele: Für eine erfolgreiche Analyse muss klar definiert werden, welcher Zweck verfolgt wird, welche Analyseform am besten passt und welche spezifischen Daten untersucht werden sollen.
  2. Sammlung von Daten: Datenquellen können dabei zum Beispiel Studien, Umfragen, Interviews, Beobachtungen und Fokusgruppen umfassen.
  3. Verarbeitung und Bereinigung: In dieser Phase werden sich wiederholende, ungültige oder irrelevante Daten entfernt.
  4. Analyse: Analyst:innen können eine Vielzahl von Methoden anwenden, um Daten sinnvoll zu nutzen. Dazu gehören zum Beispiel der Mittelwert, der Daten vereinfacht, indem er einen Durchschnitt darstellt. Der Median zeigt hingegen die Datenstruktur und bewahrt dabei individuelle Unterschiede.
  5. Interpretation: Die erhaltenen Ergebnisse sollten interpretiert und ein Aktionsplan auf der Grundlage der Ergebnisse vorgeschlagen werden.
  6. Visualisierung: Die Informationen müssen so dargestellt werden, dass sie leicht zu lesen und zu verstehen sind. Hierfür eignen sich u.a. Diagramme, Präsentationen oder Infografiken. Sie erleichtern den Vergleich von Datensätzen und das Erkennen von Zusammenhängen.

Fallbeispiel:

Um den Immobilienmarkt zu analysieren, setzt sich ein:e Datenanalyst:in verschiedene Ziele, wie die optimalen Kosten für Komfortwohnungen zu ermitteln. Dabei werden Daten zur Wohnlage, Wohnungstyp und -größe aus öffentlichen Quellen gesammelt und bereinigt, bevor sie analysiert werden. Aus den Ergebnissen der Analyse werden dann Schlussfolgerungen gezogen, die in Form von Infografiken dargestellt werden können.

Anforderungen an Datenanalysten:innen

Datenanalyst:innen unterstützen Unternehmen dabei, fundierte Entscheidungen für zum Beispiel die Produktentwicklung zu treffen. Deshalb sollten sie Grundkenntisse in Statistik sowie einen effektiven Umgang mit Datenbanken beherrschen, Techniken zur Datenanalyse kennen und Daten aussagekräftig visualisieren können.

Welche Tools verwenden Datenanalyst:innen?

  • Datenbank-Tools: Während Microsoft Excel Daten visualisiert, verarbeitet SQL umfangreiche Datensätze. SQL zu beherrschen ist somit essenziell für eine effektive Datenanalyse. Für das Erlernen gibt es nützliche Simulatoren, jedoch ist Praxis an realen Aufgaben empfehlenswert. Dafür eignet sich SQL Zoo als gutes Übungstool.
  • Programmiersprachen: Eine Sprache für die statistische Datenverarbeitung ermöglicht die Verarbeitung großer Datensätze. Neben anderen Sprachen sind Python und R die gebräuchlichsten in der Datenanalyse. Welche Programmiersprache am Ende zum Einsatz kommt, hängt aber vom jeweiligen Projekt ab.
  • Datenvisualisierung: Die Präsentation der Ergebnisse in einer für das Verständnis optimalen Form hilft dabei, die Arbeit des:der Analyst:in zu zeigen. Für die Visualisierung nutzen Analyst:innen oft Business Intelligence (BI)-Tools. Marktführer sind Tableau und PowerBI, doch auch Redash, Qlik sowie Python-Bibliotheken wie Matplotlib oder Plotly werden häufig verwendet.

Klischee: Datenanalyse ist Stillarbeit

Neben dien praktischen Tools sind auch Soft Skills für Datenanalyst:innen wichtig. Zu den essenziellen Soft Skills zählt die Problemlösungskompetenz. Als Analyst:in ist es entscheidend, das zu lösende Produktproblem zu verstehen, wie beispielsweise die Nichtnutzung einer Software durch Personen zwischen 30 und 35 Jahren. Du solltest in der Lage sein, Muster und Trends zu identifizieren, kritisch zu denken und mögliche Schwachstellen in deiner Arbeit aufzuspüren. 

Aber auch empathische Kommunikation ist essenziell. Denn aufgedeckte Muster und Schwachstellen müssen mit anderen Stakeholdern diskutiert werden, um die weiter Herangehensweise zu bestimmen. Das klare Vermitteln eigener Ideen ist in dieser Rolle von großer Bedeutung. Je einfacher Datenanalyst:innen ihre Arbeit erklären können, desto erfolgreicher sind ihre Präsentationen und desto wahrscheinlicher ihre Einflussnahme auf Entscheidungen. 

Bonus: Nützliche Links für Datenanalyst:innen

YouTube

  • 3Blue1Brown

    Dieser informative YouTube-Kanal hilft, die Grundlagen der Mathematik durch Visualisierung von Themen wie Analyse oder Computerwissenschaften zu verstehen. Beispiele sind u.a. die Modellierung von Epidemien, Tipps zum besseren Lösen von Problemen und Begriffserklärungen, wie zum Beispiel das Ableitungsparadoxon.

Buchempfehlungen

  • Learning from Data

    Dieses Buch behandelt die Grundlagen des maschinellen Lernens. Die Leser:innen erhalten 100 Aufgaben und Übungen, um das Gelesene in die Praxis umzusetzen und selbst komplexe Datenaufgaben zu meistern.
  • Deep Learning with Python

    Ein Buch über die Grundlagen von tiefen neuronalen Netzen. Mit seinen intuitiven Erläuterungen und praktischen Beispielen fällt es selbst Anfänger:innen leicht, das Thema zu verstehen. Der Autor behandelt komplexe Konzepte und bietet Übungen im Bereich der Verarbeitung natürlicher Sprache und generativer Modelle.
  • DAMA-DMBOK: Data Management Body of Knowledge

    Die zweite Auflage dieses Buch widmet sich der Aufbereitung von Quellen für saubere und zuverlässige Daten. Es beschreibt detailliert alle Phasen der Datenerhebung und des Datenmanagements.

Blogs

  • Towards Data Science

    Eine große Informationsquelle mit nützlichen Fallbeispielen und leicht verständlichen Texten bietet dieser Blog. Es gibt viele Beispiele für die Anwendung spezifischer Toolsund Best Practices zur Lösung verschiedener Probleme.

    ​​​​​​​Du möchtest noch mehr über den richtigen Umgang mit großen Datenmengen wissen, um deine datenbasierten Projekte effektiv umzusetzen? Dann ist unser Data Analytics-Kurs genau das richtige für dich! In 22 interaktiven Sessions, geleitet von Bruno Felix, dem Analytical Lead bei Microsoft, lernst du, wie du Daten in wertvolle Erkenntnisse verwandelst und informierte Entscheidungen triffst. Erweitere dein Wissen über Datentools wie Python, SQL und Power BI und lerne sie in praktischen Beispielen für deinen Arbeitsalltag anzuwenden. Bring deine Skills auf das nächste Level!