Angenommen, Sie sollen Explorative Datenanalyse bei einem mittelständischen Online-Händler nutzen. Ihr Ziel ist es, die Bindung der Kund:innen zu erhöhen. Das Unternehmen verfügt naturgemäß über eine Vielzahl von Informationen. Dazu gehören:
Alter der Kund:innen
Bestellhäufigkeit und Bestellwert
Art der gekauften Produkte
Anzahl der Retouren
Dauer der Kund:innenbeziehung
Letztes Kaufdatum
Informationen zur Kündigung (ja/nein)
Schritt 1: Qualitativer und Quantitativer Überblick
Zuerst verschaffen Sie sich ein Bild von den Daten. Woher kommen sie? Sind sie vollständig? Gibt es fehlende Werte oder unrealistische Angaben? Mit Excel könnten Sie hier erste Stichproben nehmen und die Größe des Datensatzes prüfen.
Schritt 2: Prüfung einzelner Variablen
Erstellen Sie ein Histogramm für das Alter der Kund:innen. Sie sehen sofort, ob Ihre Kund:innen eher jung oder alt sind und in welchen Altersgruppen sie liegen. die meisten Kund:innen liegen. Ein Boxplot der Bestellwerte zeigt Ihnen Ausreißer: Gibt es Kund:innen mit extrem hohen oder niedrigen Werten? Welche Produkte dominieren das Kaufverhalten?
Schritt 3: Beziehungen entdecken
In dieser Phase setzen Sie Variablen in Beziehungen. Ein Streudiagramm zwischen „Dauer der Kundenbeziehung“ und „Bestellhäufigkeit“ könnte zeigen, ob langjährige Kund:innen tendenziell häufiger bestellen. Sie könnten auch die „Anzahl der Retouren“ nach „Produktart“ analysieren. So entdecken Sie vielleicht, dass bestimmte Produktkategorien eine unverhältnismäßig hohe Retourenquote aufweisen.
Schritt 4: Hypothesenbildung und Iteration
Aus diesen Beobachtungen können Sie erste Hypothesen ableiten. Etwa: „Kund:innen, die vorrangig Produkte aus dem Premiumsegment kaufen, tätigen zwar weniger Bestellungen pro Jahr, generieren aber einen deutlich höheren Gesamtumsatz und wandern seltener ab.“ Diese Hypothesen können Sie dann weiter präzisieren, mit exakteren Daten untermauern und die entsprechenden Schlüsse ableiten.