Clustern – Der Clou von 2/Clu
Bei der Analyse quantitativer Daten möchte man die Ergebnisse in der Regel nicht nur in der Totalen interpretieren, sondern auch für in sich homogene Gruppen. Solche Teilgruppen lassen sich ohne weiteren analytischen Aufwand Adhoc definieren, etwa über soziodemographische Variablen wie Alter, Geschlecht, Einkommen, Kundengruppe wie Gelegenheitskunden, Stammkunden, Nichtkunden etc. Wenn aber Personen, die eine annähernd einheitliche Meinung zum Ziel haben, in möglichst homogene Untergruppen oder Cluster eingeteilt werden sollen, ist eine Clusteranalyse gefragt. Die anerkannten statistischen Verfahren unterscheiden hier die hierarchische und die partitionierende Analyse. Beide Verfahren haben gemein, dass sie Objekte mit möglichst großer Nähe zu einem Cluster zusammenfassen.
Bei der hierarchischen Segmentierung ist jedes Element in der Ausgangssituation allein. Dann werden die beiden ähnlichsten Objekte zu einem Cluster zusammengefasst. Es folgt die Zusammenfassung zweier weiterer Objekte zu einem anderen Cluster oder Hinzufügen eines Objektes zu einem bestehenden Cluster usw.
Beim partitionierenden Verfahren wird die gewünschte Clusteranzahl zu Beginn festgelegt. Meist ist die optimale Anzahl der Cluster nicht bekannt, und es werden mehrere Lösungen erzeugt, z. B. 3, 4, 5 und 6 Cluster. Anschließend werden die Objekte auf die gewünschte Anzahl Cluster verteilt. Die am häufigsten angewandte Verteilungsform ist die zufällige, gleichmäßige Verteilung auf die Cluster.
Beide Verfahren haben ihre Vor- und Nachteile. Der Clou liegt in der Kombination der Verfahren in zwei aufeinanderfolgenden Schritten. Hierdurch wird eine stabile Ausgangspartition ermittelt und diese Lösung schrittweise optimiert (Two-Stage-Clustering). Genau dies leistet 2/Clu. Darüber hinaus stellt das in der Statistics Box von IfaD enthaltene Tool Gütemaße für die gefundenen Lösungen bereit und wartet mit umfangreichen Optionen zur individuellen Gestaltung von Grafiken auf, um die gefundenen Cluster prägnant darzustellen.
Wir machen das für Sie!
IfaD deckt mit seinem einzigartigen Research Support ein breites Portfolio ab. Dazu zählt natürlich auch das Clustern auf der Basis Ihrer Daten. Kontakt:
Johannes Lüken
Mehr zu 2/Clu und weiteren Werkzeugen in der IfaD Statistics Toolbox lesen Sie hier.
Auch interessant: die IfaD Statistics Toobox für Data Sciences