Für die Prototypengenerierung haben wir bisher ein geometrisches
Clusterverfahren, das -means-Verfahren, verwendet, das diejenigen Verträge
zu einem Cluster zusammenfasst, deren Sparverhalten im
Zeitverlauf ähnlich sind. Als Ähnlichkeitsmaß haben wir
den euklidischen Abstand gewählt. Der Prototyp eines Clusters wird
durch den Clusterschwerpunkt definiert.
Mit Hilfe dieses
Verfahrens konnten wir Prototypen finden, die das Bausparkollektiv
gut abbilden und auch aus der Realität bekannt sind.
Alternativ zu dem
-means-Clusterverfahren haben wir eine neue
Methode zur Generierung der Prototypen untersucht, die auf der
Singular Value Decomposition (SVD) basiert und kein explizites
Abstandsmaß verwendet. Unter der Singular Value Decomposition
wird die Zerlegung einer Matrix
in das
Produkt zweier orthogonaler Matrizen
und
und einer
Diagonalmatrix
verstanden:
. Als Ausgangsmatrix
haben wir die Bausparmatrix
so definiert, dass die Zeilen
die Verträge und die Spalten die Bausparmerkmale wie Sparrate
(Verhältnis zwischen Spargeldeingang und Bausparsumme),
Anspargrad (Verhältnis zwischen angespartem Guthaben und
Bausparsumme) oder Bewertungszahl (Kennzahl für die Leistung des
Bausparers für das Bausparkollektiv) im Zeitverlauf
darstellen. Die Bausparmatrix kann um weitere Merkmale wie
demographische Größen (Beruf oder Alter des Bausparers)
erweitert werden. Auch hier haben wir als Datenbasis alle
Bausparverträge betrachtet, deren Sparphasen uns vollständig
bekannt sind. Bilden wir
die Singular Value Decomposition der normierten Bausparmatrix und
betrachten die zu den
größten Werten der Diagonalmatrix
gehörenden Spalten der linken orthogonalen Matrix
, dann
erhalten wir aus den zu den
größten positiven
(negativen) Spalteneinträgen gehörenden Verträgen pro Spalte
Cluster.
Die Prototypen berechnen sich als Schwerpunkte der
gefundenen Cluster. Zur Berechnung der Prototypen haben wir die
relationale Bauspar-Datenbank eingesetzt, mit deren Hilfe wir die
Cluster und die Prototypen leicht bestimmen können. Die mittels
SVD-Clusterung gefundenen Prototypen weisen einen ähnlichen
Sparverlauf wie die Prototypen der
-means-Clusterung auf und
können auch in der Realität wiedergefunden werden. Somit haben
wir hier ein zur
-means-Clusterung alternatives
Clusterverfahren an der Hand, mit dessen Hilfe wir auch weitere
Merkmale außer der Sparrate zur Bestimmung der Prototypen
hinzuziehen können, ohne einen expliziten Abstand zu berechnen.