R-Transformation
Die R-Syntax im Knoten sollte aus Operationen bestehen, die jeweils nur für einen einzel-
nen Datensatz ausgeführt werden.
Feldoperationen
Alle Feldoperationen werden unterstützt, mit Ausnahme der Anonymisierungs-, Transponier-,
Zeitintervall- und Verlaufsknoten. Weitere Hinweise zur Funktionalität von unterstützten Knoten
folgen.
Autom. Datenvorbereitung
v Das Trainieren des Knotens wird nicht unterstützt. Die Anwendung der Transformatio-
nen in einem trainierten Knoten des Typs Autom. Datenvorbereitung auf neue Daten
wird unterstützt.
Ableiten
v Alle Ableitungsfunktionen werden unterstützt, mit Ausnahme von Sequenzfunktionen.
v Das Ableiten eines neuen Felds als Anzahl ist im Grunde genommen eine Sequenzope-
ration und wird deshalb nicht unterstützt.
v Aufteilungsfelder können nicht in demselben Datenstrom abgeleitet werden, der sie als
Aufteilungen verwendet. Sie müssen zwei Datenströme erstellen: einen, der das Auftei-
lungsfeld ableitet, und einen, der das Feld als Aufteilungen verwendet.
Füller
v Unterstützt dieselbe Funktionsgruppe wie der Ableitungsknoten.
Klassierung
Die folgende Funktionalität wird nicht unterstützt:
v Optimales Klassieren
v Ränge
v N-Perzentile -> Perzentilmethode: Summe der Werte
v N-Perzentile -> Bindungen: "In aktuellem beibehalten" und "Zufällig zuweisen"
v N-Perzentile -> Benutzerdefiniert N: Werte über 100 und jeder N-Wert, bei dem 100 %
N ungleich null ist.
RFM-Analyse
v Die Option "In aktuellem beibehalten" für die Handhabung von Bindungen wird nicht
unterstützt. RFM-Scores (Recency, Frequency, Monetary - Aktualität, Häufigkeit, Geld-
wert) stimmen nicht immer mit denen überein, die von Modeler aus denselben Daten
berechnet werden. Die Scorebereiche sind identisch, Scorezuweisungen (Klassennum-
mern) können sich jedoch um 1 unterscheiden.
Grafiken
Alle Diagrammknoten werden unterstützt.
Modellierung
Die folgenden Modellierungsknoten werden unterstützt: Zeitreihen, TCM, Tree-AS, C&R-Baum,
Quest, CHAID, Linear, Linear-AS, Neuronales Netz, GLE, LSVM, TwoStep-AS, Random Trees,
STP und Assoziationsregeln. Weitere Hinweise zur Funktionalität dieser Knoten folgen.
Linear Beim Erstellen von Modellen für große Datenmengen und -vielfalt wird das Ziel norma-
lerweise in "Sehr große Datasets" geändert oder es werden Aufteilungen angegeben.
v Fortlaufendes Training vorhandener PSM-Modelle wird nicht unterstützt.
v Das Modellerstellungsziel Standard wird nur empfohlen, wenn Aufteilungsfelder so
definiert sind, dass die Anzahl an Datensätzen in den einzelnen Aufteilungen nicht "zu
groß" ist, wobei die Definition von "zu groß" von der Leistungsstärke einzelner Knoten
in Ihrem Hadoop-Cluster abhängt. Im Gegensatz dazu müssen Sie auch darauf bedacht
Kapitel 2. SPSS Modeler-Integration
27