Herunterladen Inhalt Inhalt Diese Seite drucken

IBM SPSS Benutzerhandbuch Seite 9

Inhaltsverzeichnis

Werbung

Anmerkung: Die Operatoren !=, <> und LIKE scheinen in bestimmten Hadoop-Verteilun-
gen nicht zu funktionieren. Hierbei handelt es sich um ein Kompatibilitätsproblem zwi-
schen HCatalog und den betreffenden Verteilungen.
HCatalog Field Mappings
Zeigt die Zuordnung eines Elements in HCatalog zu einem Feld in der Datenquelle an.
Klicken Sie auf Edit, um die Feldzuordnungen zu ändern.
Anmerkung: Nach der Erstellung einer HCatalog-basierten Datenquelle, die Daten aus
einer Hive-Tabelle bereitstellt, stellen Sie möglicherweise fest, dass Analytic Server das
Lesen von Daten aus einer Datenquelle immer dann mit erheblicher Verzögerung beginnt,
wenn die Hive-Tabelle aus einer großen Anzahl Dateien erstellt wird. Wenn Sie solche
Verzögerungen feststellen, müssen Sie die Hive-Tabelle mit einer kleineren Anzahl von
umfangreichen Datendateien erneut erstellen und die Anzahl Dateien dabei auf 400 oder
weniger reduzieren.
Geospatial Selections
Geben Sie die Parameter für den Zugriff auf geografische Daten an.
Geospatial type
Die geografischen Daten können aus einem Online-Kartenservice oder einer Shapefile
stammen.
Wenn Sie einen Kartenservice verwenden, geben Sie die URL des Service an und wählen
Sie den gewünschten Kartenlayer aus.
Wenn Sie eine Shapefile verwenden, wählen Sie die Shapefile aus oder laden Sie sie hoch.
Eine Shapefile ist ein Set von Dateien mit einem gemeinsamen Dateinamen, die in dem-
selben Verzeichnis gespeichert werden. Wählen Sie die Datei mit dem Suffix SHP aus.
Analytic Server sucht und verwendet die anderen Dateien. Es müssen immer zwei andere
Dateien mit den Suffixen SHX und DBF vorhanden sein. Abhängig von der Shapefile
können auch einige zusätzliche Dateien vorhanden sein.
Preview and Metadata
Nachdem Sie die Einstellungen für die Datenquelle angegeben haben, klicken Sie auf Preview
and Metadata, um die Datenquellenspezifikationen zu prüfen und zu bestätigen.
Output
Datenquellen mit Datei- oder Datenbankinhaltstyp können über die Ausgabe von Datenströmen
angehängt werden, die in Analytic Server ausgeführt werden. Wählen Sie Make writeable aus,
um das Anhängen zu aktivieren, und gehen Sie dann wie folgt vor:
v Wählen Sie für Datenquellen mit Datenbankinhaltstyp eine Ausgabedatenbanktabelle aus, in
die die Ausgabedaten geschrieben werden.
v Für Datenquellen mit Dateiinhaltstyp:
1. Wählen Sie den Ausgabeordner aus, in den die neuen Dateien geschrieben werden.
Tipp: Verwenden Sie für jede Datenquelle einen separaten Ordner, damit die Zuordnungen
zwischen Dateien und Datenquellen leichter verfolgt werden können.
2. Wählen Sie ein Dateiformat aus: entweder CSV (durch Kommas getrennte Werte) oder
Splittable binary format.
3. Wählen Sie optional Make sequence file aus. Dies ist hilfreich, wenn Sie aufteilbare kom-
primierte Dateien erstellen wollen, die in nachfolgenden MapReduce-Jobs verwendet wer-
den können.
Wählen Sie Newlines can be escaped aus, wenn Ihre Ausgabe das Format CSV hat und
4.
Sie über Zeichenfolgefelder verfügen, die integrierte Zeilenvorschub- oder Rücklaufzeichen
enthalten. Dadurch wird jeder Zeilenumbruch als umgekehrter Schrägstrich gefolgt vom
Buchstaben "n" geschrieben, ein Rücklauf wird als umgekehrter Schrägstrich gefolgt vom
Buchstaben "r" und ein umgekehrter Schrägstrich wird als zwei aufeinanderfolgende umge-
Kapitel 1. Analytic Server-Konsole
5

Werbung

Inhaltsverzeichnis
loading

Inhaltsverzeichnis