IBM SPSS Benutzerhandbuch Seite 9

Vorschau ausblenden

Inhalt

Inhaltsverzeichnis

Anmerkung: Die Operatoren !=, <> und LIKE scheinen in bestimmten Hadoop-Verteilun-

gen nicht zu funktionieren. Hierbei handelt es sich um ein Kompatibilitätsproblem zwi-

schen HCatalog und den betreffenden Verteilungen.

HCatalog Field Mappings

Zeigt die Zuordnung eines Elements in HCatalog zu einem Feld in der Datenquelle an.

Klicken Sie auf Edit, um die Feldzuordnungen zu ändern.

Anmerkung: Nach der Erstellung einer HCatalog-basierten Datenquelle, die Daten aus

einer Hive-Tabelle bereitstellt, stellen Sie möglicherweise fest, dass Analytic Server das

Lesen von Daten aus einer Datenquelle immer dann mit erheblicher Verzögerung beginnt,

wenn die Hive-Tabelle aus einer großen Anzahl Dateien erstellt wird. Wenn Sie solche

Verzögerungen feststellen, müssen Sie die Hive-Tabelle mit einer kleineren Anzahl von

umfangreichen Datendateien erneut erstellen und die Anzahl Dateien dabei auf 400 oder

weniger reduzieren.

Geospatial Selections

Geben Sie die Parameter für den Zugriff auf geografische Daten an.

Geospatial type

Die geografischen Daten können aus einem Online-Kartenservice oder einer Shapefile

stammen.

Wenn Sie einen Kartenservice verwenden, geben Sie die URL des Service an und wählen

Sie den gewünschten Kartenlayer aus.

Wenn Sie eine Shapefile verwenden, wählen Sie die Shapefile aus oder laden Sie sie hoch.

Eine Shapefile ist ein Set von Dateien mit einem gemeinsamen Dateinamen, die in dem-

selben Verzeichnis gespeichert werden. Wählen Sie die Datei mit dem Suffix SHP aus.

Analytic Server sucht und verwendet die anderen Dateien. Es müssen immer zwei andere

Dateien mit den Suffixen SHX und DBF vorhanden sein. Abhängig von der Shapefile

können auch einige zusätzliche Dateien vorhanden sein.

Preview and Metadata

Nachdem Sie die Einstellungen für die Datenquelle angegeben haben, klicken Sie auf Preview

and Metadata, um die Datenquellenspezifikationen zu prüfen und zu bestätigen.

Output

Datenquellen mit Datei- oder Datenbankinhaltstyp können über die Ausgabe von Datenströmen

angehängt werden, die in Analytic Server ausgeführt werden. Wählen Sie Make writeable aus,

um das Anhängen zu aktivieren, und gehen Sie dann wie folgt vor:

v Wählen Sie für Datenquellen mit Datenbankinhaltstyp eine Ausgabedatenbanktabelle aus, in

die die Ausgabedaten geschrieben werden.

v Für Datenquellen mit Dateiinhaltstyp:

1. Wählen Sie den Ausgabeordner aus, in den die neuen Dateien geschrieben werden.

Tipp: Verwenden Sie für jede Datenquelle einen separaten Ordner, damit die Zuordnungen

zwischen Dateien und Datenquellen leichter verfolgt werden können.

2. Wählen Sie ein Dateiformat aus: entweder CSV (durch Kommas getrennte Werte) oder

Splittable binary format.

3. Wählen Sie optional Make sequence file aus. Dies ist hilfreich, wenn Sie aufteilbare kom-

primierte Dateien erstellen wollen, die in nachfolgenden MapReduce-Jobs verwendet wer-

den können.

Wählen Sie Newlines can be escaped aus, wenn Ihre Ausgabe das Format CSV hat und

Sie über Zeichenfolgefelder verfügen, die integrierte Zeilenvorschub- oder Rücklaufzeichen

enthalten. Dadurch wird jeder Zeilenumbruch als umgekehrter Schrägstrich gefolgt vom

Buchstaben "n" geschrieben, ein Rücklauf wird als umgekehrter Schrägstrich gefolgt vom

Buchstaben "r" und ein umgekehrter Schrägstrich wird als zwei aufeinanderfolgende umge-

Kapitel 1. Analytic Server-Konsole

Inhaltsverzeichnis

IBM SPSS Benutzerhandbuch Seite 9

Verwandte Anleitungen für IBM SPSS

Verwandte Produkte für IBM SPSS

Inhaltsverzeichnis