Skip empty lines
Gibt an, ob leere Zeilen im extrahierten Textinhalt ignoriert werden sollen. Standardwert ist No.
Line separator
Gibt die Zeichenfolge an, mit der eine neue Zeile definiert wird. Standardwert ist das Zeilenvor-
schubzeichen "\n".
SPSS Statistics-Dateityp
SPSS Statistics-Dateien (*.sav, *.zsav) sind Binärdateien, die ein Datenmodell enthalten. Für diesen Datei-
typ sind keine weiteren Einstellungen auf der Registerkarte Settings erforderlich.
Typ für aufteilbare Binärformatdateien
Gibt an, dass es sich beim Dateityp um eine aufteilbare Datei im Binärformat (*.asbf) handelt. Dieser Da-
teityp kann alle Analytic Server-Feldtypen darstellen (im Unterschied zum Dateityp CSV, der Listenfelder
nicht darstellen kann und spezielle Einstellungen für die Handhabung von integrierten Zeilenvorschub-
und Rücklaufzeichen erfordert). Für diesen Dateityp sind keine weiteren Einstellungen auf der Register-
karte Settings erforderlich.
Typ für Sequenzdateien
Sequenzdateien (*.seq) sind Textdateien, die als Schlüssel/Wert-Paare strukturiert sind. Sie werden im All-
gemeinen als intermediäres Format in MapReduce-Jobs verwendet.
Excel-Dateityp
Gibt an, dass es sich bei dem Dateityp um eine Microsoft Excel-Datei (*.xls, *.xlsx) handelt. Weitere Infor-
mationen finden Sie in „Einstellungen für Excel-Dateitypen" auf Seite 11.
Einstellungen für Dateitypen mit Trennzeichen:
Sie können die folgenden Einstellungen für Dateitypen mit Trennzeichen angeben.
Character set encoding
Die Zeichencodierung der Datei. Wählen Sie einen Java-Zeichensatznamen wie "UTF-8", "ISO-
8859-2", "GB18030" usw. aus oder geben Sie diesen an. Der Standardwert ist UTF-8.
Field delimiters
Mindestens ein Zeichen, das Feldgrenzen markiert. Jedes Zeichen wird als unabhängiges Trenn-
zeichen gesehen. Wenn Sie beispielsweise Comma und Tab auswählen (oder wenn Sie Other aus-
wählen und ,\t eingeben), bedeutet dies, dass entweder ein Komma oder ein Tabulator Feldgren-
zen markiert. Wenn Steuerzeichen als Feldtrennzeichen fungieren, werden die hier angegebenen
Zeichen zusätzlich zu den Steuerzeichen als Trennzeichen betrachtet. Wenn Steuerzeichen nicht
als Feldtrennzeichen dienen, ist "," der Standardwert; andernfalls ist der Standardwert eine leere
Zeichenfolge.
Control characters delimit fields
Legt fest, ob ASCII-Steuerzeichen, außer LF und CR, als Feldtrennzeichen betrachtet werden.
Standardwert ist No.
First row contains field names
Legt fest, ob die erste Zeile für die Festlegung der Feldnamen verwendet werden soll. Standard-
wert ist No.
Number of initial characters to skip
Die Anzahl der Zeichen am Anfang der Datei, die übersprungen werden sollen. Eine nicht negati-
ve Ganzzahl. Der Standardwert ist "0" (null).
Kapitel 1. Analytic Server-Konsole
7