Newlines can be escaped
Gibt an, ob der Parser einen umgekehrten Schrägstrich gefolgt vom Buchstaben "n" oder "r" oder
einem weiteren umgekehrten Schrägstrich als Zeilenvorschubzeichen, Rücklaufzeichen oder als
umgekehrten Schrägstrich interpretiert. Wenn Zeilenumbrüche nicht durch ein Escapezeichen ent-
wertet sind, werden diese Zeichenfolgen einfach als umgekehrter Schrägstrich gefolgt vom Buch-
staben "n" usw. gelesen. Standardwert ist No.
Einstellungen für unveränderliche Dateitypen:
Sie können die folgenden Einstellungen für unveränderliche Dateitypen angeben:
Character set encoding
Die Zeichencodierung der Datei. Wählen Sie einen Java-Zeichensatznamen wie "UTF-8", "ISO-
8859-2", "GB18030" usw. aus oder geben Sie diesen an. Der Standardwert ist UTF-8.
Invalid characters
Legt fest, wie ungültige Zeichen (Bytesequenzen, die nicht Zeichen in der Codierung entsprechen)
behandelt werden sollen.
Discard
Verwirft ungültige Bytesequenzen.
Replace with
Ersetzt jede ungültige Bytesequenz durch das angegebene einzelne Zeichen.
Record length
Gibt an, wie Datensätze definiert werden. Bei Auswahl von Newline delimited werden Datensät-
ze durch Zeilenumbrüche, den Dateianfang oder das Dateiende definiert (begrenzt). Bei Auswahl
von Specific length werden Datensätze durch eine Satzlänge in Byte definiert. Geben Sie einen
positiven Wert an.
Initial records to skip
Die Anzahl der Datensätze am Anfang der Datei, die übersprungen werden sollen. Geben Sie eine
nicht negative ganze Zahl an. Der Standardwert ist 0.
Fields In diesem Abschnitt werden die Felder in der Datei definiert. Klicken Sie auf Add Field und ge-
ben Sie den Feldnamen, die Spalte, in denen Feldwerte beginnen, und die Länge der Feldwerte
an. Spalten werden in einer Datei mit null beginnend nummeriert.
Einstellungen für semistrukturierte Dateitypen:
Einstellungen für semistrukturierte Dateien bestehen aus Regeln für die Zuordnung des Dateiinhalts zu
Feldern.
Rules Table
Einzelne Regeln extrahieren Informationen aus einem Datensatz, um ein Feld zu erstellen. Kombi-
niert in einer Regeltabelle definieren Regeln alle Felder, die aus jedem Datensatz in einer Daten-
quelle extrahiert werden können.
Die Regeln in der Tabelle werden der Reihe nach auf jeden Datensatz angewendet. Wenn alle Re-
geln in der Tabelle mit dem Datensatz übereinstimmen, werden keine anderen Regeltabellen für
die Verarbeitung des Datensatzes benötigt und es wird der nächste Datensatz verarbeitet. Wenn
eine Regel in der Tabelle nicht übereinstimmt, werden alle durch vorherige Regeln in der Tabelle
extrahierten Feldwerte verworfen. Falls eine andere Regeltabelle vorhanden ist, werden die Re-
geln in der betreffenden Tabelle auf den Datensatz angewendet. Wenn keine Tabelle mit dem Da-
tensatz übereinstimmt, wird die Regel für Abweichungen (Mismatch) angewendet.
Mismatch
Sie können auswählen, dass Datensätze, die mit keiner der Regeltabellen übereinstimmen, über-
sprungen werden sollen (Skip), oder Sie können den Wert aller Felder im Datensatz auf fehlend
(Missing) setzen (null).
Kapitel 1. Analytic Server-Konsole
9