Herunterladen Inhalt Inhalt Diese Seite drucken

Überblick Über Die Behandlung Von Speicherfehlern - Fujitsu SPARC Enterprise T5440 Wartungshandbuch

Vorschau ausblenden Andere Handbücher für SPARC Enterprise T5440:
Inhaltsverzeichnis

Werbung

Überblick über die Behandlung von
Speicherfehlern
Bei der Konfiguration des Hauptspeicher-Subsystems und der Behandlung von
Hauptspeicherfehlern spielt eine Reihe von Funktionen eine Rolle. Mit diesen sollten
Sie vertraut sein, um sich das Identifizieren und Beheben von
Hauptspeicherproblemen zu erleichtern. Im Folgenden wird beschrieben, wie der
Server mit Hauptspeicherfehlern umgeht.
Hinweis – Informationen zur Hauptspeicherkonfiguration finden Sie in
„Unterstützte FB-DIMM-Konfigurationen" auf Seite
Der Server arbeitet mit einer erweiterten ECC-Technologie (Error Correcting Code),
die Fehler bis zu 4 Bit in Nibble-Grenzen korrigiert, sofern sie alle dasselbe DRAM
betreffen. Wenn bei 4-GB-FB-DIMMs ein DRAM ausfällt, arbeitet das DIMM weiter.
Die folgenden Serverfunktionen sorgen unabhängig voneinander für die
Behandlung von Hauptspeicherfehlern:
POST – POST wird bei jedem Einschalten des Servers ausgeführt, je nach den
ILOM-Konfigurationsvariablen.
Bei einem korrigierbaren Hauptspeicherfehler leitet POST den Fehler zur
Fehlerbehandlung an den PSH-Dämon (Solaris Predictive Self-Healing) weiter.
Wenn POST einen nicht korrigierbaren Fehler des Hauptspeichers erkennt, wird
dieser mit dem Namen der fehlerhaften FB-DIMMs angezeigt und der Fehler
wird protokolliert. Anschließend deaktiviert POST die fehlerhaften FB-DIMMs.
Je nach Hauptspeicherkonfiguration und Position der fehlerhaften FB-DIMMs
deaktiviert POST die Hälfte des physischen Hauptspeichers im System oder die
Hälfte des physischen Hauptspeichers und die Hälfte der Prozessor-Threads.
Wenn diese Außerbetriebsetzung im normalen Betrieb erfolgt, müssen Sie die
in der Fehlermeldung genannten fehlerhaften FB-DIMMs austauschen und die
deaktivierten FB-DIMMs mit dem ILOM-Befehl set Gerät component_state=
enabled wieder aktivieren, wobei Gerät der Name des zu aktivierenden
FB-DIMMs ist (z. B. set /SYS/MB/CPU0/CMP0/BR0/CH0/D0
component_state=enabled).
Solaris Predictive Self-Healing Technologie (PSH) – Als Funktion des
Betriebssystems Solaris überwacht PSH das System mit dem Fault
Manager-Dämon (fmd) auf verschiedene Arten von Fehlern. Wenn ein Fehler
auftritt, wird ihm eine eindeutige Fehler-ID (UUID) zugewiesen und der Fehler
wird protokolliert. PSH gibt eine Fehlermeldung aus und identifiziert die
fehlerhaften FB-DIMMs.
24
SPARC Enterprise T5440 Server — Wartungshandbuch • September 2008
106.

Werbung

Inhaltsverzeichnis
loading

Inhaltsverzeichnis