Das Stromversorgungssubsystem wird auf ähnliche Weise überwacht. Das
Überwachungssubsystem fragt in regelmäßigen Abständen die Statusregister
der Stromversorgung ab und zeigt den Status der DC-Leistungsabgabe einer
jeden Einheit an.
Erkennt das Subsystem ein Problem mit einer Stromversorgungseinheit, wird auf
der Systemkonsole eine entsprechende Fehlermeldung ausgegeben, die in der Datei
/var/adm/messages protokolliert wird. Darüber hinaus leuchten die LEDs jeder
Stromversorgungseinheit auf, um zusätzlich auf den Fehler aufmerksam zu machen.
Automatische Systemwiederherstellung
(Automatic System Recovery, ASR)
Das System verfügt über Funktionen zur automatischen Wiederherstellung
des Systems bei Ausfall der folgenden Hardwarekomponenten:
CPUs
I
Speichermodule
I
PCI-Busse und -Karten
I
FC-AL-Subsystem
I
Ethernet-Schnittstelle
I
USB-Schnittstellen
I
Serielle Schnittstelle
I
Die ASR ermöglicht die Wiederaufnahme des Systembetriebs nach weniger
schwerwiegenden Hardwarefehlern oder -ausfällen. Anhand des automatischen
Selbsttests kann der Server ausgefallene Hardwarekomponenten erkennen. Eine
in die Boot-Firmware des Systems integrierte Funktion zur automatischen
Konfiguration ermöglicht die Dekonfiguration ausgefallener Komponenten und die
Wiederinbetriebnahme des Systems. Solange der Server auch ohne die ausgefallene
Komponente arbeitet, ermöglichen die ASR-Funktionen den automatischen
Systemneustart, ohne dass dazu ein Eingriff von Benutzerseite erforderlich ist.
Wenn während des Startvorgangs eine defekte Komponente erkannt wird, wird
diese deaktiviert und der Startvorgang fortgesetzt, sofern das System auch ohne
diese Komponente funktionsfähig ist. In einem laufenden System kann der Ausfall
bestimmter Komponenten (z. B. eines Prozessors) zum Absturz des gesamten
Systems führen. In diesem Fall wird der Server mithilfe der ASR-Funktion sofort neu
gestartet, wenn er auch ohne die ausgefallene Komponente arbeiten kann. Dadurch
wird verhindert, dass eine defekte Hardwarekomponente das gesamte System außer
Betrieb setzt oder ständig abstürzen lässt.
Hinweis – Die ASR-Funktionen müssen durch den Benutzer aktiviert werden.
Sie werden durch eine Reihe von OpenBoot-PROM-Befehlen und
-Konfigurationsvariablen gesteuert. Weitere Informationen finden Sie unter
„Automatische Systemwiederherstellung (Automatic System Recovery, ASR)" auf
Seite 68.
26
Sun Fire V480 Server Handbuch zur Systemverwaltung • Februar 2002