ein Systemausfall der unüblichen Art
von JasonWas immer da passiert ist, es ist sehr gründlich passiert. Aber erstmal von vorne: Gestern am frühen Abend ist der Webserver von StugA ausgefallen. Sowas kommt ja durchaus mal vor, also habe ich ohne besondere Eile im StugA-Raum angerufen und den anwesenden Henker darum gebeten sich das mal kurz anzugucken. Da StugA4 (der Server) komplett abgeschaltet war, habe ich um Neustart gebeten und innerlich schon alles als erledigt abgehakt.
Doch auch nach einer angemessenen Weile war der Rechner noch nicht zu erreichen, weshalb ich erneut anrief. Der Rechner habe gestartet, den Kernel geladen und kommentarlos neugestartet. Es folgte großes Rätselraten und die Erkenntnis, dass ein Admin ran muss. Da aber weder ich noch ein anderer der frisch Informierten besonderen Motivationsüberschuß hatten, wurde es auf heute morgen vertagt.
Am Morgen dann die Überraschung: Der Kernel stirbt direkt nach dem Laden, jedoch gänzlich ohne Fehlermeldung und Panic (Ein Linux-Kernel stürzt normalerweise nicht einfach ab, sondern registriert eine Situation mit der er nicht umgehen kann und stellt den Betrieb von sich aus mit dem Fehlercode "kernel panic" ein). Ohne also überhaupt gestartet zu sein, ist er schneller ausgefallen als er etwas bemerken oder gar um Hilfe rufen kann. Das nebenstehende Foto entstand übrigens aus der Not heraus, da ich den Bildschirminhalt nicht vollständig lesen konnte, bevor der Rechner abgeschaltet hat.
Mehrere Stunden später hatte sich dieses Bild im wesentlichen noch nicht verändert. Mit Live-CD wurde das System untersucht, die Hardware zeigte sich voll funktionsfähig, das System auch. Nur dem Kernel waren keine Lebenszeichen abzugewinnen. Zur allgemeinen Verwunderung war er nicht einmal mehr aus seinem Quellcode übersetzbar. Und so endeten die Rettungsversuche am frühen Nachmittag indem das Tochtersystem (StugA4 ist ein XEN-System mit einer virtuellen Umgebung, die für den eigentlichen Webserver (StugA-S) vorgesehen ist) einen eigenständig lauffähigen Kernel bekommen hat und alleine unterwegs ist. Da Morgen wegen eines FI-Schaltertests ohnehin nochmal abgeschaltet werden muss, wird anschliessend das XEN-System komplett neu aufgesetzt.