This is the old XigmaNAS forum in read only mode,
it will taken offline by the end of march 2021!
I like to aks Users and Admins to rewrite/take over important post from here into the new fresh main forum!
Its not possible for us to export from here and import it to the main forum!
it will taken offline by the end of march 2021!
I like to aks Users and Admins to rewrite/take over important post from here into the new fresh main forum!
Its not possible for us to export from here and import it to the main forum!
Kernel Panic
Moderators: b0ssman, apollo567, Princo, crowi
-
Digi-Quick
- Advanced User

- Posts: 198
- Joined: 19 Jul 2013 04:21
- Status: Offline
Kernel Panic
Moin,
wo kann man die Ursache einer Kernelpanic nachlesen?
Im Syslog ist nichts eingetragen!
Auf dem Bildschirm (iKVM/IPMI) geht's zu schnell, da das System sofort rebootet. (Bei Windows kann man das Verhalten ja generell abschalten und man kann sich den BSOD in Ruhe anschauen)
ciao
Lothar
wo kann man die Ursache einer Kernelpanic nachlesen?
Im Syslog ist nichts eingetragen!
Auf dem Bildschirm (iKVM/IPMI) geht's zu schnell, da das System sofort rebootet. (Bei Windows kann man das Verhalten ja generell abschalten und man kann sich den BSOD in Ruhe anschauen)
ciao
Lothar
- Princo
- Forum Moderator

- Posts: 1080
- Joined: 15 Jul 2012 01:21
- Location: Berlin, Germany
- Status: Offline
Re: Kernel Panic
Hi Digi-Quick,
Nimm einfach eine Kamera, ein Stativ und filme die Situation. Dann kannst du die Meldungen evtl. hinterher auf dem dann langsam abgespielten Video erkennen.
Grüße
Princo
Nimm einfach eine Kamera, ein Stativ und filme die Situation. Dann kannst du die Meldungen evtl. hinterher auf dem dann langsam abgespielten Video erkennen.
Grüße
Princo
Meine Antworten beziehen sich immer auf die englischsprachige GUI. ECC-RAM ist Pflicht beim Einsatz von ZFS.
- b0ssman
- Forum Moderator

- Posts: 2438
- Joined: 14 Feb 2013 08:34
- Location: Munich, Germany
- Status: Offline
Re: Kernel Panic
Nas4Free 11.1.0.4.4517. Supermicro X10SLL-F, 16gb ECC, i3 4130, IBM M1015 with IT firmware. 4x 3tb WD Red, 4x 2TB Samsung F4, both GEOM AES 256 encrypted.
-
Digi-Quick
- Advanced User

- Posts: 198
- Joined: 19 Jul 2013 04:21
- Status: Offline
Re: Kernel Panic
muss ich dafür 'nen Debug Kernel bauen?
- Wie mache ich das für Nas4Free?
oder reicht der Befehl "sysctl debug.debugger_on_panic=1"?
oder.....????
Das mit abfilmen ist natürlich 'ne grandiose Idee, wie gross soll ich denn den Speicherchip wählen, damit ich das Ereignis auch wirklich zu sehen bekomme? (Nach Murphy erscheint das Ereignis dann, wenn der Speicherchip längst voll ist).
Achja, der Monitor darf dann ja auch nicht abschalten bei Nichtbenutzung des PCs - überhaupt der ganze PC muss durchgehend laufen. Die betreffende Maschine ist ja headless und nur per iKVM (IPMI) administriert (bzw. Webinterface oder SSH).
- Wie mache ich das für Nas4Free?
oder reicht der Befehl "sysctl debug.debugger_on_panic=1"?
oder.....????
Das mit abfilmen ist natürlich 'ne grandiose Idee, wie gross soll ich denn den Speicherchip wählen, damit ich das Ereignis auch wirklich zu sehen bekomme? (Nach Murphy erscheint das Ereignis dann, wenn der Speicherchip längst voll ist).
Achja, der Monitor darf dann ja auch nicht abschalten bei Nichtbenutzung des PCs - überhaupt der ganze PC muss durchgehend laufen. Die betreffende Maschine ist ja headless und nur per iKVM (IPMI) administriert (bzw. Webinterface oder SSH).
- Princo
- Forum Moderator

- Posts: 1080
- Joined: 15 Jul 2012 01:21
- Location: Berlin, Germany
- Status: Offline
Re: Kernel Panic
Uups, ich bin davon ausgegangen, daß der Fehler recht bald nach dem Einschalten auftritt.
Aber auch dafür gibt es eine Lösung. Ich tippe darauf, daß der Fehler bei Belastung schneller auftritt.
Und Belastung kann man selber herstellen: viewtopic.php?f=93&t=7085
Dort ist beschrieben, wie man einen Streßtest direkt auf dem NAS durchführt.
Mit diesem Tool sollte man den betreffenden Fehler eigentlich reproduzieren können.
Grüße
Princo
Aber auch dafür gibt es eine Lösung. Ich tippe darauf, daß der Fehler bei Belastung schneller auftritt.
Und Belastung kann man selber herstellen: viewtopic.php?f=93&t=7085
Dort ist beschrieben, wie man einen Streßtest direkt auf dem NAS durchführt.
Mit diesem Tool sollte man den betreffenden Fehler eigentlich reproduzieren können.
Grüße
Princo
Meine Antworten beziehen sich immer auf die englischsprachige GUI. ECC-RAM ist Pflicht beim Einsatz von ZFS.
-
Digi-Quick
- Advanced User

- Posts: 198
- Joined: 19 Jul 2013 04:21
- Status: Offline
Re: Kernel Panic
Ich habe einfach nur Daten via GBit LAN auf das ZFS Volume geschoben (per FTP).
Problem trat nicht reproduzierbar nach 3-30h auf.
Seitdem ich das neueste BIOS (3Wochen Alt) auf das SM x10sl7-f aufgespielt habe, ist nix mehr passiert.
Ich vermute mal, daß SM möglicherweise (es gibt ja bei SM kein Changelog) Probleme bei Verwendung von weiteren SAS Controllern behoben hat.
Ich habe zusätzlich 2 LSI 9211 Controller drauf. Ab und zu gab es da beim Booten 'nen "mpt bios fault 01h" (als Folge fehlte dann einer von 3 Controllern).
Als Workaround wurde in einem Forum empfohlen die automatische Erkennung der PCI-E Generationserkennung abzuschalten und auf GEN2 festzusetzen. seitdem hatte ich diesen Fehler nicht mehr.
Problem trat nicht reproduzierbar nach 3-30h auf.
Seitdem ich das neueste BIOS (3Wochen Alt) auf das SM x10sl7-f aufgespielt habe, ist nix mehr passiert.
Ich vermute mal, daß SM möglicherweise (es gibt ja bei SM kein Changelog) Probleme bei Verwendung von weiteren SAS Controllern behoben hat.
Ich habe zusätzlich 2 LSI 9211 Controller drauf. Ab und zu gab es da beim Booten 'nen "mpt bios fault 01h" (als Folge fehlte dann einer von 3 Controllern).
Als Workaround wurde in einem Forum empfohlen die automatische Erkennung der PCI-E Generationserkennung abzuschalten und auf GEN2 festzusetzen. seitdem hatte ich diesen Fehler nicht mehr.
- b0ssman
- Forum Moderator

- Posts: 2438
- Joined: 14 Feb 2013 08:34
- Location: Munich, Germany
- Status: Offline
Re: Kernel Panic
ich wuerde bei den lsi controllern sowieso nicht das bios flashen- sondern nur die firmware.
booten muss man nicht von den karten und es macht den bootvorgang nur langsamer.
booten muss man nicht von den karten und es macht den bootvorgang nur langsamer.
Nas4Free 11.1.0.4.4517. Supermicro X10SLL-F, 16gb ECC, i3 4130, IBM M1015 with IT firmware. 4x 3tb WD Red, 4x 2TB Samsung F4, both GEOM AES 256 encrypted.
-
Digi-Quick
- Advanced User

- Posts: 198
- Joined: 19 Jul 2013 04:21
- Status: Offline
Re: Kernel Panic
Ohne das Bios verlagerte sich das Problem dann aber auf die Betriebssystem-/Treiberebene.
es fehlte dann im OS ein Controller komplett, und das war mir zu heikel bei 19 Platten an 3 Controllern als ZFS Raidz3, deswegen habe ich die Controller zur Zeit noch mit BIOS geflashed, dann stoppt der Bootprozess wenigstens bei dem MPT Fehler.
Zwischenzeitlich habe ich festgestellt, daß ZFS da scheinbar ziemlich robust ist, wenn zuviele Platten fehlen und das RaidzX dann Offline ist. Die werden einfach wieder eingebunden, wenn Sie beim nächsten Reboot wieder da sind, das RaidzX ist dann auch wieder Online.
Wie schon gesagt, hatte ich den Fehler nicht mehr seit ich die PCI-E Slots auf Gen2 statt Auto eingestellt hatte. Trotzdem hatte ich einige Kernel Panics bevor ich die neue BIOS Version von Supermicro geflashed habe. Seitdem noch keine!
Ich habe daher schlichtweg den Verdacht, daß es hier eine merkwürdige Inkompatibilität zwischen Mainboard und den zusätzlichen Controllern gab, die mit dem BIOS-Update behoben wurde. Muss da morgen mal bei meinem SM-Händler anrufen, ob die was dazu sagen können.
Das komische daran ist, daß alle Contoller, On-Board und Steckkarten auf dem gleichen Controllerchip basieren (LSI-2008) und man daher eigentlich keine Probleme erwarten würde.
Sollte es das System jetzt tatsächlich über einen längeren Zeitraum Stabil laufen, werde ich mir sicherlich überlegen die Controller nochmal ohne BIOS zu flashen.
es fehlte dann im OS ein Controller komplett, und das war mir zu heikel bei 19 Platten an 3 Controllern als ZFS Raidz3, deswegen habe ich die Controller zur Zeit noch mit BIOS geflashed, dann stoppt der Bootprozess wenigstens bei dem MPT Fehler.
Zwischenzeitlich habe ich festgestellt, daß ZFS da scheinbar ziemlich robust ist, wenn zuviele Platten fehlen und das RaidzX dann Offline ist. Die werden einfach wieder eingebunden, wenn Sie beim nächsten Reboot wieder da sind, das RaidzX ist dann auch wieder Online.
Wie schon gesagt, hatte ich den Fehler nicht mehr seit ich die PCI-E Slots auf Gen2 statt Auto eingestellt hatte. Trotzdem hatte ich einige Kernel Panics bevor ich die neue BIOS Version von Supermicro geflashed habe. Seitdem noch keine!
Ich habe daher schlichtweg den Verdacht, daß es hier eine merkwürdige Inkompatibilität zwischen Mainboard und den zusätzlichen Controllern gab, die mit dem BIOS-Update behoben wurde. Muss da morgen mal bei meinem SM-Händler anrufen, ob die was dazu sagen können.
Das komische daran ist, daß alle Contoller, On-Board und Steckkarten auf dem gleichen Controllerchip basieren (LSI-2008) und man daher eigentlich keine Probleme erwarten würde.
Sollte es das System jetzt tatsächlich über einen längeren Zeitraum Stabil laufen, werde ich mir sicherlich überlegen die Controller nochmal ohne BIOS zu flashen.
- Princo
- Forum Moderator

- Posts: 1080
- Joined: 15 Jul 2012 01:21
- Location: Berlin, Germany
- Status: Offline
Re: Kernel Panic
Ich weiß ja nicht, was du mit deinen Platten so treibst, aber normalerweise sollte man auch mit ZFS nicht so viele Platten in einen Pool packen, wenn es dafür keine zwingende Notwendigkeit gibt.Digi-Quick wrote:und das war mir zu heikel bei 19 Platten an 3 Controllern als ZFS Raidz3
Diese Plattenanzahl (19) würde ich normalerweise in zwei oder drei Pools mit entsprechender Redundanz aufteilen, aber das hängt natürlich ganz stark vom Einsatzzweck ab.
Nach Backup frage ich hier lieber mal nicht
Meine Antworten beziehen sich immer auf die englischsprachige GUI. ECC-RAM ist Pflicht beim Einsatz von ZFS.
-
Digi-Quick
- Advanced User

- Posts: 198
- Joined: 19 Jul 2013 04:21
- Status: Offline
Re: Kernel Panic
Es geht um ein Datenarchiv mit ausreichend Platzreserve.
Ursprünlich hatte ich 24x5TB geplant >> 21x5 = 105 TB
Jetzt bekomme ich für geringfügig mehr Kosten 16x8 = 128 TB und habe noch 5 HDD Slots frei.
Der aktuelle Datenbestand der da rauf soll ist etwa 60 TB (inkl. des Backups vom 2. NAS
weitere 10-15 TB sind eingeplant für die nächsten 2-3 Jahre, da hier noch einige Video8/Hi8 Bänder Digitalisiert werden müssen und einige 1000 Dias eingescannt werden sollen. Die Dias werden vermutlich im TIFF Format gespeichert - ca. 100MB/Dia
Archiv = Aufbewahrungswürdige Daten
Die wichtigen persönlichen Daten werden selbtsverständlich von einem 2. kleinerem NAS gesichert.
Die Frage wie ich den Reboot bei kernel Panic abschalte ist immer noch nicht beantwortet, der Link beantwortet das nicht!
Ich habe jetzt unter system/advanced/sysctl.conf einen neuen MIB "debug.debugger_on_panic" mit dem Wert 1 angelegt.
Ursprünlich hatte ich 24x5TB geplant >> 21x5 = 105 TB
Jetzt bekomme ich für geringfügig mehr Kosten 16x8 = 128 TB und habe noch 5 HDD Slots frei.
Der aktuelle Datenbestand der da rauf soll ist etwa 60 TB (inkl. des Backups vom 2. NAS
weitere 10-15 TB sind eingeplant für die nächsten 2-3 Jahre, da hier noch einige Video8/Hi8 Bänder Digitalisiert werden müssen und einige 1000 Dias eingescannt werden sollen. Die Dias werden vermutlich im TIFF Format gespeichert - ca. 100MB/Dia
Archiv = Aufbewahrungswürdige Daten
Die wichtigen persönlichen Daten werden selbtsverständlich von einem 2. kleinerem NAS gesichert.
Die Frage wie ich den Reboot bei kernel Panic abschalte ist immer noch nicht beantwortet, der Link beantwortet das nicht!
Ich habe jetzt unter system/advanced/sysctl.conf einen neuen MIB "debug.debugger_on_panic" mit dem Wert 1 angelegt.