quelques soucis sur un nas (swap,dev, ..)
Posted: 09 Oct 2014 08:21
Bonjour,
Je viens d'avoir un comportement bizarre sur de mes nas
Nom d'hôte nas7.local
Version 9.2.0.1 - Shigawire (revision 972)
Date de construction Mon Apr 28 02:43:01 CEST 2014
Plateforme OS FreeBSD 9.2-RELEASE-p4 (kern.osreldate: 902001)
Plateforme x64-embedded sur Intel(R) Core(TM)2 CPU 6320 @ 1.86GHz
Système ASUSTeK Computer INC. P5Q SE
Le système BIOS American Megatrends Inc. version: 1002 03/20/2009
J'ai eu une perte d'accès, plus de webgui et plus de ssh, mais réponse au ping !
J'avais des messages d'erreurs comme ceux ci-dessous:
Oct 8 17:26:07 nas7 kernel: GEOM: da2: corrupt or invalid GPT detected.
Oct 8 17:26:07 nas7 kernel: GEOM: da2: GPT rejected -- may not be recoverable.
Oct 8 17:26:08 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:08 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:08 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:08 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da2: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da2: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Il y' avait aussi un message par rapport au swap (que je n'ai pas eu l'idée de recopier), mais en gros, il n'avait pas pû utiliser son swap.
C'est un nas7 qui amasse environ 200 à 250Go par jours (déduplication de MV), sur deux mois de roulement.
J'ai dû arrêter mon PC par le bouton car il était comme planté.
Au démarrage, il est réapparu ce genre de message (par rapport au GEOM de da0, ...)
Puis il a démarré mais au bout d'un moment
Quand j'ai voulu accèder au contenu du pool, je ne retrouvais plus "mes petits", j'avais d'ailleurs un de mes datasets les plus important vide !
Dans ces coups de temps là, j'exporte et je réimporte le pool, ça a été bénéfique car tout est revenu dans l'ordre une fois fait, mon dataset contenait bien les répertoires et données.
Mais il y a des choses que je ne comprends pas:
- dans disques/gestion, j'ai da0, da1 ,da2 et da3 de dispo (da1 etant la clef embedded)
- dans disques outils/formater, je n'ai que da0 et da3 de dispo ... pas da2 ?!?
- dans ZFS/outils, je ne peux pas faire un cache add (aucun périphérique utilisable)
et, si je tape:
- zpool add n7d2000 cache /dev/da0 ... da0 devient bien un Zcache
- zpool add n7d2000 cache /dev/da2 ... da2 devient bien un Zcache
- zpool add n7d2000 cache /dev/da3 ... da3 devient bien un Zcache
J'ai démonté et enlevé les Zcaches, puis tout redémarré en ayant un pool simple (sans cache), le problème subsiste.
Je ne sais pas trop quoi en penser.
Après avoir remis mes caches à la main, j'ai:
nas7: ~ # zpool status
pool: n7d2000
state: ONLINE
scan: none requested
config:
NAME STATE READ WRITE CKSUM
n7d2000 ONLINE 0 0 0
ada0.nop ONLINE 0 0 0
cache
da0 ONLINE 0 0 0
da2 ONLINE 0 0 0
da3 ONLINE 0 0 0
errors: No known data errors
Et depuis tout marche bien:
Donc pour résumer:
1) problème de swap
2) problèmes sur tous les dev en DaX
3) pas de possibilité d'y gérer en webgui
4) Finalement tout marche, c'est bien ! ... mais que c'est t-il passé !
Je viens d'avoir un comportement bizarre sur de mes nas
Nom d'hôte nas7.local
Version 9.2.0.1 - Shigawire (revision 972)
Date de construction Mon Apr 28 02:43:01 CEST 2014
Plateforme OS FreeBSD 9.2-RELEASE-p4 (kern.osreldate: 902001)
Plateforme x64-embedded sur Intel(R) Core(TM)2 CPU 6320 @ 1.86GHz
Système ASUSTeK Computer INC. P5Q SE
Le système BIOS American Megatrends Inc. version: 1002 03/20/2009
J'ai eu une perte d'accès, plus de webgui et plus de ssh, mais réponse au ping !
J'avais des messages d'erreurs comme ceux ci-dessous:
Oct 8 17:26:07 nas7 kernel: GEOM: da2: corrupt or invalid GPT detected.
Oct 8 17:26:07 nas7 kernel: GEOM: da2: GPT rejected -- may not be recoverable.
Oct 8 17:26:08 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:08 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:08 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:08 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da2: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da2: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da3: GPT rejected -- may not be recoverable.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: corrupt or invalid GPT detected.
Oct 8 17:26:37 nas7 kernel: GEOM: da0: GPT rejected -- may not be recoverable.
Il y' avait aussi un message par rapport au swap (que je n'ai pas eu l'idée de recopier), mais en gros, il n'avait pas pû utiliser son swap.
C'est un nas7 qui amasse environ 200 à 250Go par jours (déduplication de MV), sur deux mois de roulement.
J'ai dû arrêter mon PC par le bouton car il était comme planté.
Au démarrage, il est réapparu ce genre de message (par rapport au GEOM de da0, ...)
Puis il a démarré mais au bout d'un moment
Quand j'ai voulu accèder au contenu du pool, je ne retrouvais plus "mes petits", j'avais d'ailleurs un de mes datasets les plus important vide !
Dans ces coups de temps là, j'exporte et je réimporte le pool, ça a été bénéfique car tout est revenu dans l'ordre une fois fait, mon dataset contenait bien les répertoires et données.
Mais il y a des choses que je ne comprends pas:
- dans disques/gestion, j'ai da0, da1 ,da2 et da3 de dispo (da1 etant la clef embedded)
- dans disques outils/formater, je n'ai que da0 et da3 de dispo ... pas da2 ?!?
- dans ZFS/outils, je ne peux pas faire un cache add (aucun périphérique utilisable)
et, si je tape:
- zpool add n7d2000 cache /dev/da0 ... da0 devient bien un Zcache
- zpool add n7d2000 cache /dev/da2 ... da2 devient bien un Zcache
- zpool add n7d2000 cache /dev/da3 ... da3 devient bien un Zcache
J'ai démonté et enlevé les Zcaches, puis tout redémarré en ayant un pool simple (sans cache), le problème subsiste.
Je ne sais pas trop quoi en penser.
Après avoir remis mes caches à la main, j'ai:
nas7: ~ # zpool status
pool: n7d2000
state: ONLINE
scan: none requested
config:
NAME STATE READ WRITE CKSUM
n7d2000 ONLINE 0 0 0
ada0.nop ONLINE 0 0 0
cache
da0 ONLINE 0 0 0
da2 ONLINE 0 0 0
da3 ONLINE 0 0 0
errors: No known data errors
Et depuis tout marche bien:
Donc pour résumer:
1) problème de swap
2) problèmes sur tous les dev en DaX
3) pas de possibilité d'y gérer en webgui
4) Finalement tout marche, c'est bien ! ... mais que c'est t-il passé !