Page 1 of 1

Serveur freenas 0.7.2 en panne...

Posted: 13 Jul 2013 14:23
by axigeo
Bonjour,

Les années passent, les problèmes reviennent… Il ya quelques années la carte mère de récupération de mon serveur freenas avait grillé ; je n’avais pas pu récupérer les données des HDD qui étaient montés en raid matériel sur la carte mère. J’avais heureusement des sauvegardes. Depuis j’avais remonté une nouvelle configuration pour mon serveur (2011 ?):
CM: Asus M4A 78LT M-LE
CPU : AMD Sempron 140 (2700 mhz)
RAM : 2048 MB (2015)

HDD : Samsung HD103SI (sata1)
Hitachi HDT721016S (sata2)
Samsung HD153WI (sata3)
Hitachi HDP725050G (sata4)
WDC WD800BB-00CAA1 (pata2)

USB : A-DATA USB Flash Drive (Boot)

Le tout sous freenas 0.7.2.5543 (peut-être) ou 0.7.2.8191 (pas sûr…) (aïe je ne retrouve pas la config du montage...)
Pas de raid ni matériel ni logiciel, donc 5 points de montage, un par HDD physique.
Formatage GPT / UFS.

Et puis il y a quelques jours, la connexion au freenas disparait, se reconnecte puis se deconnecte (depuis les postes sous win 7). Enfin impossible de se connecter malgré plusieurs redemarrages.

Le serveur tourne, je l’ouvre, l’alim est ultra bouillante, intouchable, j’éteins tout.
Je rallume qques heures plus tard, toujours pas de freenas apparaissant sur mon réseau, l’alim semble chauffer un peu vite, j’éteins tout et n’ayant pas d’autre alim libre j’en commande une autre. Une fois reçue je l’installe et redémarre tout. Pas de freenas sur le réseau et le matos ronronne tranquille. Je branche un écran et un clavier pour voir la console démarrer.
Tout se passe normalement jusqu’à la fin où le boot n’abouti pas et s’affiche la prose suivante :

…..
/dev/ad1p1: defer for background checking
/dev/ad4p1: defer for background checking
/dev/ad6p1: 1bad I=9
/dev/ad6p1: unexpected soft update inconsistency; run fsck manually
ERROR ABORTING BOOT (sending sigterm to parently
(date) init: /bin/sh on/etc/rc terminated abnormally, going to single user mode
Enter full pathname of shell or RETURN for /bin/sh : ums0: at uhub0 port2(addr2) disconnected
Ums0: detached
……….

Quelqu’un aurait-il une idée sur l’origine de la panne avant que je ne touche à quoique ce soit d’autre ?
Et surtout une solution pour que je retrouve la config comme avant et surtout que je puisse récupérer mes données (dont les dernières sauvegardes sont un peu trop anciennes….) ?

Merci d’avance .
Axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 14 Jul 2013 07:06
by loulnux
Ton problème à l'origine est hardware soit mais il n'a pas dû être anodin.
Je suppose que tu n'as pas fait de sauvegarde de ta configuration ?
La première chose à faire serait de tester la totalité de ton hardware.
CM/Mémoire/UC et disques indépendamment les uns des autres pour diagnostiquer la panne réelle et déterminer ceux qui ont souffert.
Pour çà il n'y a pas de secret, il faut disposer de matériel de test au moins une carte mère fiable ne serait-ce pour tester les disques et si par chance elle supporte ta RAM pour la tester et si elle supporte aussi le proc ce serait le bonheur.
Mais passons.
Si tu disposes d'une config capable d'autobooter ta clef vérifie dans un premier temps si celle-ci accepte de nouveau à faire son cycle de démarrage sans dommage si oui vérifie de suite si elle est capable de monter les disques.
Sinon et si tu n'as pas fait de sauvegarde de ta configuration, on est mal.

Re: Serveur freenas 0.7.2 en panne...

Posted: 14 Jul 2013 10:28
by axigeo
Bonjour Loulnux,

Et merci pour cette réponse rapide un jour de défilé... si j'ai enfin retrouvé les sauvegardes de configuration - qu'après maints déplacement je n'arrivais pas à dénicher. La dernière date de juin 2011 et doit être la bonne (config-freenas.local-20110621143128.xml). En revanche je ne sais plus comment l'utiliser et à quel stade...

Est-il possible dans un premier temps de faire une copie exacte de la clé usb de boot (inutile si elle est corrompue - est-ce possible? - ou si la sauvegarde de config. suffit)?
Je n'ai pas tout bilanté mais je pense pouvoir monter une config de test mais limitée (CM micro-ITX B75 avec il me semble seulement 2 sata..., celeron G1610, 4GO et la nouvelle alim) je ne pourrais sans doute pas monter les 5 HDD ensemble. Peut-être pourrais-je les importer un par un sur une config. saine en 0.7.2.5543 afin de récupérer les données? ou ne peut-on importer (donc sans reformatage..) que l'ensembles des hdd pour être fonctionnel?

Pour tester la configuration en panne, que me conseillerais-tu? Un live CD (quoi?) une install temporaire sur un 6e HDD de windows 7 pour lancer des test materiels (ça m'éviterais de tout démonter...) (je n'ai aucune expérience sous Linux...). A ce propos, je dispose de 2 tours où je peux aussi tester les HDD, mais sous W7; je ne veux pas perdre les données bien sûr; quels tests puis-je faire sous W7 avec ces disques sous gpt/ufs (ou liveCD utilitaires sous Linux? sous FreeBSD?

Bref je pense que j'ai des possibilités de récupérer au moins une partie des données mais des conseils sur la procédure me feraient gagner un temps précieux... merci d'avance
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 14 Jul 2013 10:37
by axigeo
Re-bonjour,

Une petite précision supplémentaire quant à ta suggestion:
"Si tu disposes d'une config capable d'autobooter ta clef vérifie dans un premier temps si celle-ci accepte de nouveau à faire son cycle de démarrage sans dommage si oui vérifie de suite si elle est capable de monter les disques."

Je ne suis pas sûr de bien comprendre; autobooter ma clé? (en fait c'est sans doute que je ne connais pas la procédure pour se servir de la sauvegarde...) merci pour des explications à la hauteur de mes ignorances....
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 15 Jul 2013 02:35
by loulnux
En fait le gros avantage de FreeNas et Nas4free si tu as fait une sauvegarde de ta configuration, tu peux repartir avec une clé fraîchement réinstallée toute propre, branchée sur une nouvelle base hardware saine (même si elle n'a rien à voir avec la précédente) avec tes anciens disques et retrouver tes petits tout comme avant. Il suffit de relancer le nouveau nas, aller dans sauvegarde/restauration, sélectionner ton fichier .xml et tu retrouves ta config, tes disques et tes partages tout comme avant. Donc ça c'est le point le plus positif qui t'arrive.
Effectivement avec le matos dont tu disposes çà fonctionnerait sauf pour les Sata trop peu nombreux à moins que tu disposes d'un contrôleur additionnel.
"Autobooter" veut simplement dire démarrer automatiquement à partir de la clé (ce qui n'a pas toujours été possible).

Re: Serveur freenas 0.7.2 en panne...

Posted: 15 Jul 2013 03:05
by loulnux
En ce qui concerne les tests, ne vas pas t'emmerder avec une install win c'est long et contraignant.
Sois tu utilises UBCD un classique DOS/win
Sois tu utilises une distribution linux dédiée aux testes ou ce que je fais à l'heure actuelle j'utilise http://pinguyos.com/download/
Que j'installe sur une clé usb sous win avec çà : http://www.linuxliveusb.com/fr
Pourquoi? Parce qu'il y a déjà la possibilité dès le premier écran (grub) de lancer memtest pour la mémoire et ensuite en démarrant le système, hormis les tableaux qui s'affichent pour te renseigner il y a un outil de benchmark qui va te donner un résumé de tout tes composants et de leur état (un peu genre Sandra Sisoft pour win) et in y a aussi un utilitaire graphique "disks" qui t'offre toute une batterie de renseignements et de tests et aussi le fameux gparted. Attention tu ne pourras pas monter les partitions UFS mais tu auras au moins en clair les données SMART.
Je te conseille cette dernière solution si tu ne connais pas encore linux çà t'en fera découvrir la magie, si tu n'as pas plus de 4Go de ram prends la version 32bits elle est passe partout.

Re: Serveur freenas 0.7.2 en panne...

Posted: 15 Jul 2013 14:50
by axigeo
Bonjour,
Merci Loulnux pour ces conseils que je vais tacher de suivre. Hier je n'était pas trop dispo et aujourd'hui je bosse mais la clé est dans la bécane et j'ai lancé la décompression de l'iso de pinguy OS 12.04... bon je ne sais pas si c'est normal mais il semble que ça ne décolle pas de 1%... patience.
Quoiqu'il soit arrivé au matériel, ce que j'espère découvrir, si j'ai bien compris, grâce à la sauvegarde de configuration je dois pouvoir redémarrer sur n'importe quelle autre machine acceptant mes hdd.
A condition que ma clé de boot freenas actuelle ne soit pas corrompue je devrais pouvoir l'utiliser pour demarrer sur une autre machine où j'aurais installé mes hdd. Oui?
Dans ce cas, il faut probablement tacher de les installer dans le même ordre (physique: sata1,s2,s3,s4 et pata2 haque hdd à la place où il était) et booter avec la clé usb d'origine (ou une nouvelle avec la récup de configuration).
Si la panne a touché un hdd qui ne tournerait plus, cela suffit-il à provoquer ma panne, cela compromet-il le redémarrage de la configuration?
(ouf la clé linux est prête! je commence ce soir....)
En bref j'ai encore besoins d'éclaircissements.
Ce soir je vais booter avec le linux live usb et tenter de détecter une panne de hard. Si je trouve, je répare sinon je désosse une de mes tours pour faire un essais de récup:
J'y monte mes 5 disques (que faire si un ou + est HS?) dans le même ordre qu'avant et je boote sur ma vieille clé à laquelle je n'ai rien touché (...)
En cas de besoin quelle est la procédure pour recréer une clé usb avec le fichier de sauvegarde ? (config-freenas.local-20110621143128.xml)
Sur une machine réparée ou nouvelle, peut-être vaut-il mieux réinstaller la même version de freenas (0.7.2.5543 je crois, y-a-t-il moyen de vérifier la version sur la clé?) à partir du cd, copie sur la clé; si je comprends bien ce que tu as dis, à ce stade je n'ai pas besoin de paramétrer, je vais dans sauvegarde/restauration et je pointe sur mon fichier .xml (oui mais où le mets-je? il faut bien avant que j'ai paramétré l'accès ethernet, comment et où récupérer le fichier depuis la console? depuis le web gui?)
Bon je me perds un peu. J'y verrai plus clair ce soir ou demain.
Merci pour les conseils venus et à venir,
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 16 Jul 2013 00:17
by loulnux
Ne t'inquiète pas pour l'ordre des disques, ils sont "tatoués" par le système avec ce qu'on appelle l'UUID et il se réfère à ce numéro et pas à leur emplacement physique.
Normalement une décompression avec LiliUSB se fait max en 10 minutes à moins que tu sois sur un vieil USB1
On ne peut rien prédire vu le type de symptôme décrit on ne peut pas dire comme çà qui de la poule ou l'oeuf a commencé; si c'est l'alim on peut craindre un fonctionnement erratique de celle ci qui aura pu toucher un peu n'importe quel composant.
Si au contraire c'est un composant de la carte mère ça peut être moins grave car il aurait pu agire en coupe circuit et de fait protéger le reste des composants et périphériques.
De toute évidence il faut séparer le bon du mauvais.
Ton fichier .XML tu le mets sur le bureau de la bécane avec laquelle tu contrôles ton nas quand tu vas demander la restauration le petit navigateur va directement pointer sur le bureau.
A contrario quand tu fais une sauvegarde tu ne t'en souviens pas mais il met directement le fichier sur le bureau de ta bécane de contrôle.
Le seul problème que tu risques de rencontrer avec cette version c'est qu'une nouvelle installation se fait de mémoire par défaut en 192.168.1.250 et que souvent les gens sont souvent en 192.168.0.XXX si c'est le cas tu peux très bien reconfigurer momentanément l'IP de ta bécane de contrôle en 192.168.1.XXX le temps de la manip et la remettre aussitôt dans son état précédent pour reprendre la main.

Re: Serveur freenas 0.7.2 en panne...

Posted: 16 Jul 2013 16:15
by axigeo
Bonjour à tous

Je ne m'en sors pas trop bien; question boot avec linux (live usb) l'arrivée d'un "Grub" à l'invite m'a fait abandonner cette solution faute d'explications complémentaires. Ce sera pour plus tard.

J'ai monté UBCD sur une clé bootable et depuis ce matin je fais des tests un peu au pif sans rien trouver qui semble ne pas marcher. Quelqu'un aurait-il une idée de test "infaillible" pour détecter une défaillance de hard? j'ai pu tester CPU et RAM , les hdd Samsung et le WDC= RAS.je teste en ce moment les Hitachi. Tout cela est très long ... et la machine semble tourner normalement ??
Si les tests ne donnent rien je vais tenter de monter mes hdd sur une de mes tours et de booter avec l'ancienne clé. Après??
A bientôt
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 16 Jul 2013 19:15
by axigeo
Bonsoir,

Après vérifications hasardeuses du matériel rien ne semble poser de problème.
j'ai donc branché mes 6 hdd sur une de mes tours (i5/12go ram) et envoyé le boot avec ma clé (freenas 0.7.2.8191 là c'est sûr). les messages semblent faire allusion à une table GPT corrompue...
Je vérifie les paramètres (lan surtout) et accès au web GUI: les 5 hdd apparaissent mais statut manquant.je fais une restauration avec mon fichier .xml, il reboote puis je n'ai plus que 2 hdd (ad4 &ad10 ?) toujours statut manquant. Je suis perplexe !
Une idée ? je laisse branché.
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 16 Jul 2013 23:20
by loulnux
La perte d'une table GPT indique au moins la défaillance d'un disque.
A partir de maintenant comme tu n'as pris aucune option sécuritaire genre RAID il faut te mettre en situation de sauvetage à savoir te préparer à transvaser le contenu d'un ou plusieurs disques sur un support sain.
Pour çà il va falloir être patient et surtout disposer d'un espace pour procéder aux "transvasements".
Si tu as accès à l'interface d'administration tu vas te contenter de travailler disque par disque dans un premier temps.
Brancher un disque, voir dans "Disque" > "Gestion" si il est reconnu.
Si non le mettre de côté
Si oui aller dans "Disque" > "Point de montage"> onglet "FSCK" choisir le disque, "démonter" , exécuter.
Cette commande est comparable au CHKDSK dos/windows et répare si nécessaire les secteurs logiques défectueux.
Ensuite passe dans "Diagnostique" > "Information" onglet SMART
Ça va te donner les renseignements hard sur le disque au milieux de la page il va y avoir un tableau les 5 premières lignes sont les + importantes notamment si la colonne "When failed" contient autre chose que le signe "_", notamment ligne 5 "realocated sectors" si "Raw Value" est différent de 0.
Si c'est le cas prends juste le temps de vérifier si tu accèdes encore au partage réseau histoire de t'assurer de pouvoir sauver ultérieurement son contenu.
Fais une note détaillée de tout ce que tu as constaté puis passe au disque suivant.
C'est long mais indispensable pour récupérer ce qui est récupérable.
Pour le ou les disques qui ne sont absolument pas identifiés par le système à aucun des niveaux il faudra passer à un autre type de test sans trop d'espoir de récupérer le contenu.
Pour les disques qui n'affichent aucune erreur SMART et qui sont à nouveau dispo sur le réseau on peut dire qu'ils n'ont subi aucun dommage.
Pour ceux à nouveau partagés mais qui affichent des erreurs SMART il faut récupérer les données en priorité.

Re: Serveur freenas 0.7.2 en panne...

Posted: 17 Jul 2013 07:59
by axigeo
Bonjour,
Comme dit précédemment pour l'instant dans l'interface "disques"> "gestion" je ne vois apparaitre que ad4 et ad10;
J'ai donc fait successivement le démontage de ad4 puis de ad10 et fais une copie de la page diagnostique>info>smart. Là les 5 hdd - et la clé usb - sont bien visibles...
En revanche, dans Windows (7) freenas est bien visible sur le réseau, avec 2 dossiers de partage (data1 & data4) qui ne sont pas accessibles (Windows ne peut pas acceder à \\freenas\data1...).
Je mets une copie du rapport smart.

Périphérique /dev/ad13 - WDC WD800BB-00CAA1/17.07W17
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar
Device Model: WDC WD800BB-00CAA1
Serial Number: WD-WCA8E4741585
Firmware Version: 17.07W17
User Capacity: 80,026,361,856 bytes [80.0 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 5
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Wed Jul 17 09:37:49 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 3120) seconds.
Offline data collection
capabilities: (0x3b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 58) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 101 098 021 Pre-fail Always - 4041
4 Start_Stop_Count 0x0032 099 099 040 Old_age Always - 1069
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 073 073 000 Old_age Always - 20216
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 757
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 60
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Conveyance offline Completed without error 00% 538 -

Device does not support Selective Self Tests/Logging

Périphérique /dev/ad14 - SAMSUNG HD103SI/1AG01118
=== START OF INFORMATION SECTION ===
Model Family: SAMSUNG SpinPoint F2 EG
Device Model: SAMSUNG HD103SI
Serial Number: S1Y5J90S727962
LU WWN Device Id: 5 0024e9 200c7a846
Firmware Version: 1AG01118
User Capacity: 1,000,204,886,016 bytes [1.00 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 3b
Local Time is: Wed Jul 17 09:37:49 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (12855) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 215) minutes.
Conveyance self-test routine
recommended polling time: ( 23) minutes.
SCT capabilities: (0x003f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 080 080 011 Pre-fail Always - 6790
4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 909
5 Reallocated_Sector_Ct 0x0033 091 091 010 Pre-fail Always - 255
7 Seek_Error_Rate 0x000f 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0025 100 100 015 Pre-fail Offline - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 2546
10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 315
13 Read_Soft_Error_Rate 0x000e 100 100 000 Old_age Always - 0
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0033 100 100 000 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 073 072 000 Old_age Always - 27 (Min/Max 25/28)
194 Temperature_Celsius 0x0022 073 072 000 Old_age Always - 27 (Min/Max 25/29)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 2203
196 Reallocated_Event_Count 0x0032 094 094 000 Old_age Always - 255
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 253 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Périphérique /dev/ad16 - Hitachi HDT721016SLA380/ST1OA3AA
=== START OF INFORMATION SECTION ===
Model Family: Hitachi Deskstar 7K1000.B
Device Model: Hitachi HDT721016SLA380
Serial Number: STA1D7MA2Z548F
LU WWN Device Id: 5 000cca 345e9e56d
Firmware Version: ST1OA3AA
User Capacity: 160,041,885,696 bytes [160 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Wed Jul 17 09:37:49 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 2371) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 40) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0x0005 132 132 054 Pre-fail Offline - 114
3 Spin_Up_Time 0x0007 111 111 024 Pre-fail Always - 226 (Average 221)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 440
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 125 125 020 Pre-fail Offline - 33
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 4863
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 165
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 514
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 514
194 Temperature_Celsius 0x0002 162 162 000 Old_age Always - 37 (Min/Max 11/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 46

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Périphérique /dev/ad18 - SAMSUNG HD153WI/1AN10003
=== START OF INFORMATION SECTION ===
Model Family: SAMSUNG SpinPoint F3 EG
Device Model: SAMSUNG HD153WI
Serial Number: S1UVJDWZ700425
LU WWN Device Id: 5 0024e9 003b82024
Firmware Version: 1AN10003
User Capacity: 1,500,301,910,016 bytes [1.50 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 6
Local Time is: Wed Jul 17 09:37:51 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (17460) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
SCT capabilities: (0x003f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 14
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 062 060 025 Pre-fail Always - 11760
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 551
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 300
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 220
191 G-Sense_Error_Rate 0x0022 252 252 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 064 000 Old_age Always - 31 (Min/Max 7/33)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 5
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 2
223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0
225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 1750

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


Note: selective self-test log revision number (0) not 1 implies that no selective self-test has ever been run
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Completed [00% left] (0-65535)
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Périphérique /dev/ad20 - Hitachi HDP725050GLA360/GM4OA5CA
=== START OF INFORMATION SECTION ===
Model Family: Hitachi Deskstar P7K500
Device Model: Hitachi HDP725050GLA360
Serial Number: GEA534RF3UM5GA
LU WWN Device Id: 5 000cca 34df5ebc6
Firmware Version: GM4OA5CA
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Wed Jul 17 09:37:52 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 7890) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 131) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0x0005 132 132 054 Pre-fail Offline - 143
3 Spin_Up_Time 0x0007 118 118 024 Pre-fail Always - 325 (Average 325)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 1225
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 131 131 020 Pre-fail Offline - 29
9 Power_On_Hours 0x0012 099 099 000 Old_age Always - 9402
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 204
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age Always - 1517
193 Load_Cycle_Count 0x0012 099 099 000 Old_age Always - 1517
194 Temperature_Celsius 0x0002 176 176 000 Old_age Always - 34 (Min/Max 7/53)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Périphérique /dev/da0 - A-DATA USB Flash Drive 0.00
/dev/da0: Unknown USB bridge [0x125f:0xc81a (0x100)]
Smartctl: please specify device type with the -d option.

Use smartctl -h to get a usage summary

Voilà, merci pour les conseils. Puis-je avoir espoir de récupérer qque chose? et si oui comment...
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 17 Jul 2013 20:16
by loulnux
ad13= OK
ad14= très gros problème
ad16= très gros problème
ad18= OK
ad20= OK

ad14 et 16 ont sans doute ré-alloué leur quota ce qui veut dire
-1 que l'opération ne pourra plus se répéter
-2 qu'il y ait des chances que çà continue (à la manière d'un pull qui se détricote)
Il faut donc éviter de les remettre sous tension sous d'autre prétexte que sauvegarder les données.

Re: Serveur freenas 0.7.2 en panne...

Posted: 17 Jul 2013 21:25
by axigeo
Bonsoir Loulnux,
Donc pas très rassurant tout ça... Cependant quand tu dis "OK" pour 3 hdd est-ce que cela veut dire que je peux en récupérer les données et si oui comment. car pour l'instant sur le web gui de freenas je ne vois dans gestion des disques que (si je me souviens bien)que le ad14 (1To) et le ad20 (500Go) (c'est ce dernier qu'il m'importe le plus de récupérer...) avec statut "manquant". Les 3 autres hdd semblent avoir disparu après la restauration du fichier.xml (était-ce bien le dernier?). Comment les retrouver tous et les faire (si possible...) réapparaitre dans un dossier de partage de mon réseau Windows et récupérer les données sur un autre support?
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 25 Jul 2013 12:09
by didierc29
Bonjour axigeo, moi pour récupérer les fichiers sur les disques durs je le fais sous windows et avec le logiciel UFS Explorer Pro. Voilà si cela peut t'aider.

Re: Serveur freenas 0.7.2 en panne...

Posted: 26 Jul 2013 23:34
by axigeo
Merci Didier29 pour cette réponse; en effet j'ai un moment cherché une possibilité de ce type mais pas encore trouvé - je garde ce soft sous le coude. Les autres possibilités du type Live-cd sous FreeBSD e sont avérées un peu compliquées pour moi qui n'ai pas de notion Linux.
Néanmoins, et grâce aux pistes de Loulnux ainsi que d'autres glanées sur le net et aussi un peu de chance, j'ai pu enfin récupéré mes données, intégralement semble-t-il.
Comme indiqué le montage des 5 hdd à l'identique mais sur une machine saine ne permettait pas de booter Freenas. J'ai donc procédé disque par disque avec le live cd correspondant à l'install d'origine et sans charger la sauvegarde de conf. A part quelques loupés pour un disque, j'ai pu "voir" chaque hdd dans l'interface web, les ajouter et les monter puis sauvegarder les données. Pour 2 des hdd il a fallu passer par fsck (réparation avec création auto d'un dossier genre "lost &...) pour pouvoir monter le hdd et pouvoir le partager sous windows.... Mais voilà c'est fait, non sans difficultés cependant, et long (récupérer +/- 2To de données puis les sécuriser, les remettre en place...ça tourne encore.
Je remercie ceux qui m'ont aidés de leurs précieux conseils.
Il me semble qu'il manque quelque part un tuto genre "pas à pas" pour la récupération des données suite un crash matériel d'un serveur freenas - avec ou sans corruption des hdd. Car les non spécialistes comme moi sont tentés par l'expérience freenas: un serveur monté avec de vieilles pièces.... alors bien sûr de vieilles pièces qui ronronnent toute la journées, un jour ça crame.... Bon ma dernière sauvegarde était d'Avril - mais c'est fou ce qu'on fait en 3 mois 1/2... Un serveur n'est pas une solution de sauvegarde en soi...
Voilà, un tuyau pour éventuellement clore le sujet - résolu - à moins que quelqu'un puisse ajouter une pierre à l'édifice...
Merci
axigeo

Re: Serveur freenas 0.7.2 en panne...

Posted: 27 Jul 2013 12:20
by loulnux
J'ai lâché ce post pour raison de congés et je souhaite que tu retrouves un maximum de données tu excuseras mais un support au pas à pas reste assez pénible et les quelques trucs qui auront perlés te permettront de prendre confiance par rapport aux éventuels futurs problèmes.
Je ne sais pas si tu persisteras avec FreeNas/Nas4free mais je me permets de faire ici un bilan relatif à ton expérience.
Si tu remets en route un nas, avant de penser à intégrer des disques au gré de tes récupérations, créé d'abord une architecture suivant ton budget et son évolution autour d'une base RAID 1 ou 5 sur laquelle tu pourras t'appuyer en terme de sécurité, transvase tes données "chaudes" des autres disques sur cette base avant de les réaffecter à d'autres partages ou fonction. Il y a ensuite tout un éventail de fonctionnalités qui permettent de de dupliquer et sécuriser les données de manière transparente afin de dormir sur ses 2 oreilles et ne pas être pris au dépourvu en cas de panne.
Je ne peux également que conseiller d'investir dans un onduleur ce qui limite les à coups sur nos appareils; personnellement j'ai protégé mon NAS mes routeurs et switchs afin d'éviter tout déni de service en cas de coupure.