This is the old XigmaNAS forum in read only mode,
it will taken offline by the end of march 2021!



I like to aks Users and Admins to rewrite/take over important post from here into the new fresh main forum!
Its not possible for us to export from here and import it to the main forum!

Informe de error en ZFS POOL

Spanish community

Moderator: MoloMuy

Forum rules
Set-Up GuideFAQsForum Rules
Post Reply
luciano
Starter
Starter
Posts: 25
Joined: 17 Feb 2013 17:26
Status: Offline

Informe de error en ZFS POOL

Post by luciano »

Hola!

Quería consultarles sobre este error que me informa el ZFS POOL One or more devices has experienced an unrecoverable error. y si es para alarmarse o si tengo que tomar alguna acción correctiva o basta con correr el comando zpool clear.

Code: Select all

Información y estado del Pool

pool: ZFS2500GB
state: ONLINE
status: One or more devices has experienced an unrecoverable error. An
	attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
	using 'zpool clear' or replace the device with 'zpool replace'.
see: http://illumos.org/msg/ZFS-8000-9P
scan: resilvered 8.26M in 0h0m with 0 errors on Sun Mar 31 10:43:03 2013
config:

	NAME        STATE     READ WRITE CKSUM
	ZFS2500GB   ONLINE       0     0     0
	  mirror-0  ONLINE       0     0     0
	    ada1    ONLINE       0     0     0
	    ada3    ONLINE       0     0     0
	  mirror-1  ONLINE       0     0     0
	    ada2    ONLINE       0     0     1
	    ada0    ONLINE       0     0     0
	cache
	  ada4      ONLINE       0     0     0
	  ada5      ONLINE       0     0     0

errors: No known data errors
Y este es el estado SMART del disco ada2

Code: Select all

Dispositivo /dev/ada2 - ST2000DM001-1CH164 CC43

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-1CH164
Serial Number:    Z1E1CTGX
LU WWN Device Id: 5 000c50 04e4ebc78
Firmware Version: CC43
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Apr  8 00:26:57 2013 GMT-3

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/en_US/FAQ/207931en
http://knowledge.seagate.com/articles/en_US/FAQ/223651en

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever
					been run.
Total time to complete Offline
data collection: 		(  584) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 226) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3085)	SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   108   099   006    Pre-fail  Always       -       15059552
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       101
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   068   060   030    Pre-fail  Always       -       4301376345
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       842
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       89
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   039   045    Old_age   Always   In_the_past 36 (0 162 38 24 0)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       63
193 Load_Cycle_Count        0x0032   097   097   000    Old_age   Always       -       6157
194 Temperature_Celsius     0x0022   036   061   000    Old_age   Always       -       36 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       739h+01m+03.550s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       2690093105
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       796937415

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Gracias

User avatar
raulfg3
Site Admin
Site Admin
Posts: 4865
Joined: 22 Jun 2012 22:13
Location: Madrid (ESPAÑA)
Contact:
Status: Offline

Re: Informe de error en ZFS POOL

Post by raulfg3 »

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/e ... Q/207931en
http://knowledge.seagate.com/articles/e ... Q/223651en
No se interpretar si los datos de S.M.A.R.T. estan bien o no , pero el warning está claro, te pide actualizar el firmware.

Respecto al pool ZFS , parece que ya ha corregido el problema y lo unico que tienes que hacer es un zpool clear para limpiar el registro de errores , lo puedes hacer desde la webGU en: Disks|ZFS|Pools|Tools

Si actualizas el firmware (recomendado), despues vuelve a pasar un scrub para asegurarte de que los datos están bien (tambien desde Disks|ZFS|Pools|Tools).
12.1.0.4 - Ingva (revision 7743) on SUPERMICRO X8SIL-F 8GB of ECC RAM, 11x3TB disk in 1 vdev = Vpool = 32TB Raw size , so 29TB usable size (I Have other NAS as Backup)

Wiki
Last changes

HP T510

luciano
Starter
Starter
Posts: 25
Joined: 17 Feb 2013 17:26
Status: Offline

Re: Informe de error en ZFS POOL

Post by luciano »

Raul:

Tal como indicaras, ejecuté el comando "zpool clear" desde la WebGui en Disks|ZFS|Pools|Tools

Hoy me llega al correo el resumen del estado de N4F y me reporta lo siguiente:

Code: Select all

ZFS pool list:
--------------
NAME        SIZE  ALLOC   FREE    CAP  DEDUP  HEALTH  ALTROOT
ZFS2500GB  2.27T   894G  1.39T    38%  1.00x  ONLINE  -

ZFS pool status:
----------------
  pool: ZFS2500GB
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://illumos.org/msg/ZFS-8000-8A
  scan: resilvered 8.26M in 0h0m with 0 errors on Sun Mar 31 10:43:03 2013
config:

        NAME        STATE     READ WRITE CKSUM
        ZFS2500GB   ONLINE       0     0    22
          mirror-0  ONLINE       0     0    16
            ada1    ONLINE       0     0    16
            ada3    ONLINE       0     0    16
          mirror-1  ONLINE       0     0    28
            ada2    ONLINE       0     0    28
            ada0    ONLINE       0     0    28
        cache
          ada4      ONLINE       0     0     0
          ada5      ONLINE       0     0     0

errors: 11 data errors, use '-v' for a list
Desde la consola, el comando "zpool status -v" me arroja los siguientes datos:

Code: Select all

errors: Permanent errors have been detected in the following files:

        /mnt/ZFS2500GB/DATOS/TORRENTS/Acero.part04.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/TransitBDrip.part02.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/Acero.part09.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/fbimscr1080p.part09.rar
        /mnt/ZFS2500GB/DATOS/TORRENTS/SagAdEloReJas1080p.part18.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/SagAdEloReJas1080p.part13.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/monje.1080.part05.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/SagAdEloReJas1080p.part33.rar.part
        /mnt/ZFS2500GB/DATOS/TORRENTS/Premonicion.part07.rar.part
Insisto que no es información importante y que estoy evaluando la implementación de N4F en un entorno empresarial. Pero me gustaría saber como recuperar esta información.

Muchas gracias.

User avatar
raulfg3
Site Admin
Site Admin
Posts: 4865
Joined: 22 Jun 2012 22:13
Location: Madrid (ESPAÑA)
Contact:
Status: Offline

Re: Informe de error en ZFS POOL

Post by raulfg3 »

Los errores permanentes NO TIENEN solución, por lo que lo unico que puedes hacer es borrar los archivos problematicos ( puedes primero copiarlos a tu PC y luego borrarlos para que la proxima vez que hagas un Scrub te pueda decir el ZFS que esta limpio.

Los archivos que copies, puedes abrirlos con un editor exadecimal y ver que contienen, en los 4 años que llevo usando el ZFS y que he migrado de la v15 a la v28 actual y he cambiado de placa base 3 veces y he añadido una controladora SATA extra, solo me ocurrio una vez lo de tener errores permanentes de archivos y fue en un disco viejo que al poco tiempo murio y tuve que sustituir ( no creo que sea tu caso), pero imagino que alguna perreria le habras hecho al ZFS para que tenga algun error permanente.

De todas formas perdon por la charla , pero es para que veas que el ZFS es bastante robusto y permite crecer bastante bien y de forma segura sin perder los datos y sin tener que pasarlos a un backup para luego restaurarlos ( ojo que no digo que no tengas Backup, que en mi opinion siempre es aconsejable tenerlo).
12.1.0.4 - Ingva (revision 7743) on SUPERMICRO X8SIL-F 8GB of ECC RAM, 11x3TB disk in 1 vdev = Vpool = 32TB Raw size , so 29TB usable size (I Have other NAS as Backup)

Wiki
Last changes

HP T510

luciano
Starter
Starter
Posts: 25
Joined: 17 Feb 2013 17:26
Status: Offline

Re: Informe de error en ZFS POOL

Post by luciano »

Raul:

Agradezco tu soporte y no estoy hablando mal de zfs, insisto, después de la cagada (perrería) que me mandé poniendo molex que no estaban bien, siento que es un sistema confiable.
De todas maneras, y siguiendo tu línea de pensamiento, voy a implementar backup pero poniendo a trabajar dos N4F en paralelo utilizando el servicio HAST y usando hardware de menor consumo energético (Procesadores ATOM).

Por cierto, has utilizado HAST?

Saludos

User avatar
raulfg3
Site Admin
Site Admin
Posts: 4865
Joined: 22 Jun 2012 22:13
Location: Madrid (ESPAÑA)
Contact:
Status: Offline

Re: Informe de error en ZFS POOL

Post by raulfg3 »

luciano wrote:Por cierto, has utilizado HAST?
No, pero se que se usa en entornos profesionales, por lo que si tu objetivo es montarlo en una pequeña empresa te lo recomiendo , aunque no podre ayudarte a configurarlo porque no tengo experiencia.

De todas formas me interesa tu opinion, siempre se ha dicho que FreeNAS esta orientado a empresa por que tiene soporte de pago detras y venden hardware dedicado y el soft esta probado en el hardware que venden, por otro lado Nas4Free tiene su foco en los NAS personales o de pequeñas empresas (SOHO) , por que necesita menos recursos para funcionar ( un pc no muy viejo) pero no tiene soporte detras ( aparte de los consejos que se puedan dar en el foro por parte de usuarios agradecidos como es mi caso), pero solo hay un par de desarrolladores en activo.

Mi pregunta es: ¿compartes esta opinion?
¿Has probado o pedido presupuesto para un FreeNAS 8 ?
12.1.0.4 - Ingva (revision 7743) on SUPERMICRO X8SIL-F 8GB of ECC RAM, 11x3TB disk in 1 vdev = Vpool = 32TB Raw size , so 29TB usable size (I Have other NAS as Backup)

Wiki
Last changes

HP T510

luciano
Starter
Starter
Posts: 25
Joined: 17 Feb 2013 17:26
Status: Offline

Re: Informe de error en ZFS POOL

Post by luciano »

Raul:
Ante todo reconozco el aporte desinteresado de los foristas y siempre lo agradezco, inclusive aportando la mayor cantidad de información posible para que sirva de referencia a futuros usuarios de N4F.-
No sabía lo del soporte pago de FreeNAS, suena interesante, de todas maneras, es una pequeña empresa con pocos puestos de trabajo (15 PCs), pero lo voy a analizar.

Muchas gracias

Post Reply

Return to “Español”