Page 1 of 2

SMART Mail

Posted: 14 May 2014 11:25
by NKL
Moin,
ich habe beim Erstabgleich der Daten 6 Smart-Errors per Mail erhalten.
Sie kamen alle von meinen "alten" 2 TB Platten. Es handelt sich um 5x 2TB Seagate Barracuda 7200.14.

Die Errors sind folgende:
Device: /dev/ada2, Read SMART Self-Test Log Failed
Device: /dev/ada2, Read SMART Error Log Failed
Device: /dev/ada3, Read SMART Self-Test Log Failed
Device: /dev/ada4, Read SMART Error Log Failed
Device: /dev/ada4, failed to read SMART Attribute Data
Device: /dev/ada5, Read SMART Self-Test Log Failed

Es geht hier ja hauptsächlich um Log-Fehler. Was kann man sich darunter vorstellen und vorallem: Wie sicher sind meine Daten auf diesen Platten noch?
Auf ada1-ada5 liegt ein RaidZ1 aus diesen 5x2TB.

Da ich die Errors weder als pdf noch docx anhängen kann, habe ich sie hier mal hochgeladen: https://dl.dropboxusercontent.com/u/229 ... Errors.pdf

Liebe Grüße, NKL

Re: SMART Mail

Posted: 14 May 2014 13:01
by b0ssman
die platten sehen von den standard smart werten gut aus

es gibt einen spezifisches seagate wert 183 Runtime_Bad_Block
der bei einigen platten bei dir auf 1 ist.
Ich hab nur keine ahnung was dieser wert aussagt.

Re: SMART Mail

Posted: 14 May 2014 22:24
by NKL
b0ssman wrote:die platten sehen von den standard smart werten gut aus
Danke für deine Einschätzung!
b0ssman wrote:es gibt einen spezifisches seagate wert 183 Runtime_Bad_Block, der bei einigen platten bei dir auf 1 ist. Ich hab nur keine ahnung was dieser wert aussagt.
Ich hab das mal gegoogelt. Hab kaum Infos darüber gefunden, bis ich auf diesen Thread gestoßen bin:
http://www.computerbase.de/forum/showth ... st14015349
Und über den "Downshift Error Count" fand ich, dass das heißt, dass das Tempo der Festplatte aus irgendeinem Grund herunter gefahren wurde. Also erstmal kein großartiges Problem oder?

Nur was genau bedeuten meine SMART Errors? Die werden ja nicht ohne Grund gemeldet... Habe da nichts aufschlussreiches zu gefunden.

Aber zumindest du, bossmann, bist noch davon überzeugt, dass die Platten nicht schrottreif sind und in meinem RaidZ1 noch tauglich sind?

Grüße, NKL

Re: SMART Mail

Posted: 15 May 2014 03:30
by Princo
NKL wrote:
b0ssman wrote:Aber zumindest du, bossmann, bist noch davon überzeugt, dass die Platten nicht schrottreif sind und in meinem RaidZ1 noch tauglich sind?
Ich weiß nicht, ob bossmann dir eine Absolution erteilen wird :mrgreen: , Aber ich hätte damit weniger ein Problem, weil ich ja ein funktionierendes Backup habe.... :twisted:

Spässle.

Grüße
Princo

Re: SMART Mail

Posted: 15 May 2014 07:17
by b0ssman
wie gesagt von den standard werten sehen die platten gut aus. (roten im wikipedia artikel
http://en.wikipedia.org/wiki/S.M.A.R.T# ... attributes
ich interpretiere hier das so das 183 nur bei wd und samsung SATA Downshift Error Count ist und bei seagate Runtime Bad Block.

Re: SMART Mail

Posted: 15 May 2014 11:44
by NKL
Princo wrote:Aber ich hätte damit weniger ein Problem, weil ich ja ein funktionierendes Backup habe.... :twisted: Spässle.
Hehe :D Ja noch habe ich auch ein Backup. Ich hatte vor dem ganzen Umgebaue ein komplettes Backup auf eine externe Festplatte gezogen, falls das mit dem intern herumkopieren nicht geklappt hätte. Hat zum Glück alles geklappt, aber ich hab die Daten immerhin noch extern.
Auch dürften am Samstag die restlichen Teile für das Backup-NAS ankommen. Ich warte dann jetzt erstmal bis die Teile da sind, baue das zusammen und zieh ein Erstbackup.
Da aber noch keiner !STOP! gerufen hat, gehe ich davon aus, dass es jetzt grade nicht brennt und im Moment noch alles halbwegs sicher ist.
b0ssmann wrote:wie gesagt von den standard werten sehen die platten gut aus. (roten im wikipedia artikel) http://en.wikipedia.org/wiki/S.M.A.R.T# ... attributes
Ich bin ja auch ein Dummkopf... Ich suche schon seit ein paar Tagen nach einer halbwegs vollständigen Liste mit den einzelnen Smart Attributen und deren Erklärung und im englischen Wikipedia ist die vorhanden. Im deutschen sind keineswegs alle beschrieben. Informationsbeschaffung in der Hinsicht muss ich echt noch lernen :x Danke b0ssmann!
b0ssmann wrote:ich interpretiere hier das so das 183 nur bei wd und samsung SATA Downshift Error Count ist und bei seagate Runtime Bad Block.
Genau so scheint es zu sein. Hier (http://forums.freenas.org/index.php?thr ... post-57934) habe ich grade noch folgendes gefunden:

Code: Select all

Runtime bad blocks are the result of an unexpected voltage shift of a cell during a read, write or erase operation.
Wie kann es denn sein, dass sich die Spannung beim Lesen/Schreiben einfach so ändert?

Grüße, NKL

Re: SMART Mail

Posted: 15 May 2014 12:51
by b0ssman
billiges netzteil mit stromschwankungen?

Re: SMART Mail

Posted: 15 May 2014 14:43
by NKL
500 Watt be quiet! Straight Power E9 Non-Modular 80+ Gold
So ein "Billig"teil ist das jetzt nicht :?

Re: SMART Mail

Posted: 15 May 2014 15:35
by Princo
NKL wrote:Da aber noch keiner !STOP! gerufen hat, gehe ich davon aus, dass es jetzt grade nicht brennt und im Moment noch alles halbwegs sicher ist.
Also, wenn das meine Platten wären, dann würde ich der Sache schon auf den Grund gehen wollen.

1. Zuerst würde ich sämtliche Steckverbindungen prüfen.

2. Dann würde ich das System mit der SystemRescueCD (http://www.sysresccd.org/) von einem USB-Stick booten, und die SMART-Tests von dort aus durchführen.

3. Wenn die Fehler auch dort auftreten, dann würde ich nacheinander die Platten abziehen (vorher runterfahren), und die Tests mit den jeweils verbleibenden Platten erneut durchführen.

Möglicherweise hat nur eine Platte einen leichten Hau weg, und zieht zuviel Strom, so daß es dann für die anderen Platten auch nicht mehr reicht. Mit der Methode findet man die betreffende Platte.

4. Treten die Fehler nach Abzug einiger Festplatten plötzlich nicht mehr auf, dann schließt man die anderen Festplatten (bis auf die zuletzt abgezogene Platte) wieder an, und führt die SMART-Tests erneut durch.

Wenn die Fehler jetzt weg sind, dann schließt man die zuletzt abgezogene Platte alleine an, und wiederholt den Test.

Wenn die Fehler jetzt wieder auftreten, dann hat man den Übeltäter definitiv gefunden.

Diese Test-Reihe sollte nicht unter NAS4Free durchgeführt werden! Die SystemRescueCD ist dafür ideal geeignet, weil der Pool dabei nicht geladen wird.

Sollte der Test keine eindeutigen Ergebnisse bringen, da z.B. die Fehler immer auftreten, gibt es noch andere Möglichkeiten.

Die obige Methode ist aber die, welche ich derzeit für am Sinnvollsten halte.

Grüße
Princo

Re: SMART Mail

Posted: 15 May 2014 20:53
by NKL
Vielen Dank für die ausführliche Anleitung.
Ich warte noch auf meine restlichen Teile und ziehe das Erstbackup. Dann probiere ich das mal aus.
Ist mir dann doch ein wenig brenzlig so ;)
Halte euch aufm Laufenden!

Re: SMART Mail

Posted: 15 May 2014 23:20
by ku-gew
Ich sehe "high fly writes"... d.h. zu viele Vibrationen.
Das würde ich zuerst lösen.

Re: SMART Mail

Posted: 16 May 2014 01:43
by Princo
NKL wrote:Ich warte noch auf meine restlichen Teile und ziehe das Erstbackup. Dann probiere ich das mal aus.
Ist mir dann doch ein wenig brenzlig so ;)
Das, was ich dir vorgeschlagen habe, ist mit Null Risiko behaftet. Mit den Tests bist du in 20 Minuten durch, und danach kann man sehr wahrscheinlich eine valide Risikoabschätzung machen.

Grüße
Princo

Re: SMART Mail

Posted: 19 May 2014 12:55
by NKL
Sorry, habe im Moment bärig viel zu tun. Komme daher auch nicht zu dem "20 Minuten-Test".
Ich melde mich die Tage nochmal, wenn ich die Zeit hatte, mich in Ruhe damit zu befassen.

Re: SMART Mail

Posted: 04 Jun 2014 21:21
by NKL
Soooo. Lang lang ists her, aber ich komme endlich mal wieder dazu etwas zu schreiben.
Mittlerweile ist auch der Backup-Server fertig und einsatzbereit. Das Erstbackup ist auch bereits geschehen.

Zu den SMART Werten:
Ich habe mich auch nochmal intensiv mit dem Interpretieren von SMART Berichten beschäftigt.
Komme somit in Einklang mit bossmann, dass die Platten ansich gar nicht schlecht aussehen.
Bis auf 3 Punkte zumindest:

- ada0, die Samsung SpinSpoint Platte: Hat schon einiges aufm Buckel und ist dementsprechend teilweise auch schon abgenutzt.
Das ist aber nicht weiter wild, es ist ja nur meine Temp-Platte auf denen mal was zwischen gespeichert wird.
Die kann ruhig kaputt gehen.

- die Runtime bad blocks: Princo, ich habe deine Anleitung oben abgearbeitet. Bei der SystemRescueCD hatte ich eine Oberfläche erwartet auf der man einen SMART Test auswählen kann (war das zumindest so von der UltimateBootCD gewohnt). Dem war nicht so, also habe ich in der geladenen gentoo-Konsole mit smartctl gearbeitet.
Dabei habe ich zuerst die einzelnen Smart Berichte ausgelesen. Dort tauchten auch immer noch vereinzelt die RunTimeBadBlocks auf, genau so wie auch in der N4F Ansicht.
Ich habe mir dann eine mit diesem Fehler rausgepickt und alle anderen Platten stückweise entfernt. Wieder neu gestartet und Smart Bericht angeschaut. Da das ja der RAW-Wert ist, müsste der ja laufend aktualisiert werden. Die 1 tauchte aber immer noch auf. Auch bei der anderen Platte mit dem BadBlock brachte ein entfernen der anderen nichts.
Anschließend habe ich noch einen Short-Self-Test auf allen Platten angestoßen. Dabei kamen nach dem Test keine Fehler raus.
Das dürfte so in etwa das gewesen sein, was du wissen wolltest oder?

- ada6: Diese Platte besitze ich jetzt seit ca. 1,5 Monaten. Sie sieht nach den Smart Werten (vorallem in Bezug auf RawReadErrorRate und die Pending Sectors) schon sehr sehr schlecht aus. Auch erhalte ich bei jedem starten des NAS eine Mail, dass es Errors gab. Diese Platte scheint also vermutlich defekt zu sein. Was sagt ihr dazu? Ich würde sie reklamieren.
Da ich mit der Platte ein Mirror habe und ein vollständiges NAS-Backup, dürfte ein Ersetzen sehr einfach und sicher möglich sein.
In der Mail sind auch folgende Topics angesprochen:
Device: /dev/ada6, 4 Currently unreadable (pending) sectors
Device: /dev/ada6, Self-Test Log error count increased from 0 to 1
Ich sehe "high fly writes"... d.h. zu viele Vibrationen.
Das würde ich zuerst lösen.
Das ist etwas schwierig. Meine Platten hängen in Inter-Tech HDD-Wechselrahmen. Diese sind in den 5,25'' Zoll Schächten des Gehäuses verschraubt.
Habe da leider wenig Einfluss drauf.

Am Anfang schrieb ich auch noch über die SmartLog Fehler. Die wurden bisher noch gar nicht angesprochen.
Was hat es mit denen aufsich? Ich fand darüber nur, dass Kommandos an die Platte fehlschlugen und er somit das Log nicht auslesen konnte, o.Ä.
Wie kann das passieren und ist das gefährlich? Normal ist das zumindest nicht...

Hier ein Link zu den aktuellen SMART-Werten. Dieses Mal einfach aus dem Webinterface kopiert. Vorallem bei ada6 hat sich eine Menge verändert!
https://dl.dropboxusercontent.com/u/229 ... %20neu.pdf

Liebe Grüße, NKL

EDIT: crowi wies in dem anderen Thread noch auf den loadcylecount der WD-Platten hin. Nach meiner Einschätzung habe meine Platten nicht das HeadParkingProblem oder? Die 122 oder 119 sehen doch ziemlich normal aus.

Re: SMART Mail

Posted: 11 Jun 2014 23:17
by NKL
Soo, ich werde ada6 zurückschicken. Die elendigen SMART Errors sind nicht mehr akzeptabel. Von Stunde zu Stunde steigen sie rapide an...
Da diese Platte mit einer baugleichen WD RED 4TB im ZFS-Mirror hängt, dürfte das auswechseln ja sehr einfach gehen oder?
- scrub starten
- Backup vom Server ziehen (sicherheitshalber)
- Platte ausbauen und zurückschicken
- neue einbauen
- über den 'replace' Befehl die neue Platte resilvern lassen

Wie bekomme ich es hin, dass die Daten nicht auslesbar sind? Muss ich die ganze Platte ausnullen (dauert bei 4TB ewig) oder reicht ein "gpart destroy -F ada6" um die Partitionstabelle zu löschen? Können die Daten dann noch, mit vertretbarem Aufwand, wiederhergestellt werden?

Liebe Grüße
NKL

Re: SMART Mail

Posted: 12 Jun 2014 10:07
by crowi
EDIT: crowi wies in dem anderen Thread noch auf den loadcylecount der WD-Platten hin. Nach meiner Einschätzung habe meine Platten nicht das HeadParkingProblem oder?
Ja, die sehen gut aus, aber behalte den Wert mal im Auge.
Da diese Platte mit einer baugleichen WD RED 4TB im ZFS-Mirror hängt, dürfte das auswechseln ja sehr einfach gehen oder?
ja
- scrub starten
nein, scrub mit einer defekten Platte ist nicht unbedingt sinnvoll, da möglicherweise das System höngen bleibt, wenn es versucht von defekten Sektoren zu lesen.
- Backup vom Server ziehen (sicherheitshalber)
ja
- Platte ausbauen und zurückschicken
- neue einbauen
- über den 'replace' Befehl die neue Platte resilvern lassen
ja
Wie bekomme ich es hin, dass die Daten nicht auslesbar sind? Muss ich die ganze Platte ausnullen (dauert bei 4TB ewig) oder reicht ein "gpart destroy -F ada6" um die Partitionstabelle zu löschen? Können die Daten dann noch, mit vertretbarem Aufwand, wiederhergestellt werden?
gpart destroy löscht nur die Partitionstabelle, Deine Daten können danach leicht ausgelesen werden.
Ich würde DBAN empfehlen, dauert zwar ein bisschen aber danach sind die Daten einigermassen sicher weg.
Schneller geht es wennn Du sie mit dd ausnullst :)

Re: SMART Mail

Posted: 12 Jun 2014 14:22
by NKL
Alles Klar, das Ausnullen läuft. Mal gucken wann dann die Ersatzplatte kommt.
Danke dir crowi!

EDIT: Ich habe das ganze jetzt an einem anderen Linuxrechner gestartet um die Platte wirklich aus dem System rauszuhaben.
Wenn ich einfach in die N4F Konsole gegangen wäre und dd gestartet hätte, hätte er das im Raid auch durchgezogen, also den kompletten Mirror ausgenullt oder? :lol:

Re: SMART Mail

Posted: 12 Jun 2014 14:34
by crowi
Wenn ich einfach in die N4F Konsole gegangen wäre und dd gestartet hätte, hätte er das im Raid auch durchgezogen, also den kompletten Mirror ausgenullt oder?
Hab ich noch nicht ausprobiert, aber es könnte durchaus sein...
Mach mal und sag mir dann was passiert ;)

Re: SMART Mail

Posted: 12 Jun 2014 14:52
by NKL
Hehe, klingt verlockend, aber nein danke :D

Re: SMART Mail

Posted: 17 Jun 2014 22:26
by NKL
Moin,
ich muss doch nochmal einen Punkt ansprechen, der noch nicht "beantwortet" wurde.
Am Anfang schrieb ich auch noch über die SmartLog Fehler. Die wurden bisher noch gar nicht angesprochen.
Was hat es mit denen aufsich? Ich fand darüber nur, dass Kommandos an die Platte fehlschlugen und er somit das Log nicht auslesen konnte, o.Ä.
Wie kann das passieren und ist das gefährlich? Normal ist das zumindest nicht...
Ich habe heute bei einem größen Kopiervorgang auf das NAS wieder zwei Mail bekommen.

Device: /dev/ada2, Read SMART Self-Test Log Failed
Device: /dev/ada3, Read SMART Self-Test Log Failed

Von den sonstigen Werten sehen sie eigentlich gut aus. Hat da noch jemand eine Idee zu?

Hier nochmal der ganze Bericht:
ada3

Code: Select all

This message was generated by the smartd daemon running on:

   host name:  nas-server
   DNS domain: local

The following warning/error was logged by the smartd daemon:

Device: /dev/ada3, Read SMART Self-Test Log Failed

Device info:
ST2000DM001-1CH164, S/N:W1E39NAV, WWN:5-000c50-05e564f43, FW:CC26, 2.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
No additional messages about this problem will be sent. smartctl 6.2 2013-07-26 r3841 [FreeBSD 9.2-RELEASE-p4 amd64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-1CH164
Serial Number:    W1E39NAV
LU WWN Device Id: 5 000c50 05e564f43
Firmware Version: CC26
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Jun 17 18:34:55 2014 CEST

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/en_US/FAQ/207931en
http://knowledge.seagate.com/articles/en_US/FAQ/223651en

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  575) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 226) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3085)	SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   117   099   006    Pre-fail  Always       -       153041872
  3 Spin_Up_Time            0x0003   096   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       70
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   064   060   030    Pre-fail  Always       -       2871079
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       164
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       68
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   064   045    Old_age   Always       -       33 (Min/Max 23/34)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       25
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       636
194 Temperature_Celsius     0x0022   033   040   000    Old_age   Always       -       33 (0 13 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       135h+17m+15.245s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       4618903899
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       2423909435

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       158         -
# 2  Short offline       Interrupted (host reset)      00%       157         -
# 3  Short offline       Completed without error       00%       152         -
# 4  Short offline       Completed without error       00%       147         -
# 5  Short offline       Completed without error       00%       142         -
# 6  Short offline       Completed without error       00%       137         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
ada2

Code: Select all

This message was generated by the smartd daemon running on:

   host name:  nas-server
   DNS domain: local

The following warning/error was logged by the smartd daemon:

Device: /dev/ada2, Read SMART Self-Test Log Failed

Device info:
ST2000DM001-9YN164, S/N:Z240D8L9, WWN:5-000c50-04eadc8a9, FW:CC4B, 2.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
No additional messages about this problem will be sent. smartctl 6.2 2013-07-26 r3841 [FreeBSD 9.2-RELEASE-p4 amd64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-9YN164
Serial Number:    Z240D8L9
LU WWN Device Id: 5 000c50 04eadc8a9
Firmware Version: CC4B
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Jun 17 13:34:55 2014 CEST

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/en_US/FAQ/207931en
http://knowledge.seagate.com/articles/en_US/FAQ/223651en

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  609) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 261) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3085)	SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   100   006    Pre-fail  Always       -       217345888
  3 Spin_Up_Time            0x0003   092   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       393
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   066   060   030    Pre-fail  Always       -       4834402
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       330
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       393
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   090   090   000    Old_age   Always       -       10
190 Airflow_Temperature_Cel 0x0022   064   062   045    Old_age   Always       -       36 (Min/Max 24/36)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       27
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2173
194 Temperature_Celsius     0x0022   036   040   000    Old_age   Always       -       36 (0 19 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       244h+08m+10.179s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       3330536483957
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       13275946211116

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       329         -
# 2  Short offline       Interrupted (host reset)      00%       328         -
# 3  Short offline       Completed without error       00%       323         -
# 4  Short offline       Completed without error       00%       318         -
# 5  Short offline       Completed without error       00%       313         -
# 6  Short offline       Interrupted (host reset)      10%       308         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Danke und schöne Grüße,
NKL

Re: SMART Mail

Posted: 17 Jun 2014 22:56
by Princo
Hi NKL,

Warum machst du nicht einfach das, was dir das smartlog bereits vorschlägt?

Du hast mehrere ST2000DM001-9YN164 in deinem System, die unterschiedliche und nicht aktuelle Firmwarestände haben.

Klick einfach auf die Links zur Knowledge-Base, die dir im Report angezeigt werden. Dort kommst du dann irgendwann zur aktuellen Firmware.

Der aktuelle Firmware-Stand ist CC4H

Grüße
Princo

Re: SMART Mail

Posted: 18 Jun 2014 10:06
by NKL
Moin Princo,
danke für die Info. Die Firmware hatte ich bis jetzt noch nicht überprüft und das "may be" wohl konsequent überlesen :?
Ich werde dann wohl am Wochenende mal aktualisieren. Wie gefährlich ist es, wenn ich das in meinem NAS-System direkt mache? Oder sollte ich das lieber extern an einem anderen PC durchführen?
Da ich ein komplettes Datenbackup auf dem zweiten NAS habe, dürfte das ja machbar sein. Ist eh das einfachste dann, da ich dann direkt mehrere updaten kann. :)

Grüße, NKL

Re: SMART Mail

Posted: 18 Jun 2014 10:54
by b0ssman
meist laufen diese firmware update programme nur unter dos und nicht mit allen controllern.

Re: SMART Mail

Posted: 19 Jun 2014 00:34
by NKL
ah ok. Ich hatte das etwas anders interpretiert. Auch wenn auf der Webseite steht: "See Document ID: 004989 for instructions on updating your firmware in Windows using this .iso file."
Auch die Bilder der Schritt-für-Schritt Anleitung sahen für mich wie ein bootfähiges Medium aus. Das dürfte ja dann, unabhängig vom OS, funktionieren.
Ich werds am Wochenende einfach mal ausprobieren.

Re: SMART Mail

Posted: 25 Jun 2014 22:44
by NKL
Ich habs über die *.exe in nem Windows7-System durchgeführt.
Alle Platten haben jetzt die neuste Firmware.
Mal sehen ob die Fehler weiterhin auftreten. Danke für die Hilfe!

Re: SMART Mail

Posted: 04 Jul 2014 17:36
by NKL
Gerade ist der Fehler wieder aufgetreten:

Code: Select all

This message was generated by the smartd daemon running on:

   host name:  nas-server
   DNS domain: local

The following warning/error was logged by the smartd daemon:

Device: /dev/ada2, Read SMART Error Log Failed

Device info:
ST2000DM001-9YN164, S/N:Z240D8L9, WWN:5-000c50-04eadc8a9, FW:CC4H, 2.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
No additional messages about this problem will be sent. smartctl 6.2 2013-07-26 r3841 [FreeBSD 9.2-RELEASE-p4 amd64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-9YN164
Serial Number:    Z240D8L9
LU WWN Device Id: 5 000c50 04eadc8a9
Firmware Version: CC4H
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Jul  4 17:29:56 2014 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  609) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 261) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3085)	SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   100   006    Pre-fail  Always       -       231707592
  3 Spin_Up_Time            0x0003   092   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       429
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   067   060   030    Pre-fail  Always       -       5666673
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       404
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       428
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   090   090   000    Old_age   Always       -       10
190 Airflow_Temperature_Cel 0x0022   064   062   045    Old_age   Always       -       36 (Min/Max 26/37)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       29
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2594
194 Temperature_Celsius     0x0022   036   040   000    Old_age   Always       -       36 (0 19 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       298h+10m+24.572s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       5127745229981
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       18179338758129

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       399         -
# 2  Short offline       Completed without error       00%       397         -
# 3  Short offline       Completed without error       00%       384         -
# 4  Short offline       Completed without error       00%       359         -
# 5  Short offline       Completed without error       00%       358         -
# 6  Short offline       Completed without error       00%       329         -
# 7  Short offline       Interrupted (host reset)      00%       328         -
# 8  Short offline       Completed without error       00%       323         -
# 9  Short offline       Completed without error       00%       318         -
#10  Short offline       Completed without error       00%       313         -
#11  Short offline       Interrupted (host reset)      10%       308         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Hat noch jemand eine Idee bezüglich dem "Read SMART Error Log Failed"?

Grüße, NKL

Re: SMART Mail

Posted: 04 Jul 2014 18:11
by b0ssman
lässt du deine platten in den standy gehen?

steht was im dmesg log?

Re: SMART Mail

Posted: 04 Jul 2014 23:03
by NKL
Hallo b0ssman,
nein meine Platten gehen nicht in den StandBye.
Ich habe zwischenzeitlich leider meinen Server heruntergefahren, somit habe ich keine Einträge mehr im Log zu der Zeit wo es passiert ist.
Kann man die irgendwo nachträglich noch einsehen? Ich fürchte ja nicht...
Habe alle logs in "var/logs" durchgeschaut, ist alles nur ab dem erneuten Starten des NAS. In denen steht aber nichts zu dem Thema.

Grüße, NKL

Re: SMART Mail

Posted: 05 Jul 2014 07:37
by b0ssman
nach einem neustart sind die weg.

die dmesg ausgaben sind entweder die ausgabe von dmesg auf der console oder
webguid diagnose | log

Re: SMART Mail

Posted: 05 Jul 2014 10:03
by NKL
Das dachte ich mir... Dann muss ich wohl warten bis der Fehler nochmal auftritt.

Jap, ich hatte beides gemacht. Einmal die Logs in der WebGUI durchgeschaut und einmal über dmesg-Befehl in der Konsole.
Da war nichts besonderes zu dem Fehler drin.