This is the old XigmaNAS forum in read only mode,
it will taken offline by the end of march 2021!



I like to aks Users and Admins to rewrite/take over important post from here into the new fresh main forum!
Its not possible for us to export from here and import it to the main forum!

Правильно оценить проблему по логам.

Russian community

Moderators: alexey123, MikeMac

Forum rules
Set-Up GuideFAQsForum Rules
Post Reply
addadd
NewUser
NewUser
Posts: 2
Joined: 20 Aug 2016 09:21
Status: Offline

Правильно оценить проблему по логам.

Post by addadd »

Файловый сервер из трех дисков устанавливал по инструкции 2gusia aka mikemac.
Около года пользовался, все было хорошо.
Не так давно заметил что отвалился один диск, диски в корзине горячей замены, и мог отойти контакт.
Отключил сервер, вытащил все диски из корзины, потом поставил обратно, включил сервер и он перешел в режим Онлайн.
Начался ресильвиринг и около двух часов сервер собирал на проблемный диск недостающие данные.
Счетчик CKSUM в обзоре пула показывал на проблемном диске значение 2. Остальные показатели READ WRITE были по нулям.
В SMART на проблемном диске появились такие ошибки:
Error 6 occurred at disk power-on lifetime: 6837 hours (284 days + 21 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 08 70 01 00 40 Error: IDNF at LBA = 0x00000170 = 368

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ca 00 08 70 01 00 40 08 01:12:28.138 WRITE DMA
ca 00 08 70 01 00 40 08 01:12:21.139 WRITE DMA

Error 5 occurred at disk power-on lifetime: 6837 hours (284 days + 21 hours)
When the command that caused the error occurred, the device was active or idle.

Помимо прочего, крайне низкая скорость копирования 2000-3000 кбит/с файл 220 мегабайт копируется за 2-3 минуты из одной папки в другую.

Решил запустить SCRUB.
После запуска SCRUB:
Pool information and status
pool: Pool
state: ONLINE
status: One or more devices has experienced an unrecoverable error. An
attempt was made to correct the error. Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
using 'zpool clear' or replace the device with 'zpool replace'.
see: http://illumos.org/msg/ZFS-8000-9P
scan: scrub repaired 1.90G in 3h43m with 0 errors on Tue Aug 16 04:44:26 2016
config:

NAME STATE READ WRITE CKSUM
Pool ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
gpt/WD-WCC4N5HKEASS ONLINE 0 0 0
gpt/WD-WCC4N1TY7UY6 ONLINE 0 0 48.8K
gpt/WD-WCC4N1TY7TCC ONLINE 0 0 0

errors: No known data errors
Не могу разобраться как прикрепить текстовые файлы логов.

addadd
NewUser
NewUser
Posts: 2
Joined: 20 Aug 2016 09:21
Status: Offline

Re: Правильно оценить проблему по логам.

Post by addadd »

Забыл добавить.
Думал - проблема в диске.
Полная проверка штатным софтом WD сказала что все ОК.
Проверка Викторией, так же показала что 1 сектор на всем диске 200 мс отклик, 3000 секторов 20 мс, остальные до 5 мс.
Ошибок ни одной.

User avatar
MikeMac
Forum Moderator
Forum Moderator
Posts: 429
Joined: 07 Oct 2012 23:12
Location: Moscow, Russia
Contact:
Status: Offline

Re: Правильно оценить проблему по логам.

Post by MikeMac »

addadd wrote:Думал - проблема в диске.
При любой проблеме с диском надо прикладывать SMART, иначе это - телепатия

Практически всегда (именно в этой последовательности) проблемы дисков возникают из-за
1) контактов SATA кабеле (=гнилой кабель, на замену)
2) проблем по питанию (если дисков много, больше 5, тем более 8-10.) Тогда смотрим на то, есть ли у БП раздельная стабилизация по 5 и 12 В
3) посыпался сам диск
4) проблема с контроллером или совместимость моделей контроллера и диска

Естественно предполагаю, что у вас п 1
В этом случае SMART покажет нулевой 5 параметр и что-то заметное в 196, 197 и 199 параметрах.

Post Reply

Return to “Российская”