Skip to main content

kurz notiert: Software RAID 1 Synchronisierung und S.M.A.R.T Tests

Ich betreibe ein Software RAID 1 mit zwei Festplatten. Dieses RAID war nicht mehr synchron. Der Befehl “cat /proc/mdstat” zeigte 93% an. Entweder gab es Festplattenfehler oder so viel IO Last, dass die Resynchronisation nicht mehr hinterherkam (die Synchronisationsgeschwindigkeit hängt von der IO-Last ab). Da dies ungewöhnlich ist, habe ich dann auf beide Platten S.M.A.R.T Tests durchlaufen lassen. Leider wurden diese Tests nie beendet - selbst bei den zwei Minuten Tests kam die Meldung:

$ smartctl -a /dev/sda
...
Self-test execution status:      ( 241)	Self-test routine in progress...
					10% of test remaining.
...

Bei einer kleinen Recherche hatte jemand auch das Problem mit einem RAID 1 Verbund. Vor allem war bei mir die Resynchronisation mit einer Geschwindigkeit von ca. 300-600K/sec total langsam. Irgendwie müssen sich die Tests und die Resynchronisation gegenseitig geblockt haben. Selbst ein Herauslösen einer der Platten aus dem RAID ging nicht (gut, kann auch sein, dass es gemountet so nicht geht):

$ mdadm /dev/mdX --remove /dev/sdXX
mdadm: hot remove failed for /dev/sdXX: Device or resource busy

Nachdem ich die Tests dann mit “smartctl -X /dev/sdX” abgebrochen hatte, erhöhte sich die Geschwindigkeit auf 4000-7000K/sec (je nach Auslastung).