forum.ubuntuusers.de/topic/festplatte-fehlerhafte-sektoren/2/
Es gibt grob gesagt zwei Arten von Fehlern: Positionierungsfehler der Schreib-Leseköpfe und ECC-Fehler.
ECC bedeutet Error Correction Code, das ist nix anderes als eine Prüfsumme. Von jedem Datenblock (4096 bytes) legt der Controller daher eine Prüfsumme ab. Die Festplatte kennt genau genommen mehr Zustände als 0 und 1, z.B: 0,9 0,02 auch 0,5 ! Diese Abweichungen haben verschiedene Gründe: Erschütterungen (z.B Wutausbrüche des Admins ), auch PC und festplatteneigene Vibrationen; „Hektik“ des Schreib-Lesekopfes, der manches Bit nicht gleich beim ersten Mal richtig trifft; natürliche Radioaktivität (ja, auch die kann aus einer 0 eine 1 machen); magnetische Streufelder (praktisch nur festplattenintern)
JEDE Festplatte, die auch nur einen winzigen Datenverkehr in ihrem Leben hatte, hat ECC-Fehler erlebt. Dagegen ist sie aber gut gerüstet, denn der Controller gibt dann das korrigierte Datenpaket an Tux weiter und schreibt dann den Block korrigiert zurück auf die Festplatte und kontrolliert ihn nochmal. Dieser Wert kann nach jahrelanger Laufzeit einer Festplatte wahrlich astronomische Werte annehmen 1GBit ist keine Seltenheit, bei äusserst gestressten Festplatten. Schafft der Controller es auch nach mehreren Versuchen nicht, einen korrigierten Datenblock in einen Sektor zu schreiben, markiert er den Sektor als „schlecht“ und nutzt ihn nicht mehr. Die Daten gehen dabei nicht verloren, sondern werden in einen anderen guten Sektor verschoben. Das klappt nur, solange die Festplatte nicht bis zum letzten Bit voll ist. Wenn ein Sektor schlecht ist, hat das mit einem Defekt auf der Plattenoberfläche zu tun.
Schlimmer ist das Ganze natürlich, wenn er beim Lesen einen Datenblock nicht korrigieren kann. Dann wird es euch der Controller sagen (I/O-Fehler), aber meistens verharrt die Festplatte vorher längere Zeit in dem schlechten Sektor und probiert immer wieder, ihn zu lesen.
Hinweis: Manche Hersteller, wie z.B. Samsung, haben eine sogenannte Servo-Spur reserviert. Diese Sektoren sind hardwareseitig gesperrt und nicht löschbar. Da sprechen wir in Grössenordnungen von 150-200 Sektoren, hängt ganz davon ab. Dieser Wert bleibt nach vielleicht kurzem Anstieg stabil. Diese Sektoren sind aber NICHT als schlecht markiert, sondern einfach nicht verfügbar.
Mit den Positionierungsfehlern von Festplatten verhält es sich ähnlich. Allerdings sind nicht korrigierbare Positionierungsversuche ein sehr ernstes Problem und deuten auf schwere Schäden hin – aber nur NICHT KORRIGIERBARE POSITIONIERUNGSFEHLER!!! Bei Laptops kommen korrigierbare Positionierungsfehler häufiger vor, als bei stationären PCs. Klar, versucht ihr mal im Auto während einer holprigen Fahrt ein Buch zu lesen. Ist auch nicht so einfach . Eine Festplatte liest in einer Sekunde etliche Millionen Bytes – die ist trotzdem noch schneller, als ihr
Übrigens positionieren und entmagnetisieren mache Toshiba-Festplatten ihre Köpfe neu. Dabei stellen sie für etwa 1 Sekunde jede Lese-und Schreibtätigkeit ein und ein leises „Ding“ ist zu hören – völlig normal.
Kurzum, kritisch sind:
viele (mehr als 500) nicht korrigierbare „schlechte“ Sektoren – beobachten, im Zweifel tauschen
Anzahl ausstehender Sektoren – Hinweis auf Oberflächenschaden – sofort tauschen – Daten dort sind in höchster Gefahr!
nicht korrigierbare ECC-Fehler - „Adlerauge“
nicht korrigierbare Positionierungsfehler/Suchfehler - sehr bedenklich – umgehend tauschen
Fehlgeschlagene Anlaufversuche – sehr bedenklich – umgehend tauschen
Festplattentemperatur >50°C – Temperaturverhältnisse im Rechner prüfen.
Denkt bitte daran, dass nicht alle Festplattenhersteller alles Preis geben. Western Digital zum Beispiel schreibt bei vielen Werten einfach 0 rein. Da hat man keine Chance, den Zustand der Festplatte zu erahnen. Hitachi und Samsung sind geradezu beängstigend genau.
... Deine Festplatte ist soweit gut. Meine ist schlimmer beieinander . Ich hab 270 neu zugewiesene Sektoren , aber keinen defekten - also Servospur. Bei dir wird sogar die Anzahl der Suchfehlerrate angegeben, bei mir nicht. Dieser Wert ist kein Problem, solange die Festplatte alle korrigieren konnte und das konnte sie bei dir immer, denn ansonsten hättest du wesentlich massivere Probleme und die Festplatte würde nicht mehr funktionieren oder sehr langsam sein.
Was mir bei dem Screenshot Sorgen macht, sind nicht die roten Einträge, sondern der Eintrag unter "nicht korrigierbare Sektoren". Ich hatte vor Kurzem mal eine Festplatte, die aehnliche Meldungen anzeigte. Wir mussten sie kurz darauf tauschen, weil es immer schwerere Abstuerze gab. Partitionieren, formatieren u.s.w ändert daran nichts, denn kaputt ist kaputt. Es kann höchstens sein, dass die Festplatte noch nicht alle schadhaften Stellen gefunden hat, weil sie dort nur selten oder nie Daten geschrieben oder gelesen hat.
Falls jemand sehr wichtige Daten hat (z.B. Doktorarbeiten, Finanzdaten; also "selbst erschaffene Daten") und aus bestimmten Gründen nur selten oder gar kein Backup machen kann, dem würde ich empfehlen, entweder zwei Platten über RAID Modus 1,5 etc. laufen zu lassen (also zwei Festplatten zusammengeschaltet-gespiegelt mit exakt gleichem Inhalt). Wer das Geld oder/und Platz in seinem Rechner/Laptop nicht hat, der sollte auf eine Festplatte mit möglichst kleinen Speicherplatz zurückgreifen. Denn je höher die Schreibdichte, desto wahrscheinlicher sind Ausfälle. Es bewährt sich auch, zugriffsintensive Teile von Tux auf einer extra Festplatte zu legen, also das Wurzelverzeichnis (nur Betriebssystem), inkl. Root-Verzeichnis, Boot, Swap und Temp-Verzeichnisse, auch Datenbankdateien und den Datenbereich dann auf ein Datenmonster (1 TB oder so) zu legen: home-Verzeichnisse, extra Datenpartitionen. Das hat den Vorteil, dass es bei weitem nicht so schlimm ist, wenn eine Platte ausfällt. Denn entweder kann man Tux noch booten und dann sich als Root anmelden und einiges noch von der (beinahe) kaputten Datenplatte retten, oder die Systemplatte versagt, was in der Regel das kleinere Übel ist, denn auf der Platte sind lediglich Systemdaten, die man wieder installieren kann. Schlimmstenfalls muss man die ganze Konfiguriererei neu machen. Aber Aufräumen tut auch mal gut
Bei der Gelegenheit rate ich auch ab vom Addieren einzelner Festplatten zu einer grossen mittels RAID, LVM oder was sonst noch. Ihr könnt euch sicherlich vorstellen, dass in dem Fall bei dem Ausfall einer Festplatte ALLE anderen Platten praktisch nicht mehr lesbar sind. Klar kann man die zwar binär auslesen. Aber dass ist sehr aufwändig und man hat in der Regel nur noch Datenfetzen.
Dieser Beitrag wurde schon 1 mal editiert, zum letzten mal von piazza_adm am 01.09.2012 05:56.
|