Zum Inhalt springen

Self-Monitoring, Analysis and Reporting Technology

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 30. September 2005 um 08:32 Uhr durch Casandro (Diskussion | Beiträge) (Weblinks: Ultimate Boot CD entfernt, enthält keine SMART-fähigen Programme). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Self-Monitoring, Analysis and Reporting Technology, kurz S.M.A.R.T., ist ein in Computerfestplatten eingebautes Diagnosesystem. Es ermöglicht das permanente Überwachen wichtiger Parameter und somit das frühzeitige Erkennen drohender Defekte.

Überblick

Ähnlich dem Auslesen des Fehlerspeichers eines Automobils erfolgt das Auswerten der überwachten Daten beim Starten des PCs durch das entsprechend eingestellte BIOS oder durch spezielle Software, die zusätzlich zum Betriebssystem installiert werden muss. Microsoft beispielsweise stellt hierzu seit Windows 98 nur einen Treiber bereit, der dann von dieser Software angesprochen wird. Nur sie kann die Daten auswerten und eventuelle Warnungen anzeigen.

Dabei orientiert sich das Programm an vom Festplattenhersteller festgelegten Grenzwerten für die einzelnen Parameter, etwa für die Temperatur. Nach einem längeren Zeitraum kann die Software dann auch noch zu erwartende Ausfälle prognostizieren.

S.M.A.R.T. bleibt dabei jedoch auf die Festplatte beschränkt und liefert keine Aussage zur Gesamtzuverlässigkeit des Computers. Auch findet keine Vernetzung der gewonnenen Daten mehrerer Festplatten statt. Desweiteren stellt das System keine Norm dar. Es bleibt den Festplattenherstellern überlassen, welche Parameter sie überwachen und in welche Grenzen sie diese einbetten. Unter Anwendern wird auch die Genauigkeit der Überwachung diskutiert. So gelten manche Temperatursensoren als zu optimistisch eingestellt oder platziert, da sie beim Start des Systems deutlich unter Raumtemperatur liegen. Noch schwieriger zu entdecken sind Überlaufe einzelner Parameter. Ähnlich der PKW-Laufleistung wird etwa die Betriebszeit der Festplatten mitgezählt, die Null-Durchläufe dieser Zähler jedoch werden weder protokolliert, noch durch Sichtprüfung erkennbar.

Geschichte

1992 erkannte IBM, dass mit zunehmender Verbreitung von PCs in Unternehmen ebenso dass in sie gesetzte Vertrauen stieg. Ausfälle wurden zunehmend zu einem finanziellen Problem, dem man mit PFA (Predictive Failure Analysis) begegnen wollte. IBM-Festplatten mit diesem System teilten dem Computer jegliche Parameteränderungen mit, dessen Nutzer so rechtzeitig mit Austausch reagieren konnte. Etwas später wurde durch Compaq IntelliSafe vorgestellt. Dieses filtert Unrelevantes und meldet der mitlaufenden Software nur die bedrohlichen Änderungen und Sollwerte. Seagate, Quantum und Conner waren an der Entwicklung beteiligt und paßten es an ihre Produkte an; Compaq selbst fertigte keine Festplatten.
Das Potenzial ahnend und mit einen Industriestandard vor Augen wurde die Offenlegung des Systems durch Compaq und insbesondere Seagate forciert. Zusammen mit Conner, Quantum, Western Digital und dann auch IBM entstand eine Fusion der beiden Ansätze unter dem Namen S.M.A.R.T.

Seit 1996 und dem Start des ATA-3-Standards respektive SCSI-3 vier Jahre zuvor gehört es beinah ausnahmlos zur Standardausstattung einer Festplatte.

Zwei Varianten: ATA und SCSI

Die Realisierung des S.M.A.R.T.-Standards unterscheidet sich bei den Festplatten-Anschlüssen.

Im ATA-Standard fragt die mitlaufende Software periodisch alle Werte und ihre Grenzen ab. Sie entscheidet daraufhin, ob sich eine Warnung lohnt, oder die Grenze weiträumig unterschritten wird. Bei SCSI-Laufwerken erfolgt diese Entscheidung in der Festplatte. Die Software kann nur ein "okay" oder "problematisch" auslesen und an den Nutzer oder die Protokolldatei weitergeben.

Übliche Parameter

Jeder Wert wird zunächst als Raw-Data, z.B. 30°C für die Temperatur abgespeichert. Dieser wird dann auf einer Werteskala von 0 bis 100 einsortiert. Von dieser wird im folgenden ausgegangen.

  • Raw Read Error Rate
    • Nichtkorrigierbare Fehler beim Lesen von der Festplatte.
    • Deutet auf Problem mit den Lese-/Schreibköpfen oder der Plattenoberfläche hin.
    • Startet mit einem hohen Wert und nähert sich mit jedem Fehler Null.
    • Auch vom Hersteller unerklärt, tragen hier einige fabrikneue Seagate-Laufwerke Werte weit unter 100 ein.
  • Throughput Performance
    • Allgemeiner Datendurchsatz / Effizienz der Festplatte.
    • Deutet stark auf bremsende Probleme im Laufwerk hin.
    • Startet mit einem hohen Wert und nähert sich bei Fehlern Null.
  • Spin Up Time
    • Durchschnitt der Startzeit
    • Deutet auf Probleme beim Motor oder den Platten-Lagern hin.
    • Startet mit einem hohen Wert und nähert sich bei Fehlern Null.
    • Bei fabrikneuen Maxtor und Quantum-Laufwerken kommt es hier im ersten Monat häufig zu Fehlalarmen.
  • Start/Stop Count
    • Anzahl der Start/Stop-Vorgänge eines Laufwerkes (auch Standby).
    • Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
    • Startet mit hohem Wert und wird reduziert, bis MTBF erreicht.
  • Reallocated Sectors Count
    • Anzahl der verbrauchten Reserve-Sektoren.
    • Deutet auf Oberflächenprobleme hin, da nur dann automatisch ein Reservesektor einen normalen ersetzt.
    • Startet mit hohem Wert und wird auf 1 reduziert, wenn Reservesektorzone erschöpft.
  • Power On Hours Count
    • Laufleistung in Stunden oder Sekunden.
    • Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
    • Startet mit hohem Wert und wird auf 1 reduziert, wenn MTBF abgelaufen.
    • Fujitsu-Laufwerke der Serien Picobird 10 (MPA) bis 16 (MPG) nutzen einen Sekundenzähler, der schon bei 999.999s (277h) überläuft.
  • Drive Temperature
    • Temperatur des Laufwerkes in °C.
    • Da auch Maximal- und Minimalwert gespeichert werden, ist eine Unterkühlung/Überhitzung erkennbar.
    • Startet mit hohem Wert und wird auf 0 reduziert, wenn Grenzen während Betrieb überschritten.
    • Manche Hersteller verwenden ungenaue oder Hotspot-ferne Sensoren.

Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive. Vollständige Listen finden sich im Literatur-Abschnitt der Weblinks.


  • Generelle Software
    • [ en / Windows / Freeware ] HDD Health
    • [ de / Windows / Freeware oder ab $29 ] HDD Life
    • [ de / Windows / Freeware ] HD Tune
    • [ en / Windows / Demo oder ab $24,95 ] ActiveSmart ATA / SCSI
    • [ en / Windows / Demo oder ab $14,95 ] SiGuardian
    • [ de / Windows / Freeware oder ab $29 ] Everest
    • [ en / Windows / Freeware ] SpeedFan
    • [ en / Windows, MacOS, Linux, FreeBSD, NetBSD, OpenBSD, Solaris, Darwin, OS/2 / Open Source ] Smartmontools
    • [ en / DOS / Freeware ] HDAT2