Tausch einer SSD plötzlich fehlerhaft

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • Tausch einer SSD plötzlich fehlerhaft

      Hi zusammen,
      ich hatte in meiner 920UHD eine 970QVO mit 4TB. Da diese maximal zu 1/4 ausgelastet.

      Nachdem ich mir das eine Weile lang angeschaut habe, entschied ich mich dazu hier diese durch eine 2TB zu ersetzen. Habe eine bei Kleinanzeigen geholt und am PC erstmal mit Samsung Magician alles getestet. Keine Fehler soweit und Zustand bei 98%

      Beim Wechsel bin ich nach der FAQ hier im Forum gefolgt. Beim Initialisieren gab es schon einen Fehler welchen ich aber leider nicht abfotografiert hatte.
      Nach 2 oder 3 Versuchen ging es aber dann. Komischerweise konnte ich nur ca. 500GB an Daten von der alten auf die neue kopieren. Wenn ich per WinSCP einen Ordner oder eine Datei erstellen möchte, dann kommt immer die Fehlermeldung, dass die Berechtigung nicht ausreicht oder das Laufwerk im ReadOnly Modus sei.
      Ebenso habe sporadisch dann das Problem, dass eine Aufnahme direkt mit der Dream nicht mehr möglich ist. Auch löschen bestehender Aufnahmen ist nicht möglich.

      Hat jemand von euch einen Tip wie ich das ganze in der Box testen kann und wie man hier am besten vor geht?

      Würde mich sehr freuen das wieder richtig zum laufen zu bekommen.
    • wie sehen die S.M.A.R.T. Wert der SSD aus?

      Ich gehe mal davon aus, dass die Platte den Gerätenamen /dev/sda zugewiesen hat - sonst ändern

      smartctl -a /dev/sda


      Die Partitionstabelle und Dateisystem wären auch hilfreich

      parted -s /dev/sda unit s print
      lsblk -f /dev/sda
      Gruß Fred

      Die Dreambox ist tot, es lebe die Dreambox

      ¯\_(ツ)_/¯

      Quellcode

      1. root@dm920:~$ mount | grep "/ "
      2. /dev/mmcblk1p1 on / type ext4 (rw,relatime,data=ordered)
      3. root@dm920:~$
    • Hey und Danke für deine schnelle Rückmeldung.

      Anbei die Ausgabe von smartctl
      Spoiler anzeigen
      root@dm920:~$ smartctl -a /dev/sda
      smartctl 6.4 2015-06-04 r4109 [armv7l-linux-3.14-1.17-dm920] (local build)
      Copyright (C) 2002-15, Bruce Allen, Christian Franke, smartmontools.org

      === START OF INFORMATION SECTION ===
      Device Model: Samsung SSD 870 QVO 2TB
      Serial Number: S5SUNG0N800896X
      LU WWN Device Id: 5 002538 f70802203
      Firmware Version: SVQ02B6Q
      User Capacity: 2.000.398.934.016 bytes [2,00 TB]
      Sector Size: 512 bytes logical/physical
      Rotation Rate: Solid State Device
      Form Factor: 2.5 inches
      Device is: Not in smartctl database [for details use: -P showall]
      ATA Version is: Unknown(0x09fc), ACS-4 T13/BSR INCITS 529 revision 5
      SATA Version is: SATA >3.2 (0x1ff), 6.0 Gb/s (current: 6.0 Gb/s)
      Local Time is: Wed Dec 27 20:53:52 2023 CET
      SMART support is: Available - device has SMART capability.
      SMART support is: Enabled

      === START OF READ SMART DATA SECTION ===
      SMART overall-health self-assessment test result: PASSED

      General SMART Values:
      Offline data collection status: (0x00) Offline data collection activity
      was never started.
      Auto Offline Data Collection: Disabled.
      Self-test execution status: ( 0) The previous self-test routine completed
      without error or no self-test has ever
      been run.
      Total time to complete Offline
      data collection: ( 0) seconds.
      Offline data collection
      capabilities: (0x53) SMART execute Offline immediate.
      Auto Offline data collection on/off supp ort.
      Suspend Offline collection upon new
      command.
      No Offline surface scan supported.
      Self-test supported.
      No Conveyance Self-test supported.
      Selective Self-test supported.
      SMART capabilities: (0x0003) Saves SMART data before entering
      power-saving mode.
      Supports SMART auto save timer.
      Error logging capability: (0x01) Error logging supported.
      General Purpose Logging supported.
      Short self-test routine
      recommended polling time: ( 2) minutes.
      Extended self-test routine
      recommended polling time: ( 160) minutes.
      SCT capabilities: (0x003d) SCT Status supported.
      SCT Error Recovery Control supported.
      SCT Feature Control supported.
      SCT Data Table supported.

      SMART Attributes Data Structure revision number: 1
      Vendor Specific SMART Attributes with Thresholds:
      ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_ FAILED RAW_VALUE
      5 Reallocated_Sector_Ct 0x0033 099 099 010 Pre-fail Always - 12
      9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 7035
      12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 2919
      177 Wear_Leveling_Count 0x0013 097 097 000 Pre-fail Always - 22
      179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
      181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
      182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
      183 Runtime_Bad_Block 0x0013 099 099 010 Pre-fail Always - 12
      187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
      190 Airflow_Temperature_Cel 0x0032 062 038 000 Old_age Always - 38
      195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
      199 UDMA_CRC_Error_Count 0x003e 096 096 000 Old_age Always - 3301
      235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 63
      241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 67214052588

      SMART Error Log Version: 1
      No Errors Logged

      SMART Self-test log structure revision number 1
      No self-tests have been logged. [To run self-tests, use: smartctl -t]

      SMART Selective self-test log data structure revision number 1
      SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
      1 0 0 Not_testing
      2 0 0 Not_testing
      3 0 0 Not_testing
      4 0 0 Not_testing
      5 0 0 Not_testing
      256 0 65535 Read_scanning was never started
      Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
      If Selective self-test is pending on power-up, resume after 0 minute delay.


      Ausgabe Parted:
      Spoiler anzeigen
      root@dm920:~$ parted -s /dev/sda unit s print
      Model: ATA Samsung SSD 870 (scsi)
      Disk /dev/sda: 3907029168s
      Sector size (logical/physical): 512B/512B
      Partition Table: gpt
      Disk Flags:

      Number Start End Size File system Name Flags
      1 2048s 3904932015s 3904929968s ext4 dreambox-storage
      2 3904932016s 3907027215s 2095200s linux-swap(v1) dreambox-swap


      Ausgabe lsblk:
      Spoiler anzeigen
      root@dm920:~$ lsblk -f /dev/sda
      NAME FSTYPE LABEL UUID MOUNTPOINT
      sda
      ├─sda1 ext4 dreambox-storage d258fad3-294b-4b10-a966-8aa853986c46 /media/hdd
      └─sda2 swap 3511eaf7-e767-470d-b0ea-8326f0325e14

    • ok, das sieht schon mal gut aus. Ich tippe auf ein korruptes ext4 Dateisystem

      was ich vergessen habe, wird die SSD nur noch read only gemountet?

      mount|grep /media/hdd

      Hast du auch schon eine Dateisystemprüfung gemacht?
      Gruß Fred

      Die Dreambox ist tot, es lebe die Dreambox

      ¯\_(ツ)_/¯

      Quellcode

      1. root@dm920:~$ mount | grep "/ "
      2. /dev/mmcblk1p1 on / type ext4 (rw,relatime,data=ordered)
      3. root@dm920:~$
    • Das ist die Ausgabe von dem Befehl:
      Spoiler anzeigen
      root@dm920:~$ mount|grep /media/hdd
      /dev/sda1 on /media/hdd type ext4 (rw,relatime,data=ordered)


      Nein grundsätzlich ist die Aufnahme und das Kopieren möglich.. das Read only passiert sporadisch und hebt sich wieder auf wenn ich einen reboot durchführe.

      Kann ich diese Prüfung direkt in der Konsole durchführen?
      Von mir aus kann ich auch nochmal alles platt machen und nochmals neu initialisieren.
    • Die Prüfung ist im Terminal oder über die GUI möglich

      Menü - Einstellungen - Geräte - Speichergeräte - SSD auswählen - OK - /dev/sda1 auswählen - mit GRÜN (Test) kann man die Dateisystemprüfung starten


      Was ich gestern in der S.M.A.R.T. Werten übersehen hatte

      Quellcode

      1. 199 UDMA_CRC_Error_Count 0x003e 096 096 000 Old_age Always - 3301


      Der UDMA_CRC_Error_Count sollte im besten Fall 0 sein - der Wert 3301 ist sehr hoch. Wenn dieser Wert hoch geht, deutet das in den meisten Fällen auf Fehler bei der Verbindung hin (loses, defektes SATA Kabel etc.)

      Das würde auch erklären warum die SSD random read only gemountet wird. Die SSD verliert kurz die Verbindung und das ext4 Datesystem wird dann ro re- bzw. gemounted.

      Da die SSD gebraucht gekauft wurde, weiß man nicht ob die Fehler beim Vorbesitzer oder in der dm920 aufgetreten sind. Die Fehlerbeschreibung deutet darauf hin, dass es zumindest auch in der dm920 auftritt.

      Als erstes kanns man prüfen, ob der UDMA_CRC_Error_Count Wert weiter hoch geht. Am einfachsten indem man in diesem Fall nach der S.M.A.R.T. ID 199 filtert

      smartctl -a /dev/sda | grep ^199

      Vermutlich wird dieser Wert hoch gehen. Man kann dann auch im journal nach Fehlern suchen, wenn das passiert

      etwa so:

      journalctl -x | grep -i ata
      journalctl -x | grep -i ata | grep -i error
      journalctl -x | grep sda



      Wenn das in der dm920 auftritt, könnte es an der dm920 liegen oder auch die 870 QVO könnte ein Eck weg haben.

      Ich würde dann in dieser Reihenfolge vorgehen und dazwischen testen.

      1. prüfen ob die SSD korrekt im Schlitten sitzt bzw. mit dem SATA Anschluss verbunden ist
      2. eine andere SSD oder Festplatte verbauen und prüfen ob die CRC Fehler auch damit auftreten. Falls nicht, wird es eher an der QVO liegen
      3. das Gehäuse (stromlos!) öffnen, die Frontklappe etwas nach vorne klappen und den gesamten HDD Schlitten ausbauen bzw. prüfen, ob der SATA Controller korrekt mit dem Mainboard verbunden ist. Eventuell den Festplattenschlitten vorsichtig herausheben, damit der SATA Controller vom Mainborad getrennt wird. Dann wieder anstecken, eventuell mehrmals, damit die Kontakte wieder blank gescheuert werden.



      Alternativ könnte man die SSD auch über USB3.0 extern in einem 2,5" oder 3,5" USB Festplattengehäuse oder mit einem USB3.0/SATA Adapter verbinden. Wenn die SSD dann auch immer wieder read only geht, ist der Fehler eher bei der SSD zu suchen als bei der SATA Verbindung der dm920
      Gruß Fred

      Die Dreambox ist tot, es lebe die Dreambox

      ¯\_(ツ)_/¯

      Quellcode

      1. root@dm920:~$ mount | grep "/ "
      2. /dev/mmcblk1p1 on / type ext4 (rw,relatime,data=ordered)
      3. root@dm920:~$

      Dieser Beitrag wurde bereits 5 mal editiert, zuletzt von Fred Bogus Trumper ()

    • Beobachte einfach den S.M.A.R.T. Wert 199 UDMA_CRC_Error_Count

      Wenn dieser bei 3301 bzw. dem aktuellen Wert stehen bleibt ist das ein gutes Zeichen. Wenn der Wert weiter hoch geht, ist das Problem noch nicht behoben

      Der Wert 12 Power_Cycle_Count ist auch interesant. lt. Post #3 liegt der bei 2919. D.h. die SSD wurde 2919x mal aus und eingeschaltet. Das ist bei 7035 Betriebstunden (9 Power_On_Hours) ein sehr hoher Wert. Das bedeutet, dass die SSD im Schnitt alle 2,4 Stunden aus/eingeschaltet wurde. Das deutet dann auch eher darauf hin, dass die SSD im Betrieb stromlos wird - also auch auf ein Verbindungsproblem schließen lässt.

      Und da die Werte UDMA_CRC_Error_Count und Power_Cycle_Count sehr nahe beieinander liegen könnte man ableiten, dass die SSD nur 382x "sauber" ausgeschaltet wurde.


      Also einfach diese 3 Werte im Auge behalten bzw. in Relation bringen
      Gruß Fred

      Die Dreambox ist tot, es lebe die Dreambox

      ¯\_(ツ)_/¯

      Quellcode

      1. root@dm920:~$ mount | grep "/ "
      2. /dev/mmcblk1p1 on / type ext4 (rw,relatime,data=ordered)
      3. root@dm920:~$

      Dieser Beitrag wurde bereits 5 mal editiert, zuletzt von Fred Bogus Trumper ()