NVMe immer mal wieder verschwunden

  • Hallo in die Runde,

    leider habe ich im Forum nichts zu meinem Problem gefunden, aber eventuell kennt sich ja hier jemand besser damit aus.

    Ich habe mir vor kurzem eine 2800er zugelegt und dafür meine aktuell existierenden Laufwerke eingebaut.

    Das Setup ist folgendes:

    Speicherpool 1: M2SSD (1TB WD Black SN 750) - mit Docker inkl Apps
    Speicherpool 2: 8 TB WD Red - Mediadaten
    Speicherpool 3: 4 TB WD Red - soll tendenziell bestimmte Teile aus Speicherpool 2 backuppen

    In unregelmäßigen Abständen wird der Speicherpool 1 nicht erkannt. Nach einem Neustart ist alles wieder zurück. So richtig vertrauenserweckend ist das Ganze jetzt aber nicht. Bleibt mir hier nur der Neukauf einer neuen SSD aus der UGreen-Hardware-Liste übrig? Das wollte ich aufgrund der aktuellen Preislage eigentlich erstmal auf später verschieben.

    Um das Ganze ausfallsicher zu gestalten, wollte ich eh bald eine zweite M2 dazuholen, aber auch wenn ich zukünftig eine offiziell unterstützte Platte als Haupt-SSD verwende, wird mir die alte Platte als Raid1-Backup auch nicht soviel bringen oder?

    Kennt jemand das Problem und hat ggfs. alternative Lösungen?

    Bild1: Fehlermeldung
    Bild2: Nach einem Neustart

    Vielen Dank im Voraus.

  • Ich würde erst einmal die SSD entfernen und wieder einbauen. Dabei penibel auf den korrekten Sitz achten und ob auch die Kontakte i.O und sauber sind.

    Ich habe die SSD entfernt und wieder eingebaut. Kontakte könnte ich das nächste mal reinigen. Aktuell probiere ich sie in dem zweiten SSD-Platz aus, funktioniert auch erstmal. Ich befürchte aber, nicht sehr lange.

  • Ein sudo dmesg | grep -i nvme könnte dir was erzählen.

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • Ich hatte das mit einer Patriot NVMe, die ist alle paar Tage "weg" gewesen. Ggf mach Firmware-Updates für die NVMe schauen oder gegen eine andere "supported" ersetzen. Habe ich dann auch gemacht, weil die nicht im Ugreen wollte :/

    Es dankt

    DerFalk

  • Ein sudo dmesg | grep -i nvme könnte dir was erzählen.

    [ 1.110234] nvme 0000:01:00.0: platform quirk: setting simple suspend
    [ 1.110308] nvme nvme0: pci function 0000:01:00.0
    [ 1.123887] nvme nvme0: nvme active quirks: 0x420
    [ 1.127892] nvme nvme0: 4/0/0 default/read/poll queues
    [ 1.131656] nvme0n1: p1 p2
    [ 26.856314] block nvme0n1: No UUID available providing old NGUID
    [ 27.042111] nvme nvme0: using unchecked data buffer
    [ 27.054494] nvme0n1: p1 p2

    Gesamteinschätzung nach ChatGTP:

    Alles normal. Keine Fehler. Keine Warnungen.

    ✔️ NVMe korrekt erkannt
    ✔️ Partitionen sauber vorhanden
    ✔️ Keine I/O-Fehler
    ✔️ Keine SMART- oder Controller-Probleme

    Ich hatte das mit einer Patriot NVMe, die ist alle paar Tage "weg" gewesen. Ggf mach Firmware-Updates für die NVMe schauen oder gegen eine andere "supported" ersetzen. Habe ich dann auch gemacht, weil die nicht im Ugreen wollte :/

    Danke für deinen Input. Ich befürchte, ich werde auf eine unterstützte wechseln müssen, auch wenn die Preise aktuell hart sind. Mir ist das alles zu heiß. Ich habe zwei Samsung EVO 990 Plus im Sinn, um diese als Raid1 benutzen. Ist es denn möglich, meine alte M2 Platte die vorher als Basic Raid betrieben wurde, extern auf die neue M2 zu spiegeln (damit es keine wiederholten Aussetzer über die Ugreen gibt) und diese danach im Raid1 Verbund mit einer zweiten M2 zu betreiben? Oder müssen die beiden neuen Platten direkt frisch als Raid1 eingerichtet werden.

  • meine alte M2 Platte die vorher als Basic Raid betrieben wurde, extern auf die neue M2 zu spiegeln

    Ein Clone sollte funktionieren. Versuch macht klug.

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • . Ist es denn möglich, meine alte M2 Platte die vorher als Basic Raid betrieben wurde, extern auf die neue M2 zu spiegeln (damit es keine wiederholten Aussetzer über die Ugreen gibt) und diese danach im Raid1 Verbund mit einer zweiten M2 zu betreiben?

    Ich denke , nachdem Du eh bisher nur eine NVME genutzt hast ist der Weg über eine Raid Erweiterung das einfachste.

    Stecke die 1. neue NVME dazu und mach aus dem Raid 0 ein Raid 1, im Anschluß tausche die alte NVME gegen eine neue und Repariere das Raid 1. Das sollte es dann gewesen sein. Das dürfte aufgrund der NVMEs und der geringen Datenmenge recht schnell durch sein.

    Meine Hardware

    iDX6011 Pro in Späh ^^

    DXP4800+ 2x8TB WDRedPl Btrfs Raid1 2x 2TB Lexar NM790 Raid1, 64GB RAM Kingst. KVR48S40BD8-32 DDR5/4800MH

    DXP2800 1x 12TB Seag. 1x 12TB WDRedPl, Raid1 Btrfs 16GB RAM Cruc. CT16G56C46S5.C8B2, 2x NVME Samsg,

    DS1525+ 2x8TB WD, Btrfs SHR, 2x 2TB NVME Lexar NM790 Raid1. 40GB ECC RAM_Speicher.de

    DS920+ DSM 7.3.2 Btrfs Raid1 2x8TB WD, 2x2TB Samsg. 970 EVOPlus, RAM 20GB DDR4-2666MHZ Speicher.de

    USV US3000, EatonEllip.PRO 850DIN, Switch Zyxel GS1200-8 1GB, Zyxel XMG-108 8 x 2,5GB

  • Stecke die 1. neue NVME dazu und mach aus dem Raid 0 ein Raid 1

    ... und hoffe, dass sie dabei nicht wieder aussteigt.

    Ich hätte mir wohl auch erst mit einer anderen extern einen Clone gemacht.

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • Bei einem Clone wird aber auch nur die selbe Partitionsgröße wie auf der bisherigen SSD vorhanden war erstellt.

    Das erfordert dann im Nachgang auf jedenfall eine Erweiterung der Partition über die Komandozeile. (Tools kenne ich hierzu keine, und die genauen Eingaben auf der Konsole weiß ich leider auch nicht genau.)

    Meine Hardware

    iDX6011 Pro in Späh ^^

    DXP4800+ 2x8TB WDRedPl Btrfs Raid1 2x 2TB Lexar NM790 Raid1, 64GB RAM Kingst. KVR48S40BD8-32 DDR5/4800MH

    DXP2800 1x 12TB Seag. 1x 12TB WDRedPl, Raid1 Btrfs 16GB RAM Cruc. CT16G56C46S5.C8B2, 2x NVME Samsg,

    DS1525+ 2x8TB WD, Btrfs SHR, 2x 2TB NVME Lexar NM790 Raid1. 40GB ECC RAM_Speicher.de

    DS920+ DSM 7.3.2 Btrfs Raid1 2x8TB WD, 2x2TB Samsg. 970 EVOPlus, RAM 20GB DDR4-2666MHZ Speicher.de

    USV US3000, EatonEllip.PRO 850DIN, Switch Zyxel GS1200-8 1GB, Zyxel XMG-108 8 x 2,5GB

  • Bei einem Clone wird aber auch nur die selbe Partitionsgröße wie auf der bisherigen SSD vorhanden war erstellt.

    Clonezilla bietet beim Clonen die Möglichkeit, die Partitionsgröße proportional anzupassen. Also kein Akt.

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • Mal ein kurzes Update. Sah erst ganz alles ganz gut aus, jetzt gibt es aber wieder Probleme.

    Ich habe meinen Speicherpool1, wie empfohlen, mit einer offiziell unterstützten NVME (Samsung 990 Pro 1 TB mit aktueller Firmware) auf Raid1 erweitert. Das klappte auch problemlos und ohne Fehler. Die alte NVME (1TB WD Black SN 750) lief im zweiten Slot noch einen Tag mit und stieg dann wieder raus, so das das Volumen in den "Degraded Mode" ging. Mit der Samsung funktionierte aber alles weiter. Ich habe mir daher noch eine weitere Samsung 990 Pro 1 TB bestellt, um das Volumen dann zu reparieren und mit zwei baugleichen unterstützen SSDs den Raid1 zu betreiben.

    Jetzt gibt es aber wieder eine neue Fehlermeldung (siehe Anhänge), obwohl die Platte noch erkannt wird. Der Speicherpool ist beschädigt, obwohl die Platte beim Testen keine Fehler aufweist. Wo liegt jetzt das Problem mit dem Speicherpool? Habe ich sie zu lange im Degraded Mode betrieben? Ist das noch "normales" Verhalten, durch die nicht unterstützte SSD oder ist eher etwas an den NVME-Slots der NAS etwas defekt?

  • Etwas wirr ...

    Ich habe meinen Speicherpool1, wie empfohlen, mit einer offiziell unterstützten NVME (Samsung 990 Pro 1 TB mit aktueller Firmware) auf Raid1 erweitert. Das klappte auch problemlos und ohne Fehler.

    Die Erweiterung von Basic auf RAID1 war also ohne Fehler fertig. Richtig?

    Ich habe mir daher noch eine weitere Samsung 990 Pro 1 TB bestellt, um das Volumen dann zu reparieren und mit zwei baugleichen unterstützen SSDs den Raid1 zu betreiben.

    Wurde es repariert, ist da die Frage.

    Jetzt gibt es aber wieder eine neue Fehlermeldung (siehe Anhänge), obwohl die Platte noch erkannt wird.

    Siehe Frage vorher. Wurde die Reparatur abgeschlossen? Repariert das System das RAID, wie es in der Fehlermeldung verkündet?


    Mickernde Platte 1 + neue = RAID1. ohne Fehler? ja/nein

    Mickernde Platte raus > ganz neue rein = rebuild des RAID1. Der war fertig? ja/nein

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • alter Mann danke für das Lesen und Antworten.

    Ok ich versuche es nochmal etwas klarer:

    - WD Black (im Speicherpool 1 im Basic Raid) fiel immer wieder aus, egal ob in Steckplatz 1 oder 2 plaziert und musste jeweils aus- und wieder eingesteckt werden, um zu funktionieren
    - 990 Pro gekauft und eingebaut, Speicherpool 1 auf Raid1 erweitert, kopieren (im Raid heisst es ja "reparieren", da ja keine Daten auf der neuen Platte waren) lief ohne Probleme durch, keine Fehler
    - die WD Black fiel wieder aus, Speicherpool im Modus "degradiert", funktionierte aber bis gestern
    - heute ist der Speicherpool beschädigt, obwohl die Platte weiterhin erkannt wird
    - "Mickernde Platte raus > ganz neue rein = rebuild des RAID1. Der war fertig? ja/nein" fand noch nicht statt, da die neue Platte noch nicht hier ist.

    neuer Stand: Nach einem Neustart wird die 990 Pro wieder erkannt, der Speicherpool hat wieder den Status "degradiert", weil der Raid1 ja aktuell nur aus einer Platte besteht. Mein aktueller Plan wäre jetzt, auf die neue zu warten und dann mit der ganz neuen Raid1 neu bilden. Ich verstehe nur nicht, wieso die 990 Pro heute physisch erkannt wurde, aber der Speicherpool den Fehler hatte.

  • wieso die 990 Pro heute physisch erkannt wurde, aber der Speicherpool den Fehler hatte.

    Weil die andere eine Macke hat? Ich hätte die ja gezogen, nachdem das Rebuild durch war. Warum? Damit die keinen Mist auf die neue schreibt.

    Meine Hardware


    • DXP6800PRO | 2 x CT16G48C40S5.M8A1 16 GB 4800 MHz | 3 x Seagate ST12000VN0008-2YS101 12TB | 3 x Samsung SSD 870 EVO 1TB | 4 x Samsung SSD 990 PRO 2TB

  • neuer Stand: Nach einem Neustart wird die 990 Pro wieder erkannt, der Speicherpool hat wieder den Status "degradiert", weil der Raid1 ja aktuell nur aus einer Platte besteht. Mein aktueller Plan wäre jetzt, auf die neue zu warten und dann mit der ganz neuen Raid1 neu bilden. Ich verstehe nur nicht, wieso die 990 Pro heute physisch erkannt wurde, aber der Speicherpool den Fehler hatte.

    Das ist exakt das Fehlerbild, welches durch eine fehlerhafte Firmware der Samsung 990 Pro verursacht wird. Firmware-Update machen und das Problem ist weg.

    Kanecaine
    July 12, 2025 at 12:14 PM

    -------
    DXP480T Plus, 2x32 GB Crucial DDR5 4800MHz, 4x4 TB Samsung 990 PRO NVMe,CyberPower USV OR650ERM1U mit RMCARD400

Participate now!

Join our community with over 10,000 members!

Register yourself now for free to get full access to all content, graphics, downloads and other exclusive features!