Absturz dann höherer Energieverbrauch und Temperaturen ohne auffällige Prozesse im Hintergrund

  • Hallo, ja endlich ist es mir auch passiert ich hatte bei der Snapshot Erstellung einer virtuellen Maschine einen Totalabsturz meiner DXP 480T Plus das hat sich geäußert wie folgt: der Snapshot hat ewig lang gedauert bis 99 % und dann hat sich nichts mehr bewegt, normalerweise passiert das in Sekunden ca 5 Sekunden , diesmal hat das ewig lange gedauert vielleicht 3 - 4 Minuten und ist dann bei 99 hängen geblieben, dann wollte ich die Maschine einfach neu starten....

    Da ist irgendwas passiert keine Ahnung was, die DXP war nicht mehr erreichbar und hat nur noch geblinkt dann habe ich halt einfach physisch eingegriffen und den Strom getrennt, Stecker wieder rein hochgefahren alles normal gepiepst sofort erreichbar, jetzt habe ich das Problem dass die Maschine 6 W im Idle mehr benötigt und allerdings natürlich dann auch fast 20° höhere Temperaturen seit Stunden auf meinen SSDs rumlungern... mit den schönen 35° ist es jetzt wohl vorbei, was kann das sein was erfordert plötzlich höheren Stromverbrauch?

    Laufen nach dem Absturz noch bestimmte Protokolle die bei Prozessen nicht angezeigt werden? Wenn ja müssten die doch schon lange abgearbeitet sein, ich habe seit Stunden die hohen Temperaturen und den erhöhten Stromverbrauch im Idle auch ein Neustart der Maschine bringt keine Abhilfe, bei Prozessen ist nichts auffälliges zu sehen WTF ?


    This image is exclusive to our members!
    Please log in or register for free to view graphics and attachments.


    Kanecaine jetzt bin ich bei dir in deinen Temperaturregionen angekommen, unerklärlich was das plötzlich sein soll ? kein Dienst kein Prozess erklärt das aktuell

    exakt seit dem Absturz höre ich auch die Lüfter....

    DXP480T Plus, 2x32 GB Crucial DDR5 5600MHz, 4x4 Lexar® NM790 M.2 2280 PCIe Gen 4x4 TB NVMe

  • Logge Dich doch mal im Terminal als sudo ein und rufe htop auf, vielleicht siehst Du da etwas, woran es liegen könnte aber über die GUI nicht zu sehen möglich ist.

    Auf der Komandozeile einfach htop und enter eingeben.

    Meine Hardware

    iDX6011 Pro in Späh ^^

    DXP4800+ 2x8TB WDRedPl Btrfs Raid1 2x 2TB Lexar NM790 Raid1, 64GB RAM Kingst. KVR48S40BD8-32 DDR5/4800MH

    DXP2800 1x 12TB Seag. 1x 12TB WDRedPl, Raid1 Btrfs 16GB RAM Cruc. CT16G56C46S5.C8B2, 2x NVME Samsg,

    DS1525+ 2x8TB WD, Btrfs SHR, 2x 2TB NVME Lexar NM790 Raid1. 40GB ECC RAM_Speicher.de

    DS920+ DSM 7.3.2 Btrfs Raid1 2x8TB WD, 2x2TB Samsg. 970 EVOPlus, RAM 20GB DDR4-2666MHZ Speicher.de

    USV US3000, EatonEllip.PRO 850DIN, Switch Zyxel GS1200-8 1GB, Zyxel XMG-108 8 x 2,5GB

  • Ich hab mehrere Schritte unternommen

    1. iotop und lsof (→ wer schreibt/liest auf Disk?)

      → Keine auffällige dauerhafte Last

    2. smartctl auf allen SSDs

      → Temperaturen teilweise > 60 °C trotz Inaktivität

    3. ps aux | grep libvirt|qemu → Anzeige von libvirt & VMs

      → libvirt lief, aber keine VM aktiv → verdacht auf internen Deadlock

    4. systemctl status & Restart von libvirtd

      → kein nachhaltiger Effekt

    Der Snapshot-Vorgang war nicht korrekt abgeschlossen und hat vermutlich einen Zombie-Lock oder einen hängenden Libvirt-Thread hinterlassen

    Besonders verdächtig war: "cannot acquire state change lock (held by monitor=remoteDispatchDomainSnapshotCreateXML"

    libvirt blockierte also intern weiter Ressourcen auch nach einem Verdammten Neustart....

    dann manuell einzelne Systemstops ausgelöst:

    sudo systemctl stop cloud_serv
    sudo systemctl stop storage_serv
    sudo systemctl stop kvm_serv
    usw

    dann reboot

    Und das war der Trick ich hab ja vorher schon immer Reboot gemacht trotzdem waren die Temperaturen immer wieder erhöht der Prozess ist also immer wieder mitgestartet wenn man ihm nicht von Hand schlafenlegt, also hab ich kurzerhand alle vorher schlafen gelegt und dann Reboot und siehe da sofort nach dem hochfahren:

    Temperaturergebnisse nach vollständiger Stabilisierung:

    • nvme0n1: 35 °C Slot1
    • nvme1n1: 35 °C Slot2
    • nvme2n1: 34 °C Slot4
    • nvme4n1: 35 °C Slot3

    Fazit: Finger weg bei einem Snapshot von einer laufenden V Maschine, hat eigentlich immer gut funktioniert naja musste ja mal soweit kommen.....

    DXP480T Plus, 2x32 GB Crucial DDR5 5600MHz, 4x4 Lexar® NM790 M.2 2280 PCIe Gen 4x4 TB NVMe

Participate now!

Join our community with over 10,000 members!

Register yourself now for free to get full access to all content, graphics, downloads and other exclusive features!