• Skip to main content

veight.de

  • Digital

whea uncorrectable error: Ursachen, Diagnose und Lösungen unter Windows 10/11

Der Bluescreen mit dem Stopcode WHEA_UNCORRECTABLE_ERROR (0x00000124) signalisiert fast immer einen echten Hardwarefehler oder eine harte Instabilität im Hardwarenahen Bereich. Dahinter steckt die Windows Hardware Error Architecture (WHEA), die Fehler aus CPU, Speicher, PCIe, Firmware und weiteren Quellen standardisiert erfasst, protokolliert und – wenn möglich – abfängt. Wenn dieser Stopp auftritt, hat Windows einen nicht korrigierbaren Fehler erkannt und den Betrieb aus Selbstschutz gestoppt. In diesem Artikel zeige ich dir präzise, wie die Architektur funktioniert, welche Ursachen realistisch sind, wie du strukturiert diagnostizierst und dein System sauber stabilisierst.

Was im System passiert: WHEA in Kurzform

WHEA sammelt Hardwarefehlerinformationen in standardisierten Error Records (CPER – Common Platform Error Record). Jede Fehlerquelle – von der CPU‑Machine‑Check‑Logik über Speichercontroller bis zu PCIe‑Geräten – liefert Details, die Windows im Ereignislog (WHEA‑Logger) und über ETW verfügbar macht. Korrigierbare Fehler landen „nur“ im Protokoll; unkorrigierbare Fehler führen zur Notbremse: WHEA_UNCORRECTABLE_ERROR.

Merke: WHEA ist keine Fehlermeldung eines einzelnen Treibers – es ist die Infrastruktur, mit der Windows Hardwarefehler entgegennimmt, auswertet und darauf reagiert. Der Bluescreen ist die Konsequenz, wenn die Integrität nicht mehr gewährleistet ist.

Typische WHEA-Fehlerquellen im Überblick

Fehlerquelle Beispiele Indikatoren im Log
CPU / Machine Check Cache‑Fehler, Bus‑/Interconnect‑Fehler, Überhitzung, Spannungsinstabilität WHEA-Logger 18/19; „Machine Check Exception“, „Cache Hierarchy Error“
Speicher / Controller Defekte RAM‑Zellen, instabile XMP/DOCP‑Profile, fehlerhafte Slots „Memory Hierarchy Error“, sporadische 0x124 und weitere Bugchecks
PCIe / Peripherie Instabile Grafikkarte, NVMe‑Fehler, Signalqualitätsprobleme „Bus/Interconnect Error“, Geräte‑PCIe‑Angaben im Record
Stromversorgung / VRM PSU‑Unterspannung, Ripple, Mainboard‑VRM‑Instabilität Crashs unter Last, Kernel‑Power 41 + WHEA‑Events
Firmware / BIOS Fehlerhafte Microcode‑Interaktion, unverträgliche Settings Fehler nach BIOS‑Update, Stabilität bei Defaults besser

Bugcheck 0x00000124: Bezug zu Machine Check Exceptions (MCE)

Viele 0x124‑Abstürze gehen auf Machine Check Exceptions zurück, die die CPU selbst auslöst, wenn interne oder plattformbezogene Zustände nicht mehr korrigierbar sind. Häufige Auslöser: Busfehler (CPU↔Mainboard), Cachefehler, Speicherpfadprobleme, Überhitzung, fehlerhafte I/O‑Controller oder instabile Spannungen.

Bugcheck-Parameter, die du kennen solltest

Parameter Bedeutung Praxishinweis
Parameter 1 0x0 deutet auf MCE (CPU) hin Gibt die Fehlerkategorie an; 0x0 ist klassisch CPU/MCE
Parameter 2 Pointer auf WHEA_ERROR_RECORD In WinDbg mit !errrec <Adresse> analysierbar
Parameter 3/4 Weitere Status-/Kontextwerte In Kombination mit Error Record interpretieren

Mit einem Minidump kannst du die WHEA‑Details auslesen:

windbg -z C:\Windows\Minidump\<dumpfile.dmp>
!analyze -v
!errrec <Adresse aus Parameter 2>

Der Error Record enthält u. a. CPU‑Bank, MCi_STATUS, Adressen und – bei PCIe‑Fehlern – Gerätekennungen. Für erfahrene Analysen ist das Gold wert.

whea uncorrectable error

Typische Ursachen – und was sie triggert

CPU-Probleme und Überhitzung

  • Übertemperatur: Verstaubte Kühler, ausgetrocknete Wärmeleitpaste, lockerer Kühler, zu aggressiver Boost. Symptome: Crashs unter Last, Thermal Throttling im Monitoring.
  • Spannungsinstabilität: Undervolting oder instabile VRM‑/PSU‑Versorgung. Symptome: WHEA beim Lastwechsel, sporadische Resets ohne BSOD.
  • Silicon-Lottery/Alterung: Grenzstabile CPUs, die bestimmte Frequenz‑/Spannungskombinationen nicht mehr tragen.

RAM, Speichercontroller und XMP/DOCP

  • Defekte Module / Slots: Fehler treten sporadisch auf, oft mit wechselnden Bugchecks, inklusive 0x124.
  • Instabile Profile: XMP/DOCP kann den Controller überfordern; JEDEC‑Defaults laufen stabiler.
  • Inkompatibilitäten: RAM‑Kits außerhalb der QVL des Boards; Mischbetrieb unterschiedlicher Kits.

Mainboard, Spannungsversorgung und Netzteil (PSU)

  • VRM‑Probleme: Überhitze oder schwache Spannungswandler → CPU‑/RAM‑Instabilität.
  • Signalqualität: PCIe‑Fehler durch schwache Slots, fehlerhafte Leiterbahnen, mangelhafte Lötstellen.
  • PSU‑Themen: Unterdimensionierung, starker Ripple, Alterung. Auffällig: Neustarts unter GPU/CPU‑Volllast.
Siehe auch  Amazon Fehlercode 3565 verstehen und beheben

Grafikkarte, Massenspeicher und Peripherie

  • GPU/VRAM: Überhitzte, übertaktete oder degradierte Karten → PCIe‑„Bus/Interconnect Errors“.
  • NVMe/SATA: Controller-Hänger, fehlerhafte Sektoren, Kontaktprobleme; korrelieren mit SMART‑Warnungen.
  • Sonstiges: WLAN/USB/Soundkarten mit fehlerhaften Treibern – selten, aber real.

Treiber, BIOS/UEFI und Software als indirekte Auslöser

  • Treiber: Inkompatible oder defekte Treiber können DMA‑/Register‑Fehlzustände erzeugen.
  • BIOS/UEFI: Bugs, veralteter Microcode, fehlerhafte Defaults nach Updates.
  • OC-/Tuning-Tools: Afterburner, „Performance Booster“, Undervolting‑Tools → instabile Betriebsfenster.

Überhitzung, Gehäuseklima, Umgebung

  • Gehäusefluss: Staub, blockierte Luftwege, defekte Lüfter.
  • Umgebung: Hohe Raumtemperaturen, Netzstörungen, ESD‑Schäden.

Diagnose-Workflow: Strukturiert statt Rätselraten

1) Schneller Erstcheck (10–20 Minuten)

  1. Änderungen notieren: Tritt es seit Treiber-/BIOS‑Update, neuer Hardware oder OC auf?
  2. Temperaturen prüfen: Mit HWInfo o. ä. CPU/GPU‑Temps sowie VRM/SSD (sofern auslesbar).
  3. Ereignisanzeige öffnen: Windows‑Logs → System → WHEA‑Logger (IDs 17/18/19) und Kernel‑Power 41.
  4. BIOS‑Defaults laden: OC, XMP/DOCP, manuelle Spannung/Multiplikator deaktivieren.
  5. Windows Update + Hersteller‑Treiber: Chipsatz, GPU, Storage, LAN/WLAN aktualisieren.

2) WHEA-Logger-Events lesen

Ereignis-ID Beschreibung Hinweis
17 WHEA Korrekturbedingter Fehler Frühwarnung – kann auf Degradation hindeuten
18 WHEA Nicht korrigierbarer Fehler Relevanter für 0x124; Details zur Quelle enthalten
19 WHEA Fehlerbericht (weiterführend) Kontextinfos (z. B. Typ: Cache/Bus/Memory)

Achte in den Eventdetails auf Formulierungen wie „Cache Hierarchy Error“, „Bus/Interconnect Error“ oder einen referenzierten PCIe‑Pfad – das gibt die Richtung vor (CPU/Board vs. GPU/NVMe).

3) Dumps analysieren (optional, aber stark)

Erzeuge Minidumps (Systemsteuerung → System → Erweitert → Starten und Wiederherstellen). In WinDbg:

!analyze -v
!errrec <Adresse aus Parameter 2 von 0x124>

Du siehst dann Quelle (z. B. „MCE“), Bank/Status und ggf. Adressen/Gerätekennungen. Das trennt saubere CPU‑Pfadprobleme von reinen PCIe‑Fehlern.

4) Systematische Hardwaretests

  • RAM: Windows‑Speicherdiagnose (erweitert) oder MemTest (mehrere Durchläufe).
    • Bei Fehlern: Einzeln testen, Slots wechseln, XMP/DOCP aus.
  • CPU: Intel Processor Diagnostic Tool bzw. Stresstests (mit Monitoring). Abbruch bei >90 °C.
  • Datenträger: chkdsk, Herstellerdiagnose, SMART prüfen.
  • GPU: Lasttest (z. B. 3DMark/OCCT) mit Temperatur‑ und Fehlerzähler‑Beobachtung.

5) Treiber-Stresstest (Driver Verifier)

Nur gezielt einsetzen; kann Bluescreens provozieren, um den verursachenden Treiber zu identifizieren.

  1. verifier.exe starten → „Benutzerdefinierte Einstellungen“ → Standardprüfungen
  2. Drittanbieter‑Treiber auswählen (kein Microsoft‑Core)
  3. Neustart und Verhalten beobachten; im Fehlerfall Treiber aktualisieren oder ersetzen

6) BIOS/UEFI: Zurück auf Null

  • Load Optimized Defaults: Alle OC‑, XMP‑, Boost‑ und Undervolting‑Einstellungen aus.
  • BIOS aktualisieren: Nur stabile Versionen; Release Notes lesen.
  • Fallback testen: Bei neuen Problemen nach Update ggf. Rollback auf bekannte stabile Version.

7) Minimal-Konfiguration

Baue temporär auf das Nötigste zurück:

  • 1 RAM‑Riegel im empfohlenen Slot
  • System‑SSD, onboard‑Grafik (falls vorhanden)
  • Keine Zusatzkarten/USB‑Geräte außer Tastatur/Maus

Läuft es stabil, schalte Komponenten nacheinander wieder zu, bis der Fehler reproduzierbar ist.

Symptome → Prüfschritte (Kompaktmatrix)

Symptom Wahrscheinliche Schiene Prüfen/Maßnahme
Crash nur bei CPU-Last CPU/VRM/PSU/Temperatur Temps, VRM‑Kühlung, PSU‑Tauschtest, BIOS‑Defaults
Crash nur bei Spielen GPU/PSU/PCIe GPU‑Treiber, Lasttest, PCIe‑Slot wechseln, PSU prüfen
Sporadische Fehler, wechselnde Bugchecks RAM/Storage MemTest, XMP aus, Slots/Kits tauschen; chkdsk/SMART
Nach BIOS-Update Instabilität BIOS/Settings Defaults, anderes BIOS, Microcode‑Hinweise beachten
Unerwartete Neustarts ohne BSOD PSU/Überhitzung Kernel‑Power 41, Temps, PSU‑Tauschtest
Siehe auch  pr_connect_reset_error: Lösungen für stabile Verbindungen

Praxislösungen und Best Practices

Grundlagen zuerst

  • Windows Update fahren: Inklusive optionaler Treiber, Microcode/Firmware‑Ergänzungen.
  • Hersteller‑Treiber installieren: Chipsatz, GPU, Storage, Netzwerk – nicht nur generische Treiber.
  • Systemdateien reparieren:
    sfc /scannow und
    DISM /Online /Cleanup-Image /RestoreHealth.
  • Datenträger prüfen:
    chkdsk C: /f (ggf. mit /r) und Hersteller-Tools.

Overclocking/Undervolting kompromisslos zurückdrehen

Setze CPU, RAM und GPU auf Hersteller‑Spezifikationen zurück. Deaktiviere XMP/DOCP, manuelle Multiplikatoren und Spannungsoffsets. Falls nötig, reduziere testweise CPU‑Boost‑Funktionen, um Temperatur‑/Spannungsspitzen zu entschärfen.

Reinigung, Kühlung, physische Kontrolle

  • Staub entfernen, Luftstrom optimieren: Front rein, hinten/oben raus; Kabel sauber verlegen.
  • Wärmeleitpaste erneuern, Kühler prüfen: Fester Sitz, gleichmäßiger Anpressdruck.
  • Kontaktprobleme ausschließen: RAM und Karten aus‑/einstecken; sichtbare Schäden (Kondensatoren) checken.

Treiber-Konflikte systematisch lösen

  • Driver Verifier gezielt anwenden; problematische Drittanbieter‑Treiber ersetzen.
  • Saubere Neuinstallation erwägen, wenn ein „Treibergrab“ vermutet wird (Altlasten nach Hardwarewechsel).

Minimal-Konfiguration und Tauschtests

  • PSU gegen bekannt gutes Modell testen: Häufige Ursache bei Last‑Crashes.
  • RAM‑Kit tauschen/wechseln: Auch bei „fehlerfreiem“ MemTest können Grenzfälle existieren.
  • GPU in anderem Slot/anderem System: PCIe‑/Kartenproblem einkreisen.

Datensicherheit nicht vergessen

Wichtig: Wiederholte WHEA‑Ereignisse erhöhen das Risiko stiller Datenkorruption. Sichere kritische Daten sofort, bevor du Stresstests fährst oder weiter analysierst.

Konservative Stabilität als Ziel

Du willst alltagsstabile, thermisch und elektrisch entspannte Settings. Aggressive Profile beeindrucken in Benchmarks, verursachen aber in realen Lastwechseln häufig Instabilitäten – genau hier entstehen viele WHEA‑Abstürze.

Maßnahmenübersicht nach Komponente

Komponente Sofortmaßnahme Vertiefung Tool/Beispiel
CPU Boost/OC aus, Temps prüfen VRM‑Kühlung, BIOS‑Update Intel PDT, HWInfo
RAM XMP/DOCP aus, Einzelt tests Slots/Kits tauschen, QVL prüfen MemTest, Windows‑Speicherdiagnose
GPU Treiber neu, OC aus Anderer Slot/anderes System 3DMark/OCCT
Storage chkdsk/SMART Hersteller‑Firmware/‑Diag, Kabel CrystalDiskInfo, Vendor‑Tools
PSU/Mainboard PSU‑Tauschtest VRM‑Temp, Sichtprüfung HWInfo, Thermals, Multimeter (Profi)

whea uncorrectable error

Prävention: So bleibt dein System stabil

  • Hochwertiges Netzteil mit Reserve; gute Effizienz und niedriger Ripple.
  • Solides Mainboard mit starker VRM‑Kühlung; RAM aus der QVL verwenden.
  • Moderate Einstellungen: Keine aggressiven OC‑/UV‑Profile für den Alltag.
  • Geplante BIOS‑Updates mit Blick in die Release Notes; vor Produktiveinsatz testen.
  • Wartung: Staub, Lüfter, Temperaturen, SMART‑Werte regelmäßig prüfen.
  • Monitoring & Logging: WHEA‑Events beobachten; gehäufte korrigierbare Fehler ernst nehmen.

Besondere Szenarien

Laptops

  • Treiber und BIOS direkt vom Hersteller beziehen.
  • Kühlung: Lüfter und Kühlkanäle reinigen; Notebook auf harter Oberfläche betreiben.
  • Limitierte Tauschoptionen: Bei anhaltenden WHEA‑Fehlern führt oft kein Weg am Herstellerservice vorbei.

Neue Builds

  • Erststart mit Minimal‑Konfiguration, BIOS‑Defaults, ohne XMP.
  • QVL‑Abgleich von RAM; korrekte Steckplätze nutzen.
  • Frühe RMA nutzen, wenn Instabilität sich nicht plausibel beheben lässt.

Ältere Systeme

  • PSU‑Alterung und Kondensatoren im Blick behalten.
  • Thermische Zyklen und Staub als schleichende Instabilitätsquellen.
  • Eher konservative Settings fahren; ggf. Hardwarerefresh statt Grenzbetrieb.

Fazit

Der WHEA_UNCORRECTABLE_ERROR ist kein „normaler“ Software‑Crash, sondern die klare Botschaft der Plattform: Hier liegt ein nicht korrigierbarer Hardwarefehler oder eine harte Instabilität vor. Mit WHEA stellt Windows eine robuste Architektur bereit, die Fehler aus CPU, Speicher, PCIe und Firmware in strukturierte Datensätze gießt – für dich heißt das: zielgerichtete Diagnose statt Versuch‑und‑Irrtum. In der Praxis führen konsequente Basismaßnahmen (Treiber, Updates, BIOS‑Defaults), saubere Kühlung und Stromversorgung, das Ausschalten von OC/UV sowie systematische Tests (RAM/CPU/Storage/GPU) am schnellsten zur Lösung. Wenn ein sauberer Software‑Stand und konservative BIOS‑Einstellungen keine Besserung bringen, bleibt der Weg über Minimal‑Konfiguration, Tauschtests und bei Bedarf RMA. Nimm WHEA‑Ereignisse ernst, sichere deine Daten frühzeitig und strebe auf Dauer konservative, thermisch wie elektrisch stabile Systemzustände an – so minimierst du das Risiko erneuter Abstürze und erhöhst die Lebensdauer deiner Hardware deutlich.

Siehe auch  ERR_CACHE_MISS effizient beheben und vermeiden

FAQ

Was bedeutet der whea uncorrectable error genau?

Es handelt sich um den Stopcode 0x00000124, der über die Windows Hardware Error Architecture (WHEA) signalisiert, dass ein nicht korrigierbarer Hardwarefehler aufgetreten ist. Häufig ist eine CPU‑Machine‑Check‑Exception, ein Speicherfehler, ein PCIe‑/Busproblem oder eine Spannungs-/Temperaturinstabilität die Ursache.

Ist das ein Treiber- oder ein Hardwarefehler?

Primär Hardware bzw. Hardwarenah. Treiber können aber indirekt Hardwarefehler triggern (z. B. durch fehlerhafte Registerzustände oder DMA), weshalb aktuelle und korrekte Hersteller‑Treiber essenziell sind.

Wie lese ich WHEA-Informationen in Windows aus?

In der Ereignisanzeige unter Windows‑Protokolle → System nach WHEA‑Logger (IDs 17/18/19) suchen. Für Tiefenanalyse: Minidump mit WinDbg öffnen, !errrec <Adresse> (Adresse ist Bugcheck‑Parameter 2) ausführen.

Kann ich den Fehler ignorieren, wenn der PC danach wieder startet?

Nein. Es besteht Risiko für Datenkorruption und Folgeschäden. Sichere Daten und beginne mit den beschriebenen Diagnose‑ und Stabilisierungsmaßnahmen.

Hilft es, XMP/DOCP zu deaktivieren?

Sehr oft ja. RAM‑Profile jenseits JEDEC können Controller und Spannungsversorgung an die Grenze bringen. Teste JEDEC‑Defaults, prüfe Slots und ggf. andere Kits.

Wie gefährlich ist Undervolting oder Overclocking in diesem Kontext?

Beides kann Stabilitätsfenster verengen. Overclocking erhöht Takt/Spannung/Hitze; Undervolting kann bei Lastwechseln zu Unterspannung führen. Für die Fehlersuche stets auf Default‑Werte zurückgehen.

Was, wenn die Abstürze nur beim Gaming auftreten?

Dann rücken GPU, PSU und PCIe in den Fokus. Setze GPU‑OC zurück, aktualisiere Treiber, teste mit anderem PSU/Slot, überwache Temperaturen und „Bus/Interconnect“‑Hinweise im WHEA‑Log.

Welche Rolle spielt das Netzteil (PSU)?

Eine große. Unterdimensionierung, hoher Ripple oder Alterung erzeugen Instabilitäten unter Last. Ein Tauschtest mit einem hochwertigen, ausreichend starken Netzteil ist oft aufschlussreich.

Bringt eine Windows-Neuinstallation etwas?

Wenn Treiberinkonsistenzen vermutet werden (z. B. nach großem Hardwarewechsel), kann ein Clean Install helfen. Persistiert der Fehler danach, ist es höchstwahrscheinlich echte Hardware.

Wie gehe ich bei Laptops vor?

Treiber/BIOS beim Hersteller aktualisieren, Kühlkanäle reinigen, OC‑Tools meiden. Wenn es bleibt: Herstellerdiagnose und ggf. Reparatur in Anspruch nehmen.

Welche Tools sollte ich als Erstes nutzen?

  • Ereignisanzeige: WHEA‑Logger lesen
  • HWInfo: Temperaturen/Spannungen überwachen
  • MemTest/Windows‑Speicherdiag.: RAM prüfen
  • chkdsk + SMART: Storage‑Gesundheit
  • WinDbg (optional): !errrec für Tiefendetails

Was tun, wenn nach BIOS-Update plötzlich 0x124 auftaucht?

Defaults laden, XMP/OC aus. Prüfe die Release Notes, teste notfalls eine stabile Vorgängerversion. Stelle sicher, dass Chipsatz‑/Gerätetreiber zum BIOS‑Stand passen.

Wie oft darf ich „whea uncorrectable error“ im Log sehen, bevor ich handeln muss?

Ein einziger 0x124 ist bereits ein Handlungsaufruf. Korrigierbare WHEA‑Events (ID 17) in Häufung sind ebenfalls ernst zu nehmen, da sie auf beginnende Degradation hindeuten.

  • Impressum
  • Datenschutz und Haftungsausschluss