whea uncorrectable error: Ursachen, Diagnose und Lösungen unter Windows 10/11

Der Bluescreen mit dem Stopcode WHEA_UNCORRECTABLE_ERROR (0x00000124) signalisiert fast immer einen echten Hardwarefehler oder eine harte Instabilität im Hardwarenahen Bereich. Dahinter steckt die Windows Hardware Error Architecture (WHEA), die Fehler aus CPU, Speicher, PCIe, Firmware und weiteren Quellen standardisiert erfasst, protokolliert und – wenn möglich – abfängt. Wenn dieser Stopp auftritt, hat Windows einen nicht korrigierbaren Fehler erkannt und den Betrieb aus Selbstschutz gestoppt. In diesem Artikel zeige ich dir präzise, wie die Architektur funktioniert, welche Ursachen realistisch sind, wie du strukturiert diagnostizierst und dein System sauber stabilisierst.

Was im System passiert: WHEA in Kurzform

WHEA sammelt Hardwarefehlerinformationen in standardisierten Error Records (CPER – Common Platform Error Record). Jede Fehlerquelle – von der CPU‑Machine‑Check‑Logik über Speichercontroller bis zu PCIe‑Geräten – liefert Details, die Windows im Ereignislog (WHEA‑Logger) und über ETW verfügbar macht. Korrigierbare Fehler landen „nur“ im Protokoll; unkorrigierbare Fehler führen zur Notbremse: WHEA_UNCORRECTABLE_ERROR.

Merke: WHEA ist keine Fehlermeldung eines einzelnen Treibers – es ist die Infrastruktur, mit der Windows Hardwarefehler entgegennimmt, auswertet und darauf reagiert. Der Bluescreen ist die Konsequenz, wenn die Integrität nicht mehr gewährleistet ist.

Typische WHEA-Fehlerquellen im Überblick

Fehlerquelle	Beispiele	Indikatoren im Log
CPU / Machine Check	Cache‑Fehler, Bus‑/Interconnect‑Fehler, Überhitzung, Spannungsinstabilität	WHEA-Logger 18/19; „Machine Check Exception“, „Cache Hierarchy Error“
Speicher / Controller	Defekte RAM‑Zellen, instabile XMP/DOCP‑Profile, fehlerhafte Slots	„Memory Hierarchy Error“, sporadische 0x124 und weitere Bugchecks
PCIe / Peripherie	Instabile Grafikkarte, NVMe‑Fehler, Signalqualitätsprobleme	„Bus/Interconnect Error“, Geräte‑PCIe‑Angaben im Record
Stromversorgung / VRM	PSU‑Unterspannung, Ripple, Mainboard‑VRM‑Instabilität	Crashs unter Last, Kernel‑Power 41 + WHEA‑Events
Firmware / BIOS	Fehlerhafte Microcode‑Interaktion, unverträgliche Settings	Fehler nach BIOS‑Update, Stabilität bei Defaults besser

Bugcheck 0x00000124: Bezug zu Machine Check Exceptions (MCE)

Viele 0x124‑Abstürze gehen auf Machine Check Exceptions zurück, die die CPU selbst auslöst, wenn interne oder plattformbezogene Zustände nicht mehr korrigierbar sind. Häufige Auslöser: Busfehler (CPU↔Mainboard), Cachefehler, Speicherpfadprobleme, Überhitzung, fehlerhafte I/O‑Controller oder instabile Spannungen.

Bugcheck-Parameter, die du kennen solltest

Parameter	Bedeutung	Praxishinweis
Parameter 1	0x0 deutet auf MCE (CPU) hin	Gibt die Fehlerkategorie an; 0x0 ist klassisch CPU/MCE
Parameter 2	Pointer auf WHEA_ERROR_RECORD	In WinDbg mit `!errrec <Adresse>` analysierbar
Parameter 3/4	Weitere Status-/Kontextwerte	In Kombination mit Error Record interpretieren

Mit einem Minidump kannst du die WHEA‑Details auslesen:

windbg -z C:\Windows\Minidump\<dumpfile.dmp>
!analyze -v
!errrec <Adresse aus Parameter 2>

Der Error Record enthält u. a. CPU‑Bank, MCi_STATUS, Adressen und – bei PCIe‑Fehlern – Gerätekennungen. Für erfahrene Analysen ist das Gold wert.

Typische Ursachen – und was sie triggert

CPU-Probleme und Überhitzung

Übertemperatur: Verstaubte Kühler, ausgetrocknete Wärmeleitpaste, lockerer Kühler, zu aggressiver Boost. Symptome: Crashs unter Last, Thermal Throttling im Monitoring.
Spannungsinstabilität: Undervolting oder instabile VRM‑/PSU‑Versorgung. Symptome: WHEA beim Lastwechsel, sporadische Resets ohne BSOD.
Silicon-Lottery/Alterung: Grenzstabile CPUs, die bestimmte Frequenz‑/Spannungskombinationen nicht mehr tragen.

RAM, Speichercontroller und XMP/DOCP

Defekte Module / Slots: Fehler treten sporadisch auf, oft mit wechselnden Bugchecks, inklusive 0x124.
Instabile Profile: XMP/DOCP kann den Controller überfordern; JEDEC‑Defaults laufen stabiler.
Inkompatibilitäten: RAM‑Kits außerhalb der QVL des Boards; Mischbetrieb unterschiedlicher Kits.

Mainboard, Spannungsversorgung und Netzteil (PSU)

VRM‑Probleme: Überhitze oder schwache Spannungswandler → CPU‑/RAM‑Instabilität.
Signalqualität: PCIe‑Fehler durch schwache Slots, fehlerhafte Leiterbahnen, mangelhafte Lötstellen.
PSU‑Themen: Unterdimensionierung, starker Ripple, Alterung. Auffällig: Neustarts unter GPU/CPU‑Volllast.

Siehe auch Amazon Fehlercode 3565 verstehen und beheben

Grafikkarte, Massenspeicher und Peripherie

GPU/VRAM: Überhitzte, übertaktete oder degradierte Karten → PCIe‑„Bus/Interconnect Errors“.
NVMe/SATA: Controller-Hänger, fehlerhafte Sektoren, Kontaktprobleme; korrelieren mit SMART‑Warnungen.
Sonstiges: WLAN/USB/Soundkarten mit fehlerhaften Treibern – selten, aber real.

Treiber, BIOS/UEFI und Software als indirekte Auslöser

Treiber: Inkompatible oder defekte Treiber können DMA‑/Register‑Fehlzustände erzeugen.
BIOS/UEFI: Bugs, veralteter Microcode, fehlerhafte Defaults nach Updates.
OC-/Tuning-Tools: Afterburner, „Performance Booster“, Undervolting‑Tools → instabile Betriebsfenster.

Überhitzung, Gehäuseklima, Umgebung

Gehäusefluss: Staub, blockierte Luftwege, defekte Lüfter.
Umgebung: Hohe Raumtemperaturen, Netzstörungen, ESD‑Schäden.

Diagnose-Workflow: Strukturiert statt Rätselraten

1) Schneller Erstcheck (10–20 Minuten)

Änderungen notieren: Tritt es seit Treiber-/BIOS‑Update, neuer Hardware oder OC auf?
Temperaturen prüfen: Mit HWInfo o. ä. CPU/GPU‑Temps sowie VRM/SSD (sofern auslesbar).
Ereignisanzeige öffnen: Windows‑Logs → System → WHEA‑Logger (IDs 17/18/19) und Kernel‑Power 41.
BIOS‑Defaults laden: OC, XMP/DOCP, manuelle Spannung/Multiplikator deaktivieren.
Windows Update + Hersteller‑Treiber: Chipsatz, GPU, Storage, LAN/WLAN aktualisieren.

2) WHEA-Logger-Events lesen

Ereignis-ID	Beschreibung	Hinweis
17	WHEA Korrekturbedingter Fehler	Frühwarnung – kann auf Degradation hindeuten
18	WHEA Nicht korrigierbarer Fehler	Relevanter für 0x124; Details zur Quelle enthalten
19	WHEA Fehlerbericht (weiterführend)	Kontextinfos (z. B. Typ: Cache/Bus/Memory)

Achte in den Eventdetails auf Formulierungen wie „Cache Hierarchy Error“, „Bus/Interconnect Error“ oder einen referenzierten PCIe‑Pfad – das gibt die Richtung vor (CPU/Board vs. GPU/NVMe).

3) Dumps analysieren (optional, aber stark)

Erzeuge Minidumps (Systemsteuerung → System → Erweitert → Starten und Wiederherstellen). In WinDbg:

!analyze -v
!errrec <Adresse aus Parameter 2 von 0x124>

Du siehst dann Quelle (z. B. „MCE“), Bank/Status und ggf. Adressen/Gerätekennungen. Das trennt saubere CPU‑Pfadprobleme von reinen PCIe‑Fehlern.

4) Systematische Hardwaretests

RAM: Windows‑Speicherdiagnose (erweitert) oder MemTest (mehrere Durchläufe).
- Bei Fehlern: Einzeln testen, Slots wechseln, XMP/DOCP aus.
CPU: Intel Processor Diagnostic Tool bzw. Stresstests (mit Monitoring). Abbruch bei >90 °C.
Datenträger: chkdsk, Herstellerdiagnose, SMART prüfen.
GPU: Lasttest (z. B. 3DMark/OCCT) mit Temperatur‑ und Fehlerzähler‑Beobachtung.

5) Treiber-Stresstest (Driver Verifier)

Nur gezielt einsetzen; kann Bluescreens provozieren, um den verursachenden Treiber zu identifizieren.

verifier.exe starten → „Benutzerdefinierte Einstellungen“ → Standardprüfungen
Drittanbieter‑Treiber auswählen (kein Microsoft‑Core)
Neustart und Verhalten beobachten; im Fehlerfall Treiber aktualisieren oder ersetzen

6) BIOS/UEFI: Zurück auf Null

Load Optimized Defaults: Alle OC‑, XMP‑, Boost‑ und Undervolting‑Einstellungen aus.
BIOS aktualisieren: Nur stabile Versionen; Release Notes lesen.
Fallback testen: Bei neuen Problemen nach Update ggf. Rollback auf bekannte stabile Version.

7) Minimal-Konfiguration

Baue temporär auf das Nötigste zurück:

1 RAM‑Riegel im empfohlenen Slot
System‑SSD, onboard‑Grafik (falls vorhanden)
Keine Zusatzkarten/USB‑Geräte außer Tastatur/Maus

Läuft es stabil, schalte Komponenten nacheinander wieder zu, bis der Fehler reproduzierbar ist.

Symptome → Prüfschritte (Kompaktmatrix)

Symptom	Wahrscheinliche Schiene	Prüfen/Maßnahme
Crash nur bei CPU-Last	CPU/VRM/PSU/Temperatur	Temps, VRM‑Kühlung, PSU‑Tauschtest, BIOS‑Defaults
Crash nur bei Spielen	GPU/PSU/PCIe	GPU‑Treiber, Lasttest, PCIe‑Slot wechseln, PSU prüfen
Sporadische Fehler, wechselnde Bugchecks	RAM/Storage	MemTest, XMP aus, Slots/Kits tauschen; chkdsk/SMART
Nach BIOS-Update Instabilität	BIOS/Settings	Defaults, anderes BIOS, Microcode‑Hinweise beachten
Unerwartete Neustarts ohne BSOD	PSU/Überhitzung	Kernel‑Power 41, Temps, PSU‑Tauschtest

Siehe auch pr_connect_reset_error: Lösungen für stabile Verbindungen

Praxislösungen und Best Practices

Grundlagen zuerst

Windows Update fahren: Inklusive optionaler Treiber, Microcode/Firmware‑Ergänzungen.
Hersteller‑Treiber installieren: Chipsatz, GPU, Storage, Netzwerk – nicht nur generische Treiber.
Systemdateien reparieren:
sfc /scannow und
DISM /Online /Cleanup-Image /RestoreHealth.
Datenträger prüfen:
chkdsk C: /f (ggf. mit /r) und Hersteller-Tools.

Overclocking/Undervolting kompromisslos zurückdrehen

Setze CPU, RAM und GPU auf Hersteller‑Spezifikationen zurück. Deaktiviere XMP/DOCP, manuelle Multiplikatoren und Spannungsoffsets. Falls nötig, reduziere testweise CPU‑Boost‑Funktionen, um Temperatur‑/Spannungsspitzen zu entschärfen.

Reinigung, Kühlung, physische Kontrolle

Staub entfernen, Luftstrom optimieren: Front rein, hinten/oben raus; Kabel sauber verlegen.
Wärmeleitpaste erneuern, Kühler prüfen: Fester Sitz, gleichmäßiger Anpressdruck.
Kontaktprobleme ausschließen: RAM und Karten aus‑/einstecken; sichtbare Schäden (Kondensatoren) checken.

Treiber-Konflikte systematisch lösen

Driver Verifier gezielt anwenden; problematische Drittanbieter‑Treiber ersetzen.
Saubere Neuinstallation erwägen, wenn ein „Treibergrab“ vermutet wird (Altlasten nach Hardwarewechsel).

Minimal-Konfiguration und Tauschtests

PSU gegen bekannt gutes Modell testen: Häufige Ursache bei Last‑Crashes.
RAM‑Kit tauschen/wechseln: Auch bei „fehlerfreiem“ MemTest können Grenzfälle existieren.
GPU in anderem Slot/anderem System: PCIe‑/Kartenproblem einkreisen.

Datensicherheit nicht vergessen

Wichtig: Wiederholte WHEA‑Ereignisse erhöhen das Risiko stiller Datenkorruption. Sichere kritische Daten sofort, bevor du Stresstests fährst oder weiter analysierst.

Konservative Stabilität als Ziel

Du willst alltagsstabile, thermisch und elektrisch entspannte Settings. Aggressive Profile beeindrucken in Benchmarks, verursachen aber in realen Lastwechseln häufig Instabilitäten – genau hier entstehen viele WHEA‑Abstürze.

Maßnahmenübersicht nach Komponente

Komponente	Sofortmaßnahme	Vertiefung	Tool/Beispiel
CPU	Boost/OC aus, Temps prüfen	VRM‑Kühlung, BIOS‑Update	Intel PDT, HWInfo
RAM	XMP/DOCP aus, Einzelt tests	Slots/Kits tauschen, QVL prüfen	MemTest, Windows‑Speicherdiagnose
GPU	Treiber neu, OC aus	Anderer Slot/anderes System	3DMark/OCCT
Storage	chkdsk/SMART	Hersteller‑Firmware/‑Diag, Kabel	CrystalDiskInfo, Vendor‑Tools
PSU/Mainboard	PSU‑Tauschtest	VRM‑Temp, Sichtprüfung	HWInfo, Thermals, Multimeter (Profi)

Prävention: So bleibt dein System stabil

Hochwertiges Netzteil mit Reserve; gute Effizienz und niedriger Ripple.
Solides Mainboard mit starker VRM‑Kühlung; RAM aus der QVL verwenden.
Moderate Einstellungen: Keine aggressiven OC‑/UV‑Profile für den Alltag.
Geplante BIOS‑Updates mit Blick in die Release Notes; vor Produktiveinsatz testen.
Wartung: Staub, Lüfter, Temperaturen, SMART‑Werte regelmäßig prüfen.
Monitoring & Logging: WHEA‑Events beobachten; gehäufte korrigierbare Fehler ernst nehmen.

Besondere Szenarien

Laptops

Treiber und BIOS direkt vom Hersteller beziehen.
Kühlung: Lüfter und Kühlkanäle reinigen; Notebook auf harter Oberfläche betreiben.
Limitierte Tauschoptionen: Bei anhaltenden WHEA‑Fehlern führt oft kein Weg am Herstellerservice vorbei.

Neue Builds

Erststart mit Minimal‑Konfiguration, BIOS‑Defaults, ohne XMP.
QVL‑Abgleich von RAM; korrekte Steckplätze nutzen.
Frühe RMA nutzen, wenn Instabilität sich nicht plausibel beheben lässt.

Ältere Systeme

PSU‑Alterung und Kondensatoren im Blick behalten.
Thermische Zyklen und Staub als schleichende Instabilitätsquellen.
Eher konservative Settings fahren; ggf. Hardwarerefresh statt Grenzbetrieb.

Fazit

Der WHEA_UNCORRECTABLE_ERROR ist kein „normaler“ Software‑Crash, sondern die klare Botschaft der Plattform: Hier liegt ein nicht korrigierbarer Hardwarefehler oder eine harte Instabilität vor. Mit WHEA stellt Windows eine robuste Architektur bereit, die Fehler aus CPU, Speicher, PCIe und Firmware in strukturierte Datensätze gießt – für dich heißt das: zielgerichtete Diagnose statt Versuch‑und‑Irrtum. In der Praxis führen konsequente Basismaßnahmen (Treiber, Updates, BIOS‑Defaults), saubere Kühlung und Stromversorgung, das Ausschalten von OC/UV sowie systematische Tests (RAM/CPU/Storage/GPU) am schnellsten zur Lösung. Wenn ein sauberer Software‑Stand und konservative BIOS‑Einstellungen keine Besserung bringen, bleibt der Weg über Minimal‑Konfiguration, Tauschtests und bei Bedarf RMA. Nimm WHEA‑Ereignisse ernst, sichere deine Daten frühzeitig und strebe auf Dauer konservative, thermisch wie elektrisch stabile Systemzustände an – so minimierst du das Risiko erneuter Abstürze und erhöhst die Lebensdauer deiner Hardware deutlich.

Siehe auch ERR_CACHE_MISS effizient beheben und vermeiden

FAQ

Was bedeutet der whea uncorrectable error genau?

Es handelt sich um den Stopcode 0x00000124, der über die Windows Hardware Error Architecture (WHEA) signalisiert, dass ein nicht korrigierbarer Hardwarefehler aufgetreten ist. Häufig ist eine CPU‑Machine‑Check‑Exception, ein Speicherfehler, ein PCIe‑/Busproblem oder eine Spannungs-/Temperaturinstabilität die Ursache.

Ist das ein Treiber- oder ein Hardwarefehler?

Primär Hardware bzw. Hardwarenah. Treiber können aber indirekt Hardwarefehler triggern (z. B. durch fehlerhafte Registerzustände oder DMA), weshalb aktuelle und korrekte Hersteller‑Treiber essenziell sind.

Wie lese ich WHEA-Informationen in Windows aus?

In der Ereignisanzeige unter Windows‑Protokolle → System nach WHEA‑Logger (IDs 17/18/19) suchen. Für Tiefenanalyse: Minidump mit WinDbg öffnen, !errrec <Adresse> (Adresse ist Bugcheck‑Parameter 2) ausführen.

Kann ich den Fehler ignorieren, wenn der PC danach wieder startet?

Nein. Es besteht Risiko für Datenkorruption und Folgeschäden. Sichere Daten und beginne mit den beschriebenen Diagnose‑ und Stabilisierungsmaßnahmen.

Hilft es, XMP/DOCP zu deaktivieren?

Sehr oft ja. RAM‑Profile jenseits JEDEC können Controller und Spannungsversorgung an die Grenze bringen. Teste JEDEC‑Defaults, prüfe Slots und ggf. andere Kits.

Wie gefährlich ist Undervolting oder Overclocking in diesem Kontext?

Beides kann Stabilitätsfenster verengen. Overclocking erhöht Takt/Spannung/Hitze; Undervolting kann bei Lastwechseln zu Unterspannung führen. Für die Fehlersuche stets auf Default‑Werte zurückgehen.

Was, wenn die Abstürze nur beim Gaming auftreten?

Dann rücken GPU, PSU und PCIe in den Fokus. Setze GPU‑OC zurück, aktualisiere Treiber, teste mit anderem PSU/Slot, überwache Temperaturen und „Bus/Interconnect“‑Hinweise im WHEA‑Log.

Welche Rolle spielt das Netzteil (PSU)?

Eine große. Unterdimensionierung, hoher Ripple oder Alterung erzeugen Instabilitäten unter Last. Ein Tauschtest mit einem hochwertigen, ausreichend starken Netzteil ist oft aufschlussreich.

Bringt eine Windows-Neuinstallation etwas?

Wenn Treiberinkonsistenzen vermutet werden (z. B. nach großem Hardwarewechsel), kann ein Clean Install helfen. Persistiert der Fehler danach, ist es höchstwahrscheinlich echte Hardware.

Wie gehe ich bei Laptops vor?

Treiber/BIOS beim Hersteller aktualisieren, Kühlkanäle reinigen, OC‑Tools meiden. Wenn es bleibt: Herstellerdiagnose und ggf. Reparatur in Anspruch nehmen.

Welche Tools sollte ich als Erstes nutzen?

Ereignisanzeige: WHEA‑Logger lesen
HWInfo: Temperaturen/Spannungen überwachen
MemTest/Windows‑Speicherdiag.: RAM prüfen
chkdsk + SMART: Storage‑Gesundheit
WinDbg (optional): !errrec für Tiefendetails

Was tun, wenn nach BIOS-Update plötzlich 0x124 auftaucht?

Defaults laden, XMP/OC aus. Prüfe die Release Notes, teste notfalls eine stabile Vorgängerversion. Stelle sicher, dass Chipsatz‑/Gerätetreiber zum BIOS‑Stand passen.

Wie oft darf ich „whea uncorrectable error“ im Log sehen, bevor ich handeln muss?

Ein einziger 0x124 ist bereits ein Handlungsaufruf. Korrigierbare WHEA‑Events (ID 17) in Häufung sind ebenfalls ernst zu nehmen, da sie auf beginnende Degradation hindeuten.