BDOS (aléatoire) + Crash & reboot

devdsun

Nouveau membre
Bonjour,

J'ai un souci avec mon PC depuis 1 semaine, et je ne comprends pas d'où peut venir le problème, je viens donc voir si quelqu'un aurait une piste car j'avoue que je ne sais plus où chercher...

Pour remettre du contexte, je me suis monté un bon PC en Mai dernier, jusqu'ici tout allait bien je pouvais jouer (Cyberpunk, The Last Of Us, CS2...) et également travailler (Photoshop, After effect, Blender....). Mais depuis quelques jours, d'un coup, j'ai eu des BSOD (écrans bleus) qui sont apparus lors des jeux et sur certaines applications (avec crash & reboot). Sur le coup j'ai cru qu'il y avait un problème avec Windows, j'ai tout réinstallé, (j'ai donc Windows 11 à jour, Nvidia à jour, Chipset, LAN, Realtek... tout est à jour), ainsi que la dernière version du BIOS de ma CM.

J'ai eu le droit un peu à toute les erreurs, tel que PAGE_FAULT_IN_NONPAGED_AREA, HYPERVISOR_ERROR, WHEA_UNCORRECTABLE_ERROR, IRQL_NOT_LESS_OR_EQUAL, KMODE_EXCEPTION_NOT_HANDLED...

J'ai donc enquêté en essayant de trouver le coupable.
Pensant que c'était la RAM, j'ai booté sur une clé USB pour faire un Memtest86 (4passes), mais tout est OK. J'ai également testé avec d'autres barrettes de RAM. Par contre j'ai essayé OCCT pour checker mon CPU, et j'ai trouvé eu pas mal d'instabilité sur celui-ci, certaines WHEA errors apparaissent (c'est un peu aléatoire).

Par la suite j'ai voulu faire un test "power" sur OCCT, c'est un BSOD direct (impossible, ça crash & reboot). Pareil pour le stress test avec Prime95, si je le lance, c'est BSOD direct et reboot aussi.

A noter que je n'ai pas de problème de surchauffe, les températures de base :
CPU = 30°c / En stress test = 70°c
GPU = 35°c / En stress test = 65°c

_____________________________________

CM : NZXT - N7 Z790
PROSS : Intel - i7 13700K
AIO : NZXT - Elite Kraken 360
CG : Gainward Phantom - 4080 RTX
RAM : 32Go G.SKILL Trident Z5 Neo 6000mhz (CAS CL30 à 1,35 V)
SSD : Samsung 990 PRO - 2To
Case : NZXT - Flow H9
Alim : BeQUiet - Dark Power 13 1000w
_____________________________________

Est-ce que vous auriez des pistes pour résoudre ce soucis ?
Je vous remercie par avance pour votre aide.

Bonne journée
 

Patakesse

Gruik Gruik!
Puisque tu as fait un memtest sans problème, tu devrais essayer de faire tourner une distribution Linux ou un Windows PE sur clé usb (par exemple ). Si ça fonctionne normalement, c'est que ton soucis est logiciel (OS ou pilote, avoir toujours les dernières versions n'est pas forcément garant de la meilleure stabilité). Dans le cas contraire (si ça plante, ça gèle, etc...), le soucis matériel sera à privilégier.

Niveau soucis matériel il faut commencer par observer les tensions délivrées par l'alimentation avec par exemple HWMonitor, en idle mais aussi en activité. Si celles-ci sont bonnes et stables, en l'absence de possibilité de lancer un quelconque test, il faudrait faire un test matériel minimaliste : tout débrancher de la carte mère, hormis le minimum (1 barrette de RAM, Disque de Boot, pas de GPU puisque tu as un iGPU). Et tester ainsi, puis rajouter un composant et refaire un test. Si ça plante dès le début (avec quasiment rien), que les tensions sont stables, tu pourras raisonnablement incriminer la carte mère (ou le CPU mais c'est bien plus rare).
 

AccroPC2

Fou du PC
Staff
Hello,

Si je suis d'accord avec les propos de @Patakesse, tu connais le dicton, je suis comme St Thomas, je ne crois que ce que je voie.

Si tu savais le nombre de membres qui nous on dit qu'il n'y avait pas de problème de température et à la 1ère capture le proc est à 100°C. Donc si tu nous envoies pas des captures de ce que tu as relevé ...

Bye
 

jeanmay022

Modo hardware OC
Staff
Salut,
J'ai déjà eu le cas pendant les phases d'OC mon CPU (les mêmes BSOD que toi !)
J'ai résolu le souci en augmentant la tension CPU d'un ou 2 pas.

Mais comme dit AccroPC2, des captures de tes courbes seraient les bienvenues pour écarter toutes pistes de surchauffe...
 

devdsun

Nouveau membre
Merci pour vos réponses.

J'ai téléchargé HWMonitor pour voir un petit peu ce que ça sortait en IDLE pour les composants (voici les screenshots en pièce jointe). Par contre, je ne peux pas faire de test en activité, car dés que je sollicite le PC il me met un écran noir et il reboot :(
J'ai voulu faire un test CPU sur OCCT, pour vous faire des screens en activités mais ça veut pas... Le PC fonctionne bien seulement si je fais des petites tâches de bureautique.

Je vais tenter un mode minimaliste et checker au fur et à mesure les composants, (et je testerai également avec un Windows PE voir si le souci est logiciel).
 

Fichiers joints

  • i7HWMonitor.jpg
    i7HWMonitor.jpg
    273.4 KB · Affichages: 7
  • 4080HWMonitor.jpg
    4080HWMonitor.jpg
    239.6 KB · Affichages: 11
  • N790HWMonitor.jpg
    N790HWMonitor.jpg
    233.5 KB · Affichages: 4
  • GskillHWMonitor.jpg
    GskillHWMonitor.jpg
    153.5 KB · Affichages: 3
  • samsung990HWMonitor.jpg
    samsung990HWMonitor.jpg
    95.7 KB · Affichages: 11

devdsun

Nouveau membre
J'ai pu réussir a faire un screen de HWMonitor quand le CPU est en activité avec un stress CPU sur CPUZ. Voici le screenshot.
 

Fichiers joints

  • I7HWMonitor_CPUZ.jpg
    I7HWMonitor_CPUZ.jpg
    238.5 KB · Affichages: 9

jeanmay022

Modo hardware OC
Staff
Alors va dans le BIOS et essaye de remonter un poil la tension CPU. Cette dernière n'est peut-être pas suffisante pour tenir la fréquence de 5.2 Ghz. Il faut bloquer la tension CPU en manu.
Fais un test OCCT et si ça crash, remonte la d'un pas encore et reteste.
Ne dépasse pas 1.35V grand maximum pour le CPU.
 

AccroPC2

Fou du PC
Staff
CPU = 30°c / En stress test = 70°c
Bon bah voilà, l'écart entre ce que tu nous dis et la réalité... dans HW Monitor, tu es à 87°C, donc tu as bien un problème de température.

@jeanmay022 le vCore est monté à 1.37v, je doute que le problème soit la tension insuffisante du CPU. Les P-Core et E-Core sont montés aux fréquences max d'un 13700k "stock" , ce n'est à priori pas non plus un problème d'OC.
 

devdsun

Nouveau membre
Bon bah voilà, l'écart entre ce que tu nous dis et la réalité... dans HW Monitor, tu es à 87°C, donc tu as bien un problème de température.
Ok, au vu des tests que j'avais pu voir comme celui-ci je pensais qu'en poussant le processeur a fond, ces températures étaient normales étant donné que lui a 92°c dans son test.

De même, j'ai pu regarder lorsque je lance un jeu (CS2), la température du processeur est montée jusqu'à 48° sur HWMonitor et j'ai tout de même un crash et un reboot. Ce n'est pas lié à la température du coup

Je vais essayer de faire ça avec une configuration sans ma CG dans la journée (mode minimaliste) pour voir si il y a toujours le problème. @Patakesse J'ai pu tester sous Windows PE, mais j'ai toujours le même soucis. Du coup je peux supprimer le fait que ce soit logiciel.
 
Dernière édition:

jeanmay022

Modo hardware OC
Staff
Bon bah voilà, l'écart entre ce que tu nous dis et la réalité... dans HW Monitor, tu es à 87°C, donc tu as bien un problème de température.

@jeanmay022 le vCore est monté à 1.37v, je doute que le problème soit la tension insuffisante du CPU. Les P-Core et E-Core sont montés aux fréquences max d'un 13700k "stock" , ce n'est à priori pas non plus un problème d'OC.

Oui tu as raison AccroPC2 ! Je viens de voir le rapport et la tension est au max pour cette fréquence. Ca aurait pu être l'OC auto mais ce n'est pas...
J'avais eu ce genre de BSOD à l'OC de mon CPU pendant les phases de montée en fréquence quand il manquait de jus...
La température est vraiment trop haute !

Attention !! Hypothèse :
Les 1.37V ne sont peut-être pas suffisant pour tenir les 5.2 Ghz et il lui faut un poil de tension en plus mais bonjour la chauffe à contenir.
Ou on peut essayer de baisser un poil la fréquence (5 Ghz) en gardant la même tension et voir si les BSOD reviennent...
 

devdsun

Nouveau membre
Merci pour ta réponse @jeanmay022

J'ai eu des "améliorations", en cherchant sur des forums, j'ai vu certaines personne modifiaient CPU Vcore compensation présent dans le BIOS(N790) en changeant celui-ci il de auto à level 1. Il y a 5 levels proposé, j'ai tenté le level 1, et maintenant je peux lancer des tests sur OCCT pour le CPU et le power sans que le PC plante et sans erreur.

Je ne suis pas trop calé sur le sujet, mais qu'est ce que ça change du coup ?
Est-ce que cela a changé la tension, c'est pour cela que cela fonctionne ?

Merci pour ton aide
 

Fichiers joints

  • HWMnew.jpg
    HWMnew.jpg
    241.2 KB · Affichages: 2

jeanmay022

Modo hardware OC
Staff
Alors oui le LLC (Load Line Calibration) va stabiliser la tension du CPU en l'augmentant légèrement selon la charge de travail pour faire simple.
C'est pas toujours le cas selon les CM mais pour la mienne par ex, le VCore est à 1.25V et avec le LLC, il peut monter à 1.27 voire 1.28V pour stabiliser le CPU.

Pour résumer, le LLC, le VCore et la tension ram (entr'autres) ne sont jamais laisser en Auto dans mon BIOS.

Du coup, ça donne quoi les courbes de température du CPU sous OCCT?
Poste ici le rapport stp.

En tout cas, cool si ça fonctionne !!
 
Vous devez vous inscrire ou vous connecter pour répondre ici.
Derniers messages publiés
Statistiques globales
Discussions
730 156
Messages
6 718 496
Membres
1 586 437
Dernier membre
sentenza696
Partager cette page
Haut