Jeux font reboot pc sur rtx 4070 super

Danterex

Habitué
Bonjour tout le monde.
j'ai posté un message similaire dans la rubrique "mémoire" à cause d'une erreur mais il se peut que ce soit plutot la carte graphique qui ait un soucis.
J'ai un problème avec ma nouvelle config. Mon ordi reboot parfois sur 3dmark (time spy, vers la fin de la démo avec musique) et tout le temps sur des jeux comme witcher 3 next gen en 1080 RT et RT ultra. (directx12)
Après chaque reboot, dans l'observateur d'évènement j'ai cette erreur:
Composant : mémoire
Source de l’erreur : Machine Check Exception
Evènement: 46
En faisant un win +tab durant le jeu et un retour sur le bureau, aprés 5-10 mins j'ai un blue screen et ça reboot immédiatement.
Sur le blue screen l'erreur est WHEA UNCORRECTABLE ERROR
J'ai testé avec pbo sur le proc (undervolting), sans pbo, avec xmp (sur la ram) et sans xmp. c'est aléatoire sur 3dmark (parfois ça passe) mais sur witcher 3 il y a des reboot avec la même erreur à chaque fois (aprés 5-10 min de jeu) que ce soit avec ou sans OC.
j'ai fait des stress test sur OCCT sans erreurs (cpu, ram, gpu, Vram, linpack...)
Tous les composants sont quasi neufs (la carte graphique a 10j), memtest n'a montré aucune erreur.
Cinebench (R15,20,23,24) passe bien.
Le cpu est a environ en max à 70-75° en jeu pareil pour la carte graphique. (reglages de base par defaut)
Sur Nvidia gpu tweak III avant le reboot j'ai "statut de la cible d'alimentation" à 101¨% et "utilisation gpu" à 100%.
Meme probleme en mode "quiet" ou "performance" sur la carte graphique
On m'a dit que ça pourrait provenir de l'alim mais pourtant elle semble suffisante pour ma config... J'ai pensé à la mémoire (a cause de l'erreur de l'observateur) mais même sans xmp j'ai ces reboot.
Pour info j'ai branché ma carte graphique avec l'adaptateur sur 2 cables séparés 8 pins sur 2 slots de mon alim (vga1 et vga2) comme dit dans le manuel de l'alim. (j'ai essayé avec vga1 et vga1, même résultat).
J'ai vu que certains ont eu ce probleme mais sur des amd et que ça provenait de la Vram defectueuse, est ce possible dans mon cas ?
Auriez vous une idée d'où peut provenir ces reboots ? Merci et déso pour le pavé !


ma config
Proc: Ryzen 9 5900x
Carte mere : Msi mag b550 tomahawk
Mémoire: 2x32gb 3600 (18-22-22-42) corsair vengeance lpx CMK64GX4M2D3600C18
Carte graphique : Asus dual rtx 4070 super
Nvme samsung 990 2to
Nvme wd sn770 1to
ssd crucial m500 1to
Alim: MSI MPG A750GF - 750W 80+ Gold Modulaire
Bios, chipset et drivers à jour
Windows 11 a jour.
memtest revenu sans erreur
J'ai sorti la carte graphique, l'ai remise, j'ai bien vérifié le cablage.

Edit 1: après un stress test psu (alim) sur occt de 10 min, quand j'ai voulu le stopper j'ai eu un bsod et un restart et dans l'observateur d'évènement là même erreur que d'hab:
Une erreur matérielle irrécupérable s’est produite.
Composant : mémoire
Source de l’erreur : Machine Check Exception
j'ai pas eu le temps de lire le blu screen ça reboot direct mais probablement la meme erreur que plus haut.
 
Dernière édition:

magellan

Modérâleur
Staff
Bonjour tout le monde.
j'ai posté un message similaire dans la rubrique "mémoire" à cause d'une erreur mais il se peut que ce soit plutot la carte graphique qui ait un soucis.
J'ai un problème avec ma nouvelle config. Mon ordi reboot parfois sur 3dmark (time spy, vers la fin de la démo avec musique) et tout le temps sur des jeux comme witcher 3 next gen en 1080 RT et RT ultra. (directx12)
Après chaque reboot, dans l'observateur d'évènement j'ai cette erreur:
Composant : mémoire
Source de l’erreur : Machine Check Exception
En faisant un win +tab durant le jeu et un retour sur le bureau, aprés 5-10 mins j'ai un blue screen et ça reboot immédiatement.
Sur le blue screen l'erreur est WHEA UNCORRECTABLE ERROR
J'ai testé avec pbo sur le proc (undervolting), sans pbo, avec xmp (sur la ram) et sans xmp. c'est aléatoire sur 3dmark (parfois ça passe) mais sur witcher 3 il y a des reboot avec la même erreur à chaque fois (aprés 5-10 min de jeu) que ce soit avec ou sans OC.
j'ai fait des stress test sur OCCT sans erreurs (cpu, ram, gpu, Vram, linpack...)
Tous les composants sont quasi neufs (la carte graphique a 10j), memtest n'a montré aucune erreur.
Cinebench (R15,20,23,24) passe bien.
Le cpu est a environ en max à 70-75° en jeu pareil pour la carte graphique. (reglages de base par defaut)
Sur Nvidia gpu tweak III avant le reboot j'ai "statut de la cible d'alimentation" à 101¨% et "utilisation gpu" à 100%.
Meme probleme en mode "quiet" ou "performance" sur la carte graphique
On m'a dit que ça pourrait provenir de l'alim mais pourtant elle semble suffisante pour ma config... J'ai pensé à la mémoire (a cause de l'erreur de l'observateur) mais même sans xmp j'ai ces reboot.
Pour info j'ai branché ma carte graphique avec l'adaptateur sur 2 cables séparés 8 pins sur 2 slots de mon alim (vga1 et vga2) comme dit dans le manuel de l'alim. (j'ai essayé avec vga1 et vga1, même résultat).
J'ai vu que certains ont eu ce probleme mais sur des amd et que ça provenait de la Vram defectueuse, est ce possible dans mon cas ?
Auriez vous une idée d'où peut provenir ces reboots ? Merci et déso pour le pavé !


ma config
Proc: Ryzen 9 5900x
Carte mere : Msi mag b550 tomahawk
Mémoire: 2x32gb 3600 (18-22-22-42) corsair vengeance lpx CMK64GX4M2D3600C18
Carte graphique : Asus dual rtx 4070 super
Nvme samsung 990 2to
Nvme wd sn770 1to
ssd crucial m500 1to
Alim: MSI MPG A750GF - 750W 80+ Gold Modulaire
Bios, chipset et drivers à jour
Windows 11 a jour.
memtest revenu sans erreur
J'ai sorti la carte graphique, l'ai remise, j'ai bien vérifié le cablage.

Edit 1: après un stress test psu (alim) sur occt de 10 min, quand j'ai voulu le stopper j'ai eu un bsod et un restart et dans l'observateur d'évènement là même erreur que d'hab:
Une erreur matérielle irrécupérable s’est produite.
Composant : mémoire
Source de l’erreur : Machine Check Exception
j'ai pas eu le temps de lire le blu screen ça reboot direct mais probablement la meme erreur que plus haut.
Si OCCT plante, on peut soupçonner une alimentation défaillante. Cela voudrait dire qu'elle a du mal à tenir les tensions.

Côté températures tu es OK?
 

Danterex

Habitué
Si OCCT plante, on peut soupçonner une alimentation défaillante. Cela voudrait dire qu'elle a du mal à tenir les tensions.

Côté températures tu es OK?
Salut !
Pour OCCT j'ai refait 4 tests de 15 mins chacun de l'alim (power) aucune erreur et aucun plantage. J'ai tenté de reproduire le reboot en arrêtant le test en cours mais rien ne s'est passé.

Pour les température en jeu, 1s avant le reboot, voici ce que j'ai sur OCCT
Processeur (sans overclocking, sans undervolting, avec ventirad dark rock pro 4)
Vous devez être connecté pour voir les pièces jointes.


Carte graphique (sans overclock, sans undervolting, en mode "quiet")
Vous devez être connecté pour voir les pièces jointes.
 

Danterex

Habitué
Petite mise à jour
j'ai testé physiquement les barrettes mémoires
Les 2 barrettes (en dual A2/B2) reboot en 5 mins
1 seule barrette sur A2 ( barrette 1 aprés 20 minutes blue screen et s'éteint, Barrette 2 15 mins et reboot)
1 seule barrette sur B2 reboot aprés 5 mins
J'ai aussi tenter de mettre pcie en gen 3 mais pareil reboot.
 
Dernière édition:

magellan

Modérâleur
Staff
Petite mise à jour
j'ai testé physiquement les barrettes mémoires
Les 2 barrettes (en dual A2/B2) reboot en 5 mins
1 seule barrette sur A2 ( barrette 1 aprés 20 minutes blue screen et s'éteint, Barrette 2 15 mins et reboot)
1 seule barrette sur B2 reboot aprés 5 mins
J'ai aussi tenter de mettre pcie en gen 3 mais pareil reboot.
Ram HS ou bien paramétrage BIOS problématique. En remettant tout à zéro et en AUTO, est-ce que cela résout les soucis à ce niveau?

Côté Ram, il y a quatre possibilités d'incident.
- Ram HS
- BIOS avec overclock mal foutu/paramétrage non conforme
- Alimentation instable/défaillante
- CM problématique.

Commence par réinitialiser le BIOS côté config mémoire puis reteste histoire de voir si cela se plante.
 

Danterex

Habitué
Ram HS ou bien paramétrage BIOS problématique. En remettant tout à zéro et en AUTO, est-ce que cela résout les soucis à ce niveau?

Côté Ram, il y a quatre possibilités d'incident.
- Ram HS
- BIOS avec overclock mal foutu/paramétrage non conforme
- Alimentation instable/défaillante
- CM problématique.

Commence par réinitialiser le BIOS côté config mémoire puis reteste histoire de voir si cela se plante.
Bonjour
J'ai déjà fait un clear Cmos (plusieurs fois même)
Et j'ai test avec tout par defaut
Si c'est la ram, comment se fait il que j'ai le meme probleme avec les 2 barrettes indépendamment ?
 

magellan

Modérâleur
Staff
Bonjour
J'ai déjà fait un clear Cmos (plusieurs fois même)
Et j'ai test avec tout par defaut
Si c'est la ram, comment se fait il que j'ai le meme probleme avec les 2 barrettes indépendamment ?
Sur le même slot mémoire ou sur d'autres?
 

Danterex

Habitué
Bon, j'ai retiré les 2 barrettes, fais un clear cmos, remis les 2 barrettes et j'ai désactivé la virtualisation (svm) qui est activée automatiquement sur ma carte. Ca a l'air d'etre stable j'ai pu lancer le jeu 1h sans reboot.
Je vais tenter un xmp manuel (passer ma 3600 en 3200 avec les latences de base et 1.35v) voir si ça passe.
 

Jolerigolo

Au bûcher!
Salut,

Juste si je peux me permettre, je mettrai la CG en gaming plutôt que silent. Ton hotspot était à 91°C quand même.
 

Jolerigolo

Au bûcher!
Alors +1 pour @drul sur le hotspot ce n'est pas inquiétant du tout, certaines cartes supporte jusqu'à 105°C.
C'est juste que, amha, moins c'est chaud mieux c'est. Et là juste en basculant un réglage de ventilateur on refroidit mieux. Ça ne coûte rien et ne mange pas de pain car je ne pense pas que la différence en terme de bruit soit énorme.
 

magellan

Modérâleur
Staff
Sur le hotspot ? j'en doute
C'était une vraie question. Perso ma vieille 1070 a pris de gros coups de chaud suite à un réglage débile sur les ventilos, et effectivement je n'ai jamais eu de crash, tout au plus des soucis de performances.

D'où mon interrogation si cela peut jouer ou pas.
 

Jolerigolo

Au bûcher!
C'était une vraie question. Perso ma vieille 1070 a pris de gros coups de chaud suite à un réglage débile sur les ventilos, et effectivement je n'ai jamais eu de crash, tout au plus des soucis de performances.

D'où mon interrogation si cela peut jouer ou pas.
Normalement non. C'est comme pour le CPU, la CG réduit la cadence pour faire baisser la température.
La température maximale de fonctionnement n'est pas forcément calée sur le hotspot mais sur la partie processeur de la CG. D'ailleurs on voit bien sur le screen que le "proco" du GPU est à 75°C soit 16°C d'écart.
Perso je surveille quand même ce hotspot car s'il est élevé, cela veut dire que le reste aussi. C'est moins facile d'évacuer une grosse quantité de chaleur que de l'évacuer régulièrement par petites doses. Un hotspot très chaud peut aussi être le signe d'une backplate CG de mauvaise qualité ou d'un système d'évacuation de la chaleur mal conçu.
 
Vous devez vous inscrire ou vous connecter pour répondre ici.
Derniers messages publiés
Statistiques globales
Discussions
730 151
Messages
6 718 418
Membres
1 586 422
Dernier membre
IamGOODburger
Partager cette page
Haut