Hard freeze avec Debian Trixie sur Lenovo E585

Salut,

Celà fait un bon moment que je tournais avec une VM Debian Bookworm dans Virtualbox. Avec certains patterns, j’arrivais à bloquer le PC : lancer une compilation dans la VM et naviguer sur Firefox en même temps. Parfois, l’écran s’éteint et les leds du clavier clignote.

J’ai décidé de partir sur un dualboot en me disant que mon système serait probablement plus stable. J’ai donc installé une Debian Trixie en parallèle du Windows de base. Malheureusement, j’ai à nouveau des hard freeze même avec ce système en natif. Il suffit de lancer KiCAD ou scroller dans synaptic ou même afficher quelques courbes en Python pour bloquer tout mon système.

Mon BIOS est à jour, j’ai testé d’ajouter « idle=nomwait » dans les paramètres noyaux, j’ai tenté de désactiver le C6 du CPU, rien n’y fait. Seul un ctrl+alt+ImprEcran+R,E,I,S,U,B redémarre la bête.

Est-ce que quelqu’un sait comment débugger ce genre de choses?

Il s’agit d’un Lenovo E585 avec un Ryzen 5 2500U avec Radeon VEGA mobile GFX

D’avance merci!

Hum, pour que le PC gèle mais réponde aux magics keys, ça signifie que les process sont gelés mais pas le noyau, ou bien que xorg est dans les choux. En général c’est parce qu’il manque de mémoire ou bien un processus qui dezingue xorg. As tu du swap? quelle est la mémoire dont tu disposes?
Tu peux faire la chose suivante pour voir:

  1. Tu fais un swap temporaire:
# dd if=/dev/zero of=SWAP bs=512M count=8
# mkswap SWAP
# swapon SWAP

puis tu fais tes manips et regarde régulièrement l’état de la mémoire par exemple en executant dans une console «top» ou la commande «watch -n 1 free» (top est mieux)
Quand ça gèle, tu sauras le souci. Si la mémoire est saturée, tu auras le processus coupable. Si la mémoire n’est pas saturée, il y a un souci, ça peut être

  1. → souci hard, pas sur car tu avais un le pbm sur une VM
  2. → Fuite mémoire, un processus consomme toute la mémoire.
  3. → Rien de tout ça, dans ce cas, tu fais un Ctrl-Alt-F3 par exemple et tu devrais pouvoir te connecter. Tu dézingues un par un les processus que tu possèdes jusqu’à ce que Xorg réponde à nouveau et là tu auras ton coupable

Bonjour,
Qu’as-tu trouvé dans les logs pour commencer? est-ce que tu peux nous les logs précédents le freeze par exemple?

Concernant le swap, j’ai mis un peu plus que la RAM: 17.5Go vu que je possède 13.5Go de RAM d’après htop.

J’ai fait un premier freeze en laissant tourner htop. Le freeze arrive et htop indique 1.82Go de RAM occupée et 0Go de SWAP. Autant dire qu’il nous reste de la marge :slight_smile:

Deuxième freeze en laissant tourner nvtop. 0.32Go de VRAM occupée et le GPU tourne à 6%.

J’ai testé furmark pour stress-tester le GPU, aucun freeze …

Pendant les freeze, j’ai essayé de récupérer une console avec Ctrl-Alt-F3 mais rien à faire. Seul Ctrl-Alt-ImprEcran + R,E,I,S,U,B fonctionne, et souvent au bout de la 3ème fois que je fais la manip.

Pour le souci hard: J’ai réinstallé un WSL sous Windows en attendant (pitié, aidez moi à sortir de là :sob: ) et aucun freeze n’est apparu depuis une semaine et demi.

Voici le dernier log, généré par la commande suivante:
sudo journalctl -b -1 > log.txt
log.txt (322,0 Ko)

Salut,

Vous avez fait un memtest ?

Oui, avec les outils intégrés Lenovo: RAS. Je vais tester avec l’outils memtest pour voir j’ai des infos complémentaires.

Bon
Je dirais d’installer les firmware atheros:

mais je n’ai pas vu d’erreurs sinon. Ça a gelé après un appel de synactiv?

Les drivers sont déjà installés (firmware-atheros). Ces fichiers sont optionnels d’après ce que j’ai pu lire ici:

Oui, ça bloque après un scroll plus ou moins long dans les paquets synaptics.

Bon, est-il possible d’essayer avec une connexion filaire? Je soupconne un blocage du Wifi

Et à tout hasard en installant une stable? Ca donne quoi? En faisant bien sur autant que possible une installation standard.

Car dans tes logs, il y a pas mal d’erreurs qui concernent principalement:

at-spi2-registr
containerd
evolution-calen
fwupd
gnome-calendar
gnome-remote-de
gnome-session
gnome-session-binary
gnome-shell
gnome-software
gsd-media-keys
gsd-media-keys
gsd-sharing
gsd-usb-protect
gsd-xsettings
ntpd
org.gnome.Shell.desktop
PackageKit
polkitd
systemd
systemd
unix_chkpwd
user-session-migration
/usr/libexec/gdm-wayland-session
wireplumber

Il y a visiblement des problèmes de configuration (ntpd, fwupd, gnome-calendar) qui sont peut être aussi à clarifier.

Supprime aussi les configuration d’hibernation. Pour supprimer les erreurs qui y sont liées. Autant avoir d’abord un système opérationnel stable (autant que faire se peut avec une Trixie) avant d’aller dans des customisations diverses.configurations.