Reboot aléatoire Debian 11.7

Bonjour tout le monde :),

Je vous sollicite car je rencontre un soucis depuis un long moment avec un Mini Server HomeMade que j’ai ( sujet posté également sur un autre Forum Reboot intempestif non identifié - Debian 11).

Config :

11th Gen Intel(R) Core™ i5-11600K ( j’avais un i7 4790 avant que j’ai changé pensant que c’était lui le PB)
Quadro P2000
16 GB DDR4
1 SSD 2.5
2x3TO WD
1x10 To Toshiba
Debian 11.7

J’ai sur mon serveur des applications Plex/Nextcloud principalement et d’autre petites qui consommes peu.

Mon serveur pour je ne sais quel raison redémarre ou s’arrête sans redémarrer ( première fois aujourd’hui ) sans que je ne puisse expliqué la raison.
J’ai vérifié le Syslog et je ne vois rien de parlant sur l’arrêt.

Ce que j’ai fait depuis le début :

  • réinstallé entièrement le système
  • Changé d’onduleur ( avec le nouveau le peux vérifier a puissance utilisé, je ne dépasse pas les 130 w pour une alimentation de 350 w)
  • Changé de carte mère / proc / mémoire
  • Ajouté une P400 pour soulager le Proc avec Plex
  • Je monitor la température et je ne dépasse pas les 75 degrés avant coupure
  • changé de boîtier pour un plus grand
  • changé de ventirad

souvent quand la coupure se produit c’est durant mon process de backup avec duplicati.

  • J’ai passé duplicati en Docker en limitant les CPU → toujours pareil
  • J’avais tenté avant de passer en docker avec CPU limite → toujours pareil

je n’ai plus d’idée, enfin si il me reste juste l’alimentation mais je me dis que l’alimentation c’est tout ou rien …

Si vous avez des pistes … je vous remercie par avance

Bonjour et bienvenue sur le forum,

Ah, bienvenue au club, j’ai aussi un serveur qui fait pareil, par contre, il redémarre à chaque fois.
La machine est sous Debian 10 et a une configuration un peu plus légère car elle ne me sert que de serveur de stockage.

Tu veux dire que tu ne vois pas la cause du redémarrage (mais tout se ferme proprement) ou que tu ne vois pas le processus de redémarrage (comme si quelqu’un avait appuyé sur le bouton reset) ?

Bonjour

C’est très élevé comme température, je pense que c’est ça qui cause les reboot.
Il faudrait dépoussiérer si besoin
Vérifier que ventilo du proc tourne correctement
Éventuellement changer la pate thermique

Salut,
Cross-posting: Reboot intempestif non identifié - Forum-Debian.fr

:wink:

Bonjour et merci pour la réponse, dans mon cas, je ne vois pas ce qui aurais pu causer l’arrêt, rien ne s’arrête correctement, c’est comme un arrêt brutal à première vue.

Merci pour la répons :slight_smile: , 75 degrés c’est quand il fait du cryptage de données avec duplicati je me dit que c’est cohérent? surtout que ce sont des pic pas de façon constante. en usage normal il tourne autour des 35-40°.
j’ai tout changé/nettoyé il y a 2 semaine :’(

Oui pardon petite correction :slight_smile:

Ah, c’est donc exactement le même problème alors que ce n’est pas le même matériel, pas la même version de Debian et pas le même usage.

Vu que le ventirad a été changé, je pense qu’il a été apporté le soin de changer la pâte thermique (j’espère) et d’enlever les éventuelles poussières qui pourraient réduire grandement l’efficacité (j’ose espérer).

« Chiffrement », pas « cryptage ».
D’après les spécifications du constructeur, il semble que ce modèle accepte une température de jonction maximale de 100 °C. Si tu surveilles bien le capteur de la jonction, tu es dans la plage acceptable. Dans le doute, tu peux éventuellement songer à configurer la régulation du ventilateur pour qu’il soit à fond à une température plus faible, il faudra supporter un bruit de ventilateur plus important, mais tu sauras au moins si ça vient ou pas de la température.
Pour ma part, le processeur de la machine accepte jusqu’à 105 °C, mais je ne dépasse pas les 50 °C (en été) et a un refroidissement passif.

SI c’est juste ponctuel alors ça va.
Essaie de remettre le BIOS dans sa configuration par défaut
Vérifie aussi ta RAM avec Memtest

1 J'aime

Merci pour la réponse , effectivement petite erreur c’est du chiffrement. Ça me rassure un petit peu de ne pas être le seul avec ce soucis quand même.
De retour a la maison j’ai repassé le bios par défaut et j’ai fait la modification pour que les Ventilo soit au max, tout le temps.
Effectivement sa ronronne plus.
j’ai lancé une sauvegarde et quelques minutes après il avait redémarré avec la dernière température enregistrée a 72° pendant le chiffrement.
Pas d’erreur sur le même test.

Et dans Debian il n’y aurait pas un paramètre qui mettrait en sécurité le système,? Au dessus d’une certaine température ?

Normalement, c’est la responsabilité du logiciel de la carte mère ou du processeur lui-même. Il y a peut-être un service qu’on peut installer qui prend des dispositions en cas de température élevée, mais il ne me semble pas que la coupure du système soit la première disposition en cas de surchauffe.

Bonjour,
J’ai « résolu » mon problème si je peux dire ça. J’ai changé de soft pour la sauvegarde et le chiffrement des mes données Duplicati → Duplicacy et avec le nouveau plus aucun rebout depuis 6 jours. je vais le garder bien que payant mais je suis tranquille.
Peut être une mauvaise gestion de Duplicati ou un sous processus qui lancerai de reboot ? …

Ah, si le problème est résolu, pense à marquer un message comme solution.
Je me dis qu’il y a probablement d’autres logiciels de sauvegarde que Duplicati et Duplicacy, mais je n’en connais pas. J’utilise rdiff-backup, mais il semble que ton cahier des charges sur les sauvegarde ne corresponde pas au mien, je ne peux donc pas te le recommander.

Bonjour, finalement ce n’était pas vraiment le fautif, le frai fautif était l’alimentation.
Le ventilateur était défectueux et se mettait en sécurité ( le ventilateur était bloqué … ).
s’était le seul composant que je n’avais pas changé et dans lequel j’avais confiance : Corsaire VS350