Mdstat check et gros ralentissement

Bonjour,

Sur une machine Debian/Proxmox, j’ai de temps à autre une des VM (qui joue le rôle de serveur Web, elle aussi sous debian) qui a de très très gros ralentissements !

Je note dans ce cas là, que sur la VM en question, les iowait sont très très élevés (entre 40 et 80% !!!).
Sur le serveur proxmox, je vois qu’il y a un check du disque RAID:

[code]# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md4 : active raid1 sdb4[0] sda4[1]
3884340224 blocks super 1.2 [2/2] [UU]
[==============>…] check = 73.7% (2864139968/3884340224) finish=216.8min speed=78397K/sec
bitmap: 6/29 pages [24KB], 65536KB chunk

md2 : active raid1 sdb2[1] sda2[0]
20955136 blocks super 1.2 [2/2] [UU]

unused devices:
[/code]
Sur les autres VM, vu que leur activités est marginale, rien d’anormale pour autant.

Dans un premier temps, j’aimerais savoir à quoi serve ces checks et surtout s’il est judicieux de les désactiver ou alors comment limiter leur impact (le check prend environ 18 à 20h !!!) … car le problème survient tous les mois !

Merci à vous pour votre aide

Bonjour,

Je pense qu’il s’agit d’une alerte à considérer quant à la santé des disques qui composent ta grappe RAID en miroir…

Le check est planifié régulièrement par mdadm pour vérifier que la grappe RAID est cohérente et que les disques qui la composent sont bien synchrones et la parité conforme.
Là, il a semble-t-il trouver un schmilblick et il tente la réparation automatique en pointant les secteurs défectueux par exemple, et en resynchronisant.

Et évidemment, le processus consomme des ressources machine, et donc un ralentissement général du système.

Proposition:

  • laisser terminer son action
  • analyser de façon détaillée l’état smart des disques
  • en fonction, envisager un (ou plusieurs) changement(s) de disque(s)
  • ne surtout pas désactiver le check: on ne casse pas le thermomètre !

@+

1 J'aime