Evolution : choix de l'outil de monitoring

Bonjour,

J’aimerai avoir vos retours sur les solutions de monitoring que vous utilisez de façon pro (ou au moins sur une architecture assez conséquente, pas juste 3/4 PCs).

Je dois migrer ma solution de monitoring sur un vrai serveur (raid 5, redondance d’alim etc… alors qu’actuellement ça tourne sur un pov’ PC de bureau avec des backup quand j’y pense).

Actuellement j’utilise Nagios, sur debian bien sûr (squeeze). Il y’a quelques années, sorti de Nagios il n’y avait pas grand chose d’open source et pro dans ce domaine. Aujourd’hui il existe plein de solutions et j’avoue que je suis un peu perdu…

J’aimerai si possible trouver une solution de monitoring avec une interface web qui permette la modification de la conf (ajout de host) (pour que mes collègues linuxophobe puissent gérer un minimum).
Si je pouvai reprendre ou migrer facilement ma conf Nagios ce serait top.
Et une prise en compte sans trop de bidouille de serveurs ESX par la config ce serait l’extase totale (je n’ai jamais réussi avec Nagios).

Sinon dans Nagios j’utilise l’alerte par mail + un module de navigateur (comme nagios checker pour le cas d’Iceweasel).

A titre indicatif Nagios gère:
430 services
13 host groups
132 hosts
Sachant que ça ne concerne pratiquement que les serveurs d’application (+ onduleurs), j’attendais d’avoir un serveur fiable pour intégrer tous les switchs, les caméras etc etc …

Merci d’avance pour vos avis éclairés :slightly_smiling:

Salut,

Centreon pourrait répondre à tes besoins.
C’est une surcouche à Nagios, donc tu ne seras pas perdu et les plugins restent les mêmes.
L’interface web te permettra d’ajouter des machines et des services en quelques clics.
Cela tourne au boulot sur une petite centaine de machine.

Sinon en voici d’autres mais pas encore testé : shinken, zabbix, zenoss

J’ai parcouru les docs d’un peu tout ça oui (centreon, Shinken, Zabbix, je vais voir Zenoss par contre, je ne connais pas), mais je voulais des retour d’utilisateurs. Parce-que sur le papier, elles font toutes jusqu’au café.

Concernant Centreon, tu n’es pas le premier à me le conseiller. Si je migre vers cette solution je pense que j’utiliserai leur moteur et broker vu que dans l’avenir ce sera leur priorité plutôt que la compatibilité avec les autres solutions.
Et ils mettent à dispo des paquets pour red hat donc je migrerai aussi vers red hat.
Pour le moment c’est la solution que j’envisage :wink:

Mais ça m’embête un peu d’avoir un serveur red hat… d’où ma demande de retours :slightly_smiling:
On ne sait jamais, j’ai peut-être raté un truc dans mes recherches.

Centreon fonctionne très bien sous Debian :wink:

Shinken fait un café avec plus d’arômes que les autres.

Moi c’est du Zabbix (en cours de migration vers la version 2, beaucoup (data center oblige :whistle: ) d’hôtes à superviser ainsi que de services différents.

Plusieurs proxy ont été mis en place mais attention à la charge du MySQL master (répliqué bien évidement pour avoir de la redondance en cas de pépin).

Pour le côté pratique l’interface d’admin remplit bien son rôle, même si elle est plutôt longue à chargé (normale vue la charge globale de supervision).
La facilité à mettre ne place de nouveau triggers et/ou items.

Nagios est parait-il de plus en plus bouder en faveur de Shinken, il doit y avoir une raison à ça :whistle:

Les différentes choses à mon idée à voir sont la réplication des données pour plus de sureté, le PRA (plan de reprise d’activité) en cas de pépin et la facilité pour le déploiement couplé à un puppet ou un chef.
La séparation des niveau de criticité des services et/ou machines à superviser selon différents proxy.
La scalabilité de la plateforme et la possibilité de mise à niveau hardware.

@clochette : L’inconvénient de zabbix, c’est que je ne peux récupérer ma configuration actuelle.
Dans l’absolu, pourquoi pas, c’est une charge de boulot monstre mais si c’est vraiment bien… le soucis se pose que si ce n’est pas le cas, ou que le projet n’évolue plus, passer à une autre solution posera à nouveau le soucis de la migration de toute la conf, problème qui ne se pose pas avec les projets qui se basent sur une même architecture de conf.
Je sais pas si je suis clair ? :confused:

@Misterfreeze : J’aime bien la documentation de Shinken et il fait ce que je veux à priori. L’inconvénient c’est que comme nagios l’ajout de host se fait directement dans les fichiers de config, perso je préfére mais c’est rédhibitoire pour mes collègues.

Le fait qu’il ne soit pas dans les dépots, ça me donne l’impression (peut-être fausse) que c’est une usine à gaz à mettre en place et à maintenir sous debian.
C’est pratiquement aussi vieux que Nagios, très utilisé, comment expliquer son absence des dépôts autrement ? :confused:

Merci de vos retour, très intéressants :slightly_smiling:
Malheureusement je ne suis pas encore fixé sur mon choix ^^
Est-ce que vous supervisez des ESX avec vos solutions ? (le serveur directement), des OS/400 ?

C’est quoi une “solution de monitoring” :question:

C’est un système (un ou plusieurs deamon) qui vérifie le fonctionnement de serveur et envoie des alerte en cas de problème (de différentes façon). Par exemple, tu as un serveur web et une base de données, la solution de monitoring est là pour vérifier que chacun fonctionne et t’envoie un mail, un sms ou change l’affichage de son interface web pour te prévenir. Quand tu as 300 serveurs c’est pratique. De plus les bons peuvent gérer des dépendances (si la base de données ne fonctionne pas inutile de dire que le site web non plus). Il est aussi capable de vérifier des équipement (pour vérifier qu’un routeur fonctionne par exemple).

Souvent on retrouve 2 éléments, les sondes qui vérifient l’état de quelque chose (la consommations mémoire, le fait qu’un programme est lancé, etc).

[quote=“Blacksad”]@clochette : L’inconvénient de zabbix, c’est que je ne peux récupérer ma configuration actuelle.
Dans l’absolu, pourquoi pas, c’est une charge de boulot monstre mais si c’est vraiment bien… le soucis se pose que si ce n’est pas le cas, ou que le projet n’évolue plus, passer à une autre solution posera à nouveau le soucis de la migration de toute la conf, problème qui ne se pose pas avec les projets qui se basent sur une même architecture de conf.
Je sais pas si je suis clair ? :/[/quote]

Effectivement il y a du travail à prévoir si tu change de solution, je pense que l’adaptation après un passage à Shniken serait moindre.

La pérennité de Zabbix est à mon avis assuré pour encore pas mal de temps malgré tout, mais lorsque je vois le travail pour la migration en version 2 j’imagine bien la masse de travail à fournir pour tous remettre en place.

C’est avant tout un retour d’expérience d’utilisateur sur Zabbix que je t’apporte, ni plus ni moins :wink:

[quote=“Blacksad”]Merci de vos retour, très intéressants :slightly_smiling:
Malheureusement je ne suis pas encore fixé sur mon choix ^^
Est-ce que vous supervisez des ESX avec vos solutions ? (le serveur directement), des OS/400 ?[/quote]

Nous n’avons pas d’AS/400 en place, surement du côté ‘Housing’ mais nous n’avons pas de monitoring de notre côté pour ça …

Pour ce qui est de superviser de l’ESX ce doit êtres faisable via SNMP il me semble (je pas sûr de moi par contre).

Toujours est-il que l’on supervise même des switch et des APC ainsi que des routeur et des firewall avec Zabbix.
Ils ont un Forum et un canal IRC bien fréquenté et pas mal de documentation maintenant.

C’est un système (un ou plusieurs deamon) qui vérifie le fonctionnement de serveur et envoie des alerte en cas de problème (de différentes façon). Par exemple, tu as un serveur web et une base de données, la solution de monitoring est là pour vérifier que chacun fonctionne et t’envoie un mail, un sms ou change l’affichage de son interface web pour te prévenir. Quand tu as 300 serveurs c’est pratique. De plus les bons peuvent gérer des dépendances (si la base de données ne fonctionne pas inutile de dire que le site web non plus). Il est aussi capable de vérifier des équipement (pour vérifier qu’un routeur fonctionne par exemple).

Souvent on retrouve 2 éléments, les sondes qui vérifient l’état de quelque chose (la consommations mémoire, le fait qu’un programme est lancé, etc).[/quote]

OK, en somme, c’est un système de surveillance, quoi !

Oui.

[quote=“Clochette”]
C’est avant tout un retour d’expérience d’utilisateur sur Zabbix que je t’apporte, ni plus ni moins :wink: [/quote]
Et je t’en remercie, c’était bien le but du topic. C’est un sujet rarement abordé ici et ça peut être utile à d’autre. Pour une personne qui débute en supervision l’intérêt de zabbix est tout autre, il n’a pas la même problématique donc ton retour est intéressant.