Suivi de la plate-forme Apinc

Aller au contenu | Aller au menu | Aller à la recherche

lundi 27 novembre 2006

Redémarrage des listes de diffusion

Suite au redémarrage des machines vendredi dernier, le service des listes de diffusion n'avaient pas été redemarré, cela vient d'être fait, tous les emails des listes de diffusion devraient donc s'écouler petit à petit (rien n'a été perdu selon le principe de la file d'attente) et le serveur de mail morfler un peu pour écouler les 17896 en attente au moment où je tapote ces mots.

Edit: Il manquait un bout de configuration pour que le service redémarre automatiquement, c'est maintenant résolu.
Update 2006-11-28 23:00 Sympa a deversé tout ses messages dans exim qui lui maintenant se voit assigner 18362 messages.
Update 2006-12-04 14h40 La situation s'est améliorée, le nombre de messages dans la queue en moyenne est redevenu plus sain, mais il ya encore des latences, des tests sont en cours pour l'installation du nouveau serveur de mail mis en baie l'autre jour.

vendredi 24 novembre 2006

Intervention mail et web

Ça aura pris un peu plus d'un mois comme je l'avais annoncé à la réunion du 20 octobre, mais le nouveau serveur de mail est en baie depuis ce matin. Il y a été mis en même temps qu'un troisième noeud web. La plateforme a une fois de plus subit le problème de la prise électrique branlante du powerswtich, mais c'était en fait celle qui était raccordée à la multiprise, ce que je n'avais pas vu la prémière fois. Tous s'est bien passé ceci mise à part, nous avons maintenant 2 machines accessible depuis l'Interne, elles sont maintenant étiquetées correctement (plus pratique pour faire des demandes de reboot) et à peu près déclarées correctement dans le powerswitch, il doit manquer une ou 2 interfaces pas à jour. Nous allons donc pouvoir progressivement passer sur le nouveau serveur de mail et faire des tests sur le 3ème noeud web pour mettre à plat la configuration et en finir avec les latences web et mail.

Edit: le serveur mysql n'a pas tellement aimé le redémarrage brutal, mat a checké/réparé pas mal de tables, mais n'hésitez pas à en faire de même (vous pouvez faire ca via le phpmyadmin) si vous constatez des problèmes sur votre site.

jeudi 23 novembre 2006

Perturbation ftp

Pour ceux qui ne l'aurait pas remarqué, le serveur ftp s'est comporté très bizarrement ce soir entre 19h et minuit. Après moultes tentatives de lui faire entendre raison, le reboot de meuleuz fut salutaire.

lundi 20 novembre 2006

Performances web dégradés

Pour information, l'un des 2 serveurs frontaux web est tombé pour une raison inconnue et on n'arrive plus à le joindre. En attendant une éventuelle intervention on tourne donc avec un seul serveur pour les sites, ce qui explique les mauvaises performances en ce moment.

Nous ne pouvons pas le redémarrer facilement pour le moment, ça devrait être fait vendredi, date de l'intervention qu'on avait prévue (et qui est maintenue, ca fera d'une pierre deux coups) pour changer le serveur de mail et rajouter un autre serveur frontal.

MAJ le 22/11/2006 à 11h55 par atmaniak :
La seconde machine a été correctement redémarrée, les performances devraient être de retour.

MAJ le 22/11/2006 à 18h par mat :
L'autre frontal, celui qui marchait encore, a commencé à faire un peu n'importe quoi vers 17h40. Il devait de toutes façons être rebooté pour prendre en compte un changement, ca a été fait sans problèmes et la situation est revenue à la normale vers 17h58. L'ajout du troisième serveur frontal vendredi devrait considérablement aider les choses.

VDS-master injoignable, suivi/mx2/jetable/irc perturbés

Je reprends ici un message posté par Stéphane dans les forums nntp :

Aux dernières nouvelles, le mx2 (qui ne fonctionnait plus ces derniers jours) et une machine qui hébergeait des serveurs virtuels ne sont plus accessibles. Cette dernière contenait le suivi qui sera re-déplacé sous peu. Le point commun entre ces 2 machines est qu'elles sont hébergées chez Ovanet, qui a semble t'il envoyé un courrier RAR le 8 novembre et n'a pas eu de réponse. Ovanet a donc décidé de couper ce matin, le 17 novembre.

Avant d'obtenir plus d'informations, en particulier sur la raison de la coupure et la suite a donner, nous avons effectué quelques modifications :

  • Le blog de suivi a été déplacé sur le cluster, ceci nous permettra de vous informer jusqu'au retour de la machine hébergeant celui-ci habituellement,
  • Un serveur mx2 temporaire a été mis en place sur une machine externe a l'infrastructure principale, ceci afin de nous assurer de ne perdre aucun email (meme au cas ou le serveur de mail souhaiterais partir en vacances)