Suivi de la plate-forme Apinc

Aller au contenu | Aller au menu | Aller à la recherche

mardi 27 mars 2007

Le retour du FTP anonyme

Ca n'a l'air de rien... et pourtant !

Après le retour des statistiques Web... Le retour du serveur FTP anonyme pour vos fichiers !

N'hesitez pas à contacter les administrateurs si vous voulez en profiter et mettre des fichiers a disposition du monde entier sur le serveur FTP anonyme.

C'est surtout un bon reflexe de mettre les (gros) fichiers a disposition par FTP, le protocole HTTP n'étant pas vraiment optimisé pour le transfert de longs fichiers.

lundi 26 mars 2007

Le retour des stats !

Sacre titre, n'est-ce pas.

Elles se sont echapees il y'a maintenant quelques mois, avec le disque dur de trackteur (l'ancien repartisseur de charge).

Petit resume pour ceux qui n'ont pas suivi :

  • Lors du remplacement de Trackteur par Meuleuz, les scripts generant les statistiques ont ete perdus.
  • Le traffic est tel, que nous avons du mettre en place une rotation des logs par heure, pour permettre a webdruid d'analyser ces derniers (il ne supporte pas les logs de plus de 2Go).

Depuis quelques jours, avec l'arrivee du printemps, l'envie de coder est de retour (bah oui), et du coup un petit script a vu le jour pour analyser les logs qui patientent sagement depuis debut octobre 2006.

Tout ca pour dire que les statistiques sont en train de se mettre a jour et devraient arriver sous peu (tout est relatif, il y'a 34 Go de logs a analyser) :p

mercredi 21 mars 2007

Intervention(s) du jour

Vous avez pu le voir ce midi, la plateforme a eu quelques soucis a cause d'un cable d'alimentation mal branché. Une petite coupure a donc eu lieu, mais tout est rentré bien vite a la normale.

Nous travaillons maintenant sur le serveur de base de données, afin d'améliorer les performances de celui-ci. Quelques coupures sont à prévoir dans la demi-heure a venir.

MAJ 19h00 : Le MySQL est de retour, l'intervention est terminée.

MAJ 22/03 08h49 : Les graphiques de charge MySQL sont aussi de retour, une petite erreur s'est glissee dans un fichier de configuration. Pareil pour les backups de vos bases.

vendredi 9 mars 2007

Problèmes divers ce soir

Ce soir la machine nous servant de passerelle a eu des ratés. On n'est pas encore trop sur de pourquoi, mais elle s'est mise à être très chargée, au point de ne plus répondre en mysql (cassant le site d'apinc, le suivi et le wiki d'aide) et news (cassant le forum). Nous avons du la rebooter vers minuit, cassant tout accès web pour de bon pendant quelques dizaines de minutes. La situation a fini par se stabiliser vers 00h50.

Edit 10/03/07 21:18: A cause d'un oubli dans la configuration, après ce redémarrage, les frontaux web ne pouvaient plus charger de données depuis l'extérieur. C'est maintenant corrigé.

mardi 6 mars 2007

Ménage sympa

Le service des listes de diffusion est déporté depuis le serveur de mail sur une autre machine, ce qui occasione des effets de bords sympas des fois avec l'ancienne configuration, comme hier soir où 40 000 bounces faisaient des rebonds avec quelques autres serveurs extérieurs. Le ménage a été fait ce matin et les serveurs concernés ont été temporairement filtrés.

dimanche 4 mars 2007

Lenteurs de la plate-forme et problèmes d'accès au SQL

Depuis quelques jours le SQL se portait mal, complètement assommé sous la masse de requêtes énormes et pas du tout optimisées, mais depuis minuit la situation a empiré et il est devenu quasiment impossible de se logguer dessus (pour vous comme pour nous). Cela entraîne des lenteurs sur toute la plate-forme, les serveurs frontaux passant leur temps à attendre le SQL. Nous essayons de résoudre le problème, mais il va falloir s'armer de patience.

J'en profite pour rappeler que même si nous avons prévu d'ajouter du matériel pour contrer les problèmes rencontrés avec le SQL, ca ne pourra pas se faire de suite et de toutes manières aucun ajout de matériel ne remplacera une prise de conscience parmi les membres : mettez vos scripts à jour, optimisez vos requêtes (utilisez des indexes, moins de conditions, limitez plus les résultats, faites des EXPLAIN sur chaque requête pour comprendre ses implications, etc), c'est le seul moyen de vraiment lutter efficacement contre les lenteurs. Nous allons par ailleurs probablement devoir devenir moins tolérants envers les sites dont les requêtes contribuent au ralentissement des serveurs (et en tout cas nous allons tenter de les contacter au plus vite pour les inciter à corriger leurs applications).

Edit 23:41: Nous avons finalement pu redémarrer le serveur, la situation revient petit à petit à la normale, nous continuons à surveiller la situation.