Le Bar de Gandi

Accueil > Gandi > Incident du Lundi 22 Janvier

Incident du Lundi 22 Janvier

Une suite d'événements (que je pourrais qualifier d'extraordinaires) a engendré une sorte d'embouteillage dans le traitement des requêtes. Attention, je n'ai pas parlé de DDOS. Toutefois, nos équipements n'ont pas répondu comme nous l'attendions, et plus particulièrement notre base de données a montré ses limites...

Face à la réaction de certains clients mécontents (je le conçois), arguant de l'amateurisme de Gandi, je souhaiterais évoquer notre nouvelle architecture réseau qui est constituée de 3 serveurs DNS implantés sur 3 sites physiques différents reliés par une boucle optique.
Nous avions planifié une montée en charge progressive des nouveaux serveurs DNS, elle a été subite (multipliée par 60), on s'est plantés : mea culpa
A ceux qui ont parlé du manque de communication et de transparence de notre part, j'avoue être assez étonné, mais comme ce n'est pas du tout l'avis général, cela me rassure :)
Hier soir et tout au long de la nuit, au moment critique de l'incident, nous étions plus concentrés à résoudre celui-ci qu'à chercher des excuses, et c'est bien pour cela que ce matin, maintenant que tout est rentré dans l'ordre, au nom de toute l'équipe Gandi, c'est moi qui vous présente nos excuses les plus plates !

Nous avons opéré plusieurs changements afin de consolider notre plateforme, notamment passé notre base de données sous BerkeleyDB. Ceci aura une incidence sur le temps de mise à jour de vos modifications DNS, malheureusement. Il va falloir apprendre à compter en Ouzbèk un peu plus loin ;) jusqu'à 300 au pire : oui, les mises à jour de DNS pourront désormais prendre jusqu'à 5 minutes. C'est le prix à payer pour beaucoup plus de stabilité, et c'est celui qui nous a paru le plus raisonnable aujourd'hui. La bonne nouvelle, c'est la rapidité du temps de réponse, multiplié par 100.
Merci d'être conciliant avec le support qui a pris hier un nombre de requêtes très important (environ 3% de nos clients touchés par la panne) et qui va devoir se battre 2 fois plus pour rétablir un temps de réponse acceptable.

Vive le mardi :)