Explication de la panne qui a duré 4 heures
Par Nicolas le jeudi 2 juillet 2009, 15:40 - Hébergement - Lien permanent
Chers Clients,
Comme certains d'entre vous ont pu le constater, nous avons subi une panne de 11h30 à 15h30 environ aujourd'hui.
Le gestionnaire en charge du datacentre dans lequel est hébergée l'une de nos salles machines a fait effectuer une maintenance sur un équipement électrique. Une erreur humaine du prestataire a fait que l'ensemble du datacentre s'est retrouvé privé d'électricité pendant quelques minutes. La panne a impacté de nombreux acteurs sur internet (Dailymotion, SkyBlog, Pixmania...), dont une partie de nos clients.
Le système de basculement automatique s'est normalement opéré de cette salle vers une autre de nos salles, jusqu'à une certaine limite malheureusement atteinte assez rapidement. Les raisons sont multiples : panne de grande ampleur très rarement constatée, choix d'une montée en charge progressive des autres salles au lieu de les remplir d'un coup, processus de relance des serveurs perfectible, succès énorme de notre opération de test gratuit, bref, un enchaînement de choses qui ont causé cette coupure pour certains d'entre vous.
Il va sans dire que ce qui est de notre responsabilité sera revu, avec par exemple, un remplissage plus rapide des autres salles (l'opération de promotion sur l'hébergement nous y aide grandement), le script de relance déjà en cours d'optimisation (dans le cas où les dieux de l'électricité ou le prestataire du datacentre nous en voudraient encore).
Il est également évident que nous vous remboursons cette journée et sommes à votre écoute pour toute demande complémentaire. Nous allons ajouter un jour à la date de validité à l'ensemble des ressources affectées, dans le courant de la journée.
Nous vous prions d'accepter nos excuses pour la gêne occasionnée, et travaillons pour que la montée en charge de notre infrastructure soit à la fois performante et maîtrisée, pour que vous puissiez TOUS profiter de notre technologie.
Note technique : Dans le cas d'un serveur en mode gandi AI, si votre serveur répond mais qu'un des services (web, ftp..) ne fonctionneme pas correctement, un redémarrage via l'interface Gandi règle le problème. Dans le cas d'un serveur en mode expert, vous vous conseillons d'activer la console sur votre compte afin de lancer une commande fsck sur vos disques.















Commentaires
notre serveur est toujours down. Fsck en cours d'après vos explication. Est ce que nous risquons de perdre des données?
Notre serveur est toujours en panne à 16h13.
Pareil pour nous, aucun de nos domaines ne fonctionne.
Slim Amamou: votre serveur a effectivement besoin d'un fsck, vous êtes en mode expert, pour accélérer les choses, je vous conseille de vous identifier via la console de secours (activable dans votre interface) et de lancer un fsck manuel
inkwelcome: j'ai effectué un redémarrage de votre serveur via l'interface, le serveur est de nouveau opérationnel. Votre serveur était bloqué sur le fsck automatique
TEKNEO: j'effectue la même manipulation sur votre serveur
le site est HS ainsi que le serveur. merci de nous communiquer un délai pour un retour à la normal.
Merci
TEKNEO: c'est ok pour vous aussi
Bonjour,
Il en est de même pour mon serveur, je suis en mode AI Gandi, et celui ci ne fonctionne toujours pas
Merci
92.243.12.118 toujours en panne également
Bonjour,
Pareil pour moi, plus rien ne marche...
Merci d'avance!
Idem, aucun de nos domaines ne fonctionne.
Pareil ici 217.70.188.202
Merci.
Je ne trouve pas le bouton.
Slim: Configuration système => console =>modifier
Les autres: nous allons passer sur tous les serveurs Gandi AI dans quelques minutes.
Notre site est HS depuis midi
Nous n'avons aucune information relative au redémarrage du serveur en panne
Merci de votre retour asap
j'ai avec difficulté etient puis redémarrer le serveur depuis gandi AI sans succès. mon client est très mécontent, aidez moi !!!
Bonjour,
Je passe sur tous les serveurs pour demarrer les services.
D'ici 25 minutes, tout le monde devrait avoir récupéré son site.
Les scripts de lancement sont déjà optimisés.
On va se pencher rapidement sur ce bug GandiAI.
Il reste beaucoup de travail, mais comptez sur nous pour le faire bien mieux cette fois-ci.
+1 (comme on dit dans les forums !)
J'ai deux serveurs. Le premier était en panne ce matin suite à la coupure et il est revenu. Par contre, le second (92.243.10.42) fonctionnait très bien mais plus maintenant ! (Plus précisément, je peux y accéder en ssh ou ftp mais pas en http).
Pareil sous AI , 92.243.14.240 FTP OK , PING OK mais les domaines ne ping pas...merci ca fait quand meme depuis 11H30
@Manu: votre serveur apache2 ne démarre pas car un virtualhost est défini dans la configuration mais les données ne sont pas disponibles sur votre disque de donnée : www.live* .
Pas facile la vraie redondance
@bibi: Le serveur apache2 tourne dans votre machine virtuelle maintenant.
Bonjour,
mon serveur 92.243.15.70 ne fonctionne pas non plus. Je viens de le redémarrer dans Gandi AI et le statut affiche "ok" pourtant.
Merci de votre aide, dure journée !
Merci , ca tourne , la bonne soirée à l'équipe, kenavo
c'est bon. ça marche.
Bonjour j 'ai appele le support car ma machine etant affecte ( qui maintenant fonctionne) , le module rewrite ne fonctionne pas .... Et un de vos techniciens m a indique que ca devait etre resolu avant 17 h hors malheuresement toujours pas.... ip de la machine 217.70.188.18 Merci de me tenir au courant le plus rapidement possible merci....
@aegiap : je ne sais pas d'où venaient ces virtualhosts (qui sont sur un autre serveur). Peut-être d'une ancienne configuration ou peut-être la configuration n'avait-elle pas été changée depuis longtemps. En tout cas, j'ai fais les modifs, redémarré le serveur et maintenant c'est ok !
Merci.
92.243.18.72 ne pinge toujours pas... la console gandi dit OK
Merci de nous avoir tenu au courant et permis par là de négocier cette panne au mieux sans inquiétude.
J'ai redémarré le serveur et ça ne marche toujours pas...
pas d'acces FTP que faire ?
Idem. J'arrive à pinger mon serveur (92.243.11.86) mais aucun moyen de m'y connecter (22 et 80 y étaient ouvert normalement).
Benoit: On a trouvé et corrigé (juste avant de voir la VM rebooter sous nos pieds d'ailleurs
)
Reda: J'ai redémarré le service FTP et ça devrait être bon maintenant.
Fstephany: Vous êtes en mode expert, que dit la console?
@florent: je vous confirme que le machine virtuelle (217.70.188.18) réponds correctement maintenant.
Bonsoir,
Toujours pas d'accès à mon serveur depuis 16H30
92.243.6.108
Merci
Sebastien
Bonjour, le site est visible mais pas d'accès FTP, j'ai redemander tous les services
@Laura: Merci beaucoup !
Bon courage pour la fin !
@Laura
J'ai pu redémarrer le serveur SSH avec la console, bizarre qu'il ne se soit pas lancé tout seul au reboot.
Merci pour les réponses rapides et bon courage !
Toujours aucun mail. nos clients et fournisseurs nous contactent pour nous dire que tous les mails qu'ils nous adressent leur reviennent. ces mails son'ils définitivement perdus ?
Edmond ARBONNIER
Merci
Bonjour
ici 92.243.7.142, apres 2 redémarrages gandi AI a la main, le service FTP ne veut toujours rien savoir. Un petit coup de main ?
Merci d'avance
seb219: Je vous ferai la même réponse qu'à fstephany: comme vous êtes en mode expert, il faudrait que vous vérifiiez l'état de votre serveur par la console.
fstephany: Les mystères de l'informatique...
ARBONNIER: Est-ce qu'il s'agit d'un serveur hébergé? Si c'est bien le cas, j'aurais besoin de votre adresse IP pour en dire plus. Dans le cas contraire, je vous conseille de passer par le support, qui pourra suivre correctement votre situation.
David: Réparé.
Explication de la panne qui a duré 4 heures... pourquoi parler au passé ???? Nous sommes TOUJOURS à 19H40 sans mails et sans informations quant à une reprise éventuelle de services. Merci de faire l'effort de nous répondre en nous donnant une visibilité de reprise !!!!
edmond.arbonnier@imagin-action.fr
Je ne comprends rien à votre jargon de technicien et les Fzcg BH B12 du serveur du machin ne m'aident en rien. Merci de transmettre ma demande à des humains qui parlent le français. A vous de rétablir.
David dit Réparé ???? qui est ce et d'où tient t'il cette information ?
Pour M. Arbonnier et les autres :
- Aller à https://www.gandi.net/admin/hosting...
- cliquer sur le serveur impacté
- relever l'adresse ip en haut à droite
- donner l'IP ici ou (mieux ?) envoyer un mail au support technique par ce formulaire : https://www.gandi.net/faq/form_cont...
Question à Gandi : quand il y a un problème touchant autant de personne, vaut-il mieux faire un ticket sur le support et/ou en parler ici ? Cela n'encombre-t-il pas les tickets résultant d'autres problèmes (plus spécifiques) ?
Pour ma part mes deux serveurs ont a été migrés sans difficultés, semble-t-il.
La panne éléctrique est réparée, mais les effets secondaires restent encore, eux, à réparer à la main.
Si votre problème ne concerne pas l'incident hébergement dont il est question ici, il vous faut passer par le support: https://www.gandi.net/faq/form_cont...
Ils sauront vous poser les questions idoines pour identifier l'origine du problème.
FLV: D'une manière générale, c'est mieux de passer par le support. Même si ça ralentit effectivement un peu les autres opérations support, ça permet d'avoir un suivi du ticket... et d'éviter de travailler à plusieurs sur le même et de se marcher sur les pieds.
Après, évidemment, on surveille les commentaires aussi, mais il vaut mieux des tickets.
Laurent Raufaste : un certain nombre d'entre vous n'ont même pas remarqué l'incident, donc oui ça marche correctement. Clairement la prochaine étape n'est qu'une question de déploiement et je regrette que cela nous soit arrivé pile à ce moment là.
Comme je l'ai expliqué, nous avons voulu contrôler notre montée en puissance, et clairement celle-ci me permet de dire que cette redondance sera une réalité pour la totalité d'entre vous à un tarif grand public dans les mois qui viennent.
De la lecture sinon : http://www.lefigaro.fr/hightech/2009/07/02/01007-20090702ARTFIG00463-dailymotion-victime-d-une-coupure-de-courant-.php
Dîte on se fais une bouffe ensemble et on fais une note de frais pour equinix ?
Yann : C'est en cours, mais Equinix et son DG France ont toute ma confiance jusqu'à nouvel ordre, et je suis certain qu'ils vont nous offrir cette journée noire. L'incident est le fait d'un prestataire extérieur si j'ai bien compris.
Pour la bouffe quand vous voulez
Si l'histoire de l'électricien qui met son tournevis dans la prise et échappe de justesse à la mort vous est servie, c'est du réchauffé mais c'est tellement joliment raconté
impossible de me connecter en ftp pour le mettre à jour
Nostra: Et voilà, c'est corrigé.
Comme toujours, support Gandi rapide et précis, rien a redire...
On pardonne la panne temporaire
J'avoue, à cette heure-ci, c'est surtout un coup de chance que je sois passée dans le coin juste au bon moment.
Idem de mon côté, je viens d'envoyer un mail au support, mais peut être que par chance mon problème sera traité plus rapidement d'ici... Bref, mon serveur adoré est planté, et je crains un crash de données lié à la coupure d'électricité. Serait-il possible d'avoir plus d'informations à ce propos ?
Merci
IP du serveur : 92.243.12.253
Bonjour,
depuis hier :
- plus d'accés à un de mes sites (Database Error: Unable to connect to the database:Could not connect to MySQL), seulement à quelques pages html independantes.
- Accés à un autre site (vitual Host) ok
- Plus d'acces en FTP à aucun des 2 sites, tentative de reboot sans resultat,
- actuellement tentative de création d'un nouvel utilisateur proFTP mais opération en cours depuis plus d'une demi heure... et bloquée.
Que faire ?
Stéphane. IP : 92.243.17.168
Nous ne comprenons rien à votre langage technique et nos pb persistent.
Rien n'est réparé !!!! La procédure que vous mettez au N°46 ne résoud rien car aucun serveur ne figure. Alors que faire !!!
Mais de grace halte aux expliactions à la 2DR2 nous ne sommes pas des techniciens.
Tel : ** ** ** ** **
@ARBONNIER : tu te trompes de numéro de série. C'est pas 2DR2 mais R2D2, peut être que ça explique la persistance des problèmes sur ton serveur
Comme quoi, ceux qui ont quitté Redbus [1] suite aux incidents électriques de 2006 (février et mars) constatent que ce n'est pas forcement mieux ailleurs.
Enfin moi je suis content, mon serveur affiche toujours 72j d'uptime, donc je n'ai pas été touché !
[1] http://fr.wikipedia.org/wiki/Redbus
ARBONNIER: si vous avez fait une demande au support, vous allez recevoir une réponse rapidement, sinon je vous invite à le faire et détaillant votre problème
Nicolas: il ne faut pas comparer ce qui ne l'est pas. Là, c'est une erreur humaine
RedBus c'était une erreur commerciale à l'époque avec trop de machine pour la capacité du centre et une infra pas au top. Equinix est un datacenter récent avec une conception "state of the art".
Arbonnier : Une adresse IP du langage technique ... je ne sais pas quels sont vos services, mais quand je loue une voiture, n'étant pas mécanicien, je sais quand même à quoi correspond une plaque d'immatriculation, ou si elle utilise de l'essence ou du diesel.
Je ne fais pas partie de l'équipe Gandi, je tente juste d'aider. Mais si votre serveur ne figure pas dans la liste des serveurs, hé bien ... peut être n'avez-vous tout simplement pas de serveur ?
(Au passage, définition d'une adresse IP, première phrase : http://fr.wikipedia.org/wiki/Adress... )
@madac : votre commentaire est passé au filtre des indésirables (vilain filtre), votre serveur ping correctement et répond sur le http, je suppose que tout est rentré dans l'ordre.
@Arbonnier : problème de domaine et non de serveur. On a bien reçu votre ticket au support.
Y a t'il une nouvelle panne, j'ai plus accès à mon blog?