Explications de la panne Hébergement du 18 octobre
Par Stephan le lundi 18 octobre 2010, 13:26 - Hébergement - Lien permanent
Permettez-moi, tout d'abord, de rappeler que notre plateforme n'a pas connu d'incident technique important depuis très longtemps. Depuis la bêta d'ailleurs. Et vous savez quoi ? C'est toujours le cas.
Je m'explique : que faites-vous lorsque tout va bien et que vous avancez pas à pas vers une vraie et belle réussite ?
Et bien chez Gandi, nous avons eu envie de nous tirer une balle dans le pied. C'est tellement plus marrant lorsque nous causons nos propres soucis ! Rien de mieux pour pimenter notre vie, non ?
Gandi est une boite humaine, et ceci jusqu'au bout de la définition du mot "humain".
Nous sommes par définition des êtres imparfaits, et justement, là, on va dire que l'un d'entre nous l'a démontré clairement.
Oui, le redémarrage des serveurs est une erreur humaine regrettable, mais il n'y a rien, pas même les procédures de contrôle et de validation pourtant mises en place, que je ne puisse faire maintenant pour y remédier. On a certes pas un Kerviel dans l'équipe, et les conséquences ne sont pas les mêmes, mais pour moi, pour nous, pour vous, c'est inacceptable.
Au moment où j'écris ces lignes, je ne sais pas encore qui exactement est directement concerné. Il y a plus urgent à faire, comme par exemple tout remettre en ordre et communiquer sur le sujet de manière transparente.
Je ne sais d'ailleurs pas si cela est important de le savoir. Je ne sais pas exactement ce que sera notre réaction par rapport à cela. Nous verrons en fonction de tous les paramètres. C'est juste rageant, parce que nous sommes fiers de notre plateforme, et que nous ne supportons pas de vous avoir déçus. Mais nous nous rattraperons. Au centuple !
Bien évidemment, la journée d'hébergement est pour lui nous, et nous regarderons au cas par cas pour aller au delà si la situation le justifie.
Et dire que nous allions annoncer de grandes choses au niveau hébergement ... on va attendre un peu alors ;(















Commentaires
Le "traitre" n'a pas fait perdre 5 milliards, heureusement, mais plus de 2 heures de service quand même. Alors que je rageais de ne pas pouvoir accéder à ma gestion commerciale en ligne, je me suis quand même dit "bon, au moins on sait ce qu'il se passe, et de mémoire c'est la première fois que ça arrive..."
zut... et moi qui pensais que c'etait une mise a jour de la nouvelle version de gandi...
erf...
aller les gars, vous inquiétez pas, c'est pas la fin du monde. une erreur est vite arrivée...
courage ^^
et buvez pas trop de kawa :D
VIVE GANDI, et merci pour la transparence ;)!
Plus d'essence, plus d'hébergement... c'est pas ma semaine
Force est de reconnaitre que c'est la première fois que cela arrive (de mémoire) et au moins on est tenu au courant. ça ne réduit pas le préjudice, mais c'est rassurant quand même.
zut... et moi qui pensais que c'etait une mise a jour de la nouvelle version de gandi...
erf...
aller les gars, vous inquiétez pas, c'est pas la fin du monde. une erreur est vite arrivée...
courage ^^
et buvez pas trop de kawa :D
Ce qui est regrettable, c'est que nous ayons choisi cette plateforme pour son caractère redimensionnable à souhait, c'est-à-dire dans une optique de haute disponibilité.
Nous avons porté notre choix sur cet hébergement cloud car en installant des scripts hébergés sur cette plateforme chez nos clients, nous savions que la haute disponibilité était cruciale.
Aujourd'hui, nous avons bloqué 240 sites clients dans le monde entier dont certains affichent 300.000 pages/mois...
Un mea culpa ne résout malheureusement rien.
V. Prosper, DG Ecogito
Merci de nous avoir tenu informé.
Et bon courage pour les redémarrages!
Merci pour la transparence.
J'espère que le problème ne durera pas trop longtemps et sera sans concéquences.
Courage.
merci pour la transparence, l'erreur est humaine !
Hier soir, je lisais un tweet qui invitait tous les serveurs Apache à faire grève à leur tour.
Je me suis dit à voix basse qu'effectivement ça serait une belle pagaille...
J'en aie rêvé, Gandi l'a (presque) fait
Continuez, on vous soutient, même si, loi de Murphy oblige, mes serveurs seront les 2 derniers à être redémarrés....
La page d'administration affiche serveur "up" et 64 opérations en cours (!). Mais ça ne marche pas...
Que faut il faire ?
Merci
Merci pour votre honneteté. Au moins, on sait que ce qui se passe, c'est moins stressant..
Bon courage.
Heureux de voir que Gandi reste une boîte humaine avec ses avantages et ses inconvénients. Le plus important dans ces cas là reste à mes yeux une transparence totale au niveau des temps de rétablissements.
Bon courage pour les derniers serveurs (dont le miens fait parti :))...
Coucou,
C'est un poil pénible d'avoir son serveur indisponible mais être tenu au courant, ça n'a pas de prix...
Ne fouettez pas le fautif trop fort quand même
Bon courage
j'ai paniqué un poil, surtout après une bourde de ma part hier qui avait fait sauter mon site ^^. enfin si la journée d'hébergement est pour le bourdeux... ça va lui faire cher! Tout ça pour s'être pris les pieds dans une prise je parie XD.
enfin bon courage à tous! vous faites un sacré bon boulot!
Bonjour,
Certains serveurs transitent par le réseau Gandi depuis plus d'un an pour son excellent peering d'avec FT. Même si certains de mes clients restent encore dans le noir (pas d'accès ssh), j'apprécie la transparence que j'applique également à la société que je gère.
Par ailleurs, cette offre de non paiement de la journée n'est pas "automatique", même pour des partenaires (certains n'ont probablement pas même signé de contrats SLA avec Gandi); alors je vous remercie pour la charte de qualité qui m'a incité, il y a un an, à solliciter un rapprochement pour la raison que j'ai évoquée plus haut. Je n'en suis pas déçu (même si je viens d'avoir une bonne montée d'adrénaline).
Bonne continuation.
Cordialement,
François ACHARD
C'est pas la fin du monde, y a plus grave dans la vie.
Bon courage les gars.
j'ai paniqué un poil, surtout après une bourde de ma part hier qui avait fait sauter mon site ^^. enfin si la journée d'hébergement est pour le bourdeux... ça va lui faire cher! Tout ça pour s'être pris les pieds dans une prise je parie XD.
enfin bon courage à tous! vous faites un sacré bon boulot!
Les erreurs ca arrivent...
Mais... dommage pour moi, car j'ai un client qui a fait 700km pour faire une démo à des journalistes d'une nouvelle version de son site. RDV à 14h30, et à cette heure toujours rien....
Reste à espérer qu'avec des petits fours et quelques verres ils patienteront....
Courage les gars, et merci pour la transparence.
Bonjour,
La transparence est déjà une qualité qui manque cruellement ailleurs, donc je ne peux que vous 'féliciter', sans non plus m'en faire rougir les mains.
Cdlt.
Bonjour,
Merci pour votre transparence en effet.
Je tenais à signaler qu'actuellement, même si mon serveur et donc par la même mon serveur virtuel est revenu depuis 1 heure, phpmyadmin n'est toujours pas accessible (via http).
Par ailleurs, le site http/ftp connait des moments de black out réguliers depuis que le serveur est revenu.
Merci pour la transparence
Mille fois préférable à tout le reste.
Z'inquiétez pas les z'amis, z'ai pratiqué OVH avec ses 2 reboot quotidiens !
Z'êtes des z'amours et des rois de l'uptime et tapez pas trop fort sur Kerviel avec tout le pognon qu'il doit déjà !
(ps : offrez quand même un tee-shirt au 7000ème reboot, il doit se sentir bien seul !)
Merci de votre caractère attentionné , je dois dire qu'une fois n'est pas coutume et je vous souhaite bon courage.
Je rejoins totalement le commentaire d'ecogito. Je me réjouissais également de la haute disponibilité dont jouissaient nos serveurs.
Nous sommes en train de quitter progressivement les serveurs physiques, sensibles aux pannes physiques, au bénéfice des serveurs virtuels (chez Gandi en l'occurrence) et là on s'aperçoit qu'ils sont sensibles à des pannes d'un autre ordre. Dommage.
Je ne m'y connais pas suffisamment en virtualisation et je ne sais pas ce qui s'est passé mais s'il suffisait de lancer la mauvaise commande dans le mauvais terminal avec les mauvais droits, il y a de toute évidence des progrès à faire en termes de sécurisation contre les erreurs humaines.
Par ailleurs, je suis sceptique quant à la remarque de Stephan : "Oui, le redémarrage des serveurs est une erreur humaine regrettable, mais il n'y a rien, pas même les procédures de contrôle et de validation pourtant mises en place, que je ne puisse faire maintenant pour y remédier." On verra quand on en saura plus sur la nature du problème, mais je suis pour l'instant de l'avis qu'il est possible de l'éviter à l'avenir.
Vous n'allez tout de même pas nous dire que vous êtes impuissants contre ce genre de problèmes et que ça peut encore se reproduire ?
Bon, je suis un peu remonté (surement parce que nos serveurs ne le sont pas encore, eux !), mais pas encore suffisamment pour quitter Gandi. J'apprécie moi aussi la transparence et la qualité générale de vos services.
Mais essayez quand même de nous rassurer pour l'avenir. Pour beaucoup d'entre nous, nous avons également des comptes à rendre à nos propres clients et ce n'est pas dit que le coup de "l'erreur humaine inévitable" passe chez tout le monde...
Bonjour,
bien que nous comprenions le problème, nous hébergeons sur vos serveurs de grands comptes plus un serveur de dev, un plantage au niveau des devs cela fait 2H de glandage , mais un au niveau d'un grand compte international c'est vraiment pas cool, cela fait des des centaines voir des milliers de personnes qui n'ont pas réussi à tester le produit proposé et franchement c'est ni bon pour nous ni bon pour vous!
en espérant ne pas revivre ce problème un jour.
merci de votre compréhension.
Bonjour,
bien que nous comprenions le problème, nous hébergeons sur vos serveurs de grands comptes plus un serveur de dev, un plantage au niveau des devs cela fait 2H de glandage , mais un au niveau d'un grand compte international c'est vraiment pas cool, cela fait des des centaines voir des milliers de personnes qui n'ont pas réussi à tester le produit proposé et franchement c'est ni bon pour nous ni bon pour vous!
en espérant ne pas revivre ce problème un jour.
merci de votre compréhension.
tout ces commentaires sur votre transparence me font haluciner!!!
que peut on attendre de moins?
c'est un service gratuit ici?
les autres seraient pire? et ce serait une bonne excuse?
c'est proprement hallucinant
je vous jure que mes clients ne me tapent pas dans le dos en me disant que je suis trop cool et trop transparent moi.
enfin....
Voici un problème (pas très transparent...):
Les kernels 2.6.32-gandi-2839 ont été automatiquement (et silencieusement :\ ) mis à jours vers 2.6.32-xenU-3831-i386.
Les applications dépendantes des modules (par exemple OpenVPN) ne fonctionnent donc plus tant que les modules du nouveau kernel ne sont pas en place.
Là re-problème (grr...) pour qui aurait automatisé l'installation des modules avec cfengine ou puppet: le format à changé (de tar.gz à ta.bz2) et cela ne marche plus de décompresser depuis la racine car seul le répertoire des modules à été packagé sans l'arborescence...
La procédure devient:
cd /lib/modules
wget http://mirrors.gandi.net/kernel/`un... -r`.modules.tar.bz2
tar xfj `uname -r`.modules.tar.bz2
depmod
A méditer pour vos procédures d'alerte tout de même car visiblement, le redémarrage de tous vos serveurs semble être l'égal du bouton de la bombe atomique sur le Charles-de-Gaulle. Qui et combien de personnes ont la clef ? Combien de fois faut-il dire "oui" pour lancer le processus ? Ces questions n'attendent pas de réponse.
Merci en tout cas pour la transparence qui effectivement ne répondra pas aux appels téléphoniques de nos clients (à qui il est déjà difficile d'expliquer ce qu'est le Cloud) et qui ne remboursera pas les revenus générés par nos sites durant ce laps de temps (toujours rien de mon côté à 14h53).
Je ne changerai pas de prestataire mais peut-être serait-il judicieux de mettre en place un système de secours afin que nous n'ayons pas à le faire nous même chez un autre hébergeur.
Bon courage tout de même à toute l'équipe et au(x) fautif(s) en espérant que vous ne l(es) accabliez pas trop.
Tout d'abord, j'ai pensé à une erreur en interne,... grosse panique! Mais vous m'avez tout de suite rassurer par votre communication rapide et transparente. Du coup, je prends avec sérénité cette panne.
Ceci dit, il est 15h00 et j'ai hâte de voir le site redémarrer!!!
Une coupure n'est certes pas agréable et peut engendrer des frais dans certains cas.
Mais les temps de coupure sont en général très courts (c'est la troisième fois que je subis une coupure, la première ayant duré moins d'une heure, l'autre, c'était la panne de clim).
Les taux de disponibilité des serveurs restent pour moi très bons, pour les 3 serveurs que j'ai chez Gandi.
Merci pour le travail que vous faites.
Je suis stupéfait par tous ces commentaires compréhensifs, de compassion, d'encouragements, saupoudrés de smileys gentils.
Moi j'ai des clients qui me tombent dessus, dont les sites sont morts depuis des heures. C'est la honte, c'est pas crédible.
Bonjour,
Je suis d'avis que toute coupure est toujours regrettable et peu coûter fort cher à tout le monde. Mais seulement 2 heures, alors que Twitter, Facebook et même Google ont des coupures de plusieurs minutes à plusieurs heures... Je reste chez Gandi.
PS : je suis resté 5 jours sans site Internet hébergé par une très connue société danoise.
@ ecogito
C'est à croire qu'écologie et société humaine ne font pas bon ménage.
Mais bon vert ou pas, le business reste le business... n'est-il pas ?
Oui, oui.. l'erreur est humaine.. certes. Cela serait certainement pire chez les autres. Mais c'est quand même vraiment pas de bol que ça nous tombe dessus un lundi ... le meilleur jour de la semaine en termes de ventes...
D'ailleurs au passage tout n'est pas revenu nickel, il a fallu que je remonte l'eth0 moi-même... tant pis pour le mauvais broadcast (par défaut) que j'ai laissé...
Ensuite contrairement à ce que je lis ici et là... ça n'est pas la première fois en 1 an... C'est peut-être le premier tir groupé de plantages, mais entre les interfaces réseau qui se retrouvent à 0.1% de bande passante, et le blocage du serveur complet pour non renouvellement d'une part (alors que le serveur dispose d'autres parts valides) et ce alors que le compte prépayé est crédité...
Bonne continuation à tous néanmoins.
Denis Vignes : Je suis d'accord avec vous et l'ai clairement exprimé, tout ceci explique mais n'excuse rien. Cela passera par des remboursements, des produits toujours plus à la pointe, notre service client aux petits oignons, et surtout pas de pannes.
Je n'ai pas d'hébergement chez vous, mais je salue la transparence.
Ceci dit, une bonne idée serait peut être d'avoir un mécanisme qui mets des priorités sur les reboots, par exemple ceux qui ont le plus de parts en premier.
Ça permettrait de remettre en marche en premier les gros sites où le manque à gagner est plus grand.
Bon courage, et surtout à votre Kerviel...
J'ai l'impression d'être au bout de la file d'attente et mes clients aussi; la prochaine fois vous pourrez inverser l'ordre de redémarrage ?
Bon pas de chance , nos serveur devaient être les derniers de la listes, et son presque tous revenu en ligne.
L'erreur humaine ça arrive, tout comme les pannes quoi qu'on puisse faire. Pour moi le plus important est que le quota reste raisonnable et que la communication ne soit pas interrompu, de ce coté là le contrat est respecté, donc merci à toute l'équipe.
Cependant ce problème met point en avant qui pourrait grandement être amélioré:
1) l'interface de Gandi ne permet pas de voir quels serveurs sont remis en ligne ou non, effectivement lors de la panne tous les serveurs sont marqué (OK). En cas de souci d'infrastructure ou autre, il serait géniale d'avoir à coté de chaque serveur un vrai status (en ligne ou non)
2) Certains serveurs sont plus important que d'autres. Je m'explique, par exemple si j'ai 100 serveurs chez Gandi, peut-être que seulement 10 d'entre-eux sont vraiment très sensible. Donc si des options existaient (payante pour avoir un vrai impacte) afin de permettre de dire je paye 1€ de plus sur ce serveur pour que dans l'hypothèse ou un soucis arrive (une erreur humaine est toujours possible) et bien mes 10 serveurs important seraient en ligne rapidement après un redémarrage, et les autres bien à la fin, et ceci pour tous les clients gandi.
Car nos serveurs on été redémarré dans les derniers en totalité, ce qui veux donc dire que nombre de serveur de test, et autres moins important on été redémarré avant.
Bien sûr j'ai bien à l'esprit qu'une tel chose serai extrêmement compliqué à mettre en place, ainsi que peut-être politiquement incorrecte, mais sur les 37697 serveur Gandi, je suis persuadé que nombre d'entre eux ne vont même pas être impactés pat cette coupure, là ou d'autre peuvent perdre plusieurs centaines ou milliers d'euro par heure, comme les site e-commerce par exemple.
Donc cette gestion de la priorité de recouvrement peu, à mon avis être grandement bénéfique à la qualité de service de la plateforme.
Dans tous les cas la qualité de service (disponibilité ici) reste au dessus des 99.9% sur 1 an, ce qui pour nous est très honnête.
Cordialement,
Patrick
ps: Si besoin j'ai un fouet qui sèche sur la corde à linge ...
Je propose que le fautif s'engage a alimenter les serveurs pendant l'equivalent de la durée de la panne avec une dynamo.
Ma grand mere disait toujours :
"Quand on a pas de tete, il faut avoir des jambes"
Amister : C'est le premier plantage de la plateforme depuis la beta. Maintenant, évidemment, votre compte peut être bloqué pour fonds insuffisants ou pas assez de ressources par rapport à vos besoins immédiats. D'où GandiFlex et le compte prépayé
Je vois que je ne suis pas le seul à avoir eu une grosse montée d'adrénaline!
Bon courage pour la remise en route du datacenter.
Merci de la transparence qui est apréciée.
15h10... 240 clients attendent et toujours rien !
Communiquer c'est bien.
Donner les bonnes informations c'est mieux.
V. Prosper, DG Ecogito
15h20... 240 clients attendent et toujours rien !
Communiquer c'est bien.
Donner les bonnes informations c'est mieux.
V. Prosper, DG Ecogito
Allez !
Courage à tous.
Juste une note : pour moi les disques de données ont été attachés bien après le passage de /etc/fstab donc certains bind ont du être fait à la manos.
Sinon oui en effet comme certains disent, c'est énervant, pénalisant, tout ça tout ça. Mais au moins il y a une communication. Chez d'autres quand c'est en rade du prix, et quand ça revient tu attends un moment avant de savoir le pourquoi, quand tu le sais...
aie, des gens risquent de ne vraiment pas être contents.
J'espère que ça n'aura pas trop de répercussions sur votre image. Merci pour la communication en tout cas. Vous apprendrez beaucoup de cette mauvaise manip j'imagine.
Patrick : Oui c'est quelque chose que nous regardons de près. Pour info, il y a un moyen de nous dire que c'est une urgence pour vous ici : https://www.gandi.net/faq/form_cont...
Choisissez "hébergement", cochez "Si votre serveur est bloqué ou en panne, cochez cette case." et le traitement se fera en priorité.
Déformation commerciale de ma part ? Au lieu de "du prix" je voulais dire "tu pries"
(et pourtant je suis tout sauf commercial, influence du web-temps-de-cerveau-disponible ? )
Site toujours down.
Certains clients dont le site n'a pas fonctionné pendant 3h se désinscrivent.
Merci.
V. Prosper, DG Ecogito
Je rejoint l'avis de beaucoup, ce n'est pas acceptable. Il faut contrôler qui a le droit de faire quoi et l'impact d'une seule action me parait colossal... vos procédures sont à revoir.
Heureusement que je n'ai que des sites "perso"... sinon c'est vrai que ca n'est pas sérieux.
Enfin bon courage quand même
votre soluce d'hébergement vaut le coup, va falloir "robustessiser" le tout.
Par contre vous avez pas intérêt à appliquer ceci:
>> Et dire que nous allions annoncer de grandes choses au niveau hébergement ... on va attendre un peu alors ;(
Nous avons tous besoin des améliorations prévues pour l'hébergement. :D
aarggg,
c'est surtout rageant pour les petites structure comme nous qui revendons l'accès à nos services hébergés sur votre plateforme.
Ceci dit, je ne voux jetterais pas la pierre. Nous sommes tous déja passé par là.
Juste un grand merci pour vos efforts de communication. J'ai particulièrement apprécié d'etre informé au fil de l'eau.
Et inutile de lapider, ni meme de chercher le responsable, si ce n'est que l'interet de comprendre ce qui s'est passé, en ce qui le concerne il doit déja travailler a une solution pour de plus réitérer son erreur, et je pense que ca fera même de lui un meilleur technicien. (sans etre péjoratif)
Pour terminer, meme avec tous vos efforts, il se peut que vous soyez un jour de nouveau victime d'une aussi grande interruption de service, qui pourrait meme durer encore plus longtemps.
Je reste donc intéresser par vos propositions si vous en avez qui pourrait m'aider à améliorer mon service et rendre ma plateforme plus hautement disponible.
Merci et félicitations.
Merci pour la transparence,
bon courage (+ surtout pour ceux dont les serveurs sont encore off)
par contre, même si la qualité de cette transparence est encore au rdv, je ne peux m'empêcher de relever à la lecture de ce billet, le petit mwmouais-bof qui m'a assailli :
> notre plateforme n'a pas connu d'incident technique important depuis très longtemps
...euh le dernier (sans compter ceux de la beta -hein) date du ~ 20/05/2010 ! donc "très longtemps", mwmouais-bof...
...bon, ça n'entame pas le crédit de bonne foi, mais ça fait du bien de grogner à son tour après avoir eu à gérer l'adrénaline et les appels des clients qui ne se satisfont pas de cette transparence et à qui il va falloir offrir des compensations...
j'attends donc avec impatience de connaître la compensation que gandi va proposer, et autant vous dire qu'un simple mois d'hébergement dédommagé, là cette fois-ci entamera sérieusement mon degré de satisfaction...et tant pis pour votre kerviel
allez bon courage quand même - cdlt
L'erreur est humaine (perseverare diabolicum quand même). Même si la transparence doit être la norme, il faut souligner la qualité et la réactivité de la communication.
Je ne rentrerai pas dans le débat de l'uptime, excellent ici, ceux qui veulent vraiment plus devraient sérieusement réfléchir à des solutions multi-fournisseurs.
@Ecogito :
" Certains clients dont le site n'a pas fonctionné pendant 3h se désinscrivent. "
Quel service si sensible fournis-tu ?
3 heures de panne, ça commence à faire. Comme disait Sophie Daumier "j'en vois plus le bout'. Voilà, voilà, une après-midi de foutue.
ecogito : Votre serveur est en ligne, mais vous aviez un souci de MySql visiblement. Nous sommes en train de vous redémarrer celle-ci.
Le fait que le serveur apparaisse à état OK mais ne ping pas est "normal" dans les circonstances actuelles ? ou pas ?
Rien de vital, je n'ai qu'un dns secondaire mais je commence à avoir quelques domaines à y ajouter ...
antoine : je maintiens, le dernier gros souci de plateforme remonte à la beta, soit il deux ans je pense. Ceci n'exclut pas d'autres problèmes, mais notre plateforme est solide. Donc en dehors des avaries externes (clims equinix) et internes (aujourd'hui donc), notre hébergement est "solide".
bon bah c'est quoi Gandi la paix subit Rama la guerre ?
Toujours rien à 15H50. Je n'ai pas de grands comptes ni de services à 1000$/minute, juste des clients avec la bave au lèvres ... Mon serveur ping et c'est tout. J'ai essayé de le redémarrer mais le processus n'en finit pas. Doit-on s'affoler ? Et si oui comment ?
J'avoue aussi que le fait qu'un seul humain puisse mettre un tel bazar avec une seule manipulation me paraît incroyable.
V. Prosper trépigne, comme nous tous. (Au passage, qu'il m'explique comment ses clients se désinscrivent d'un service qui est down ?
On se détend, c'est à nouveau UP...)
Je suis d'accord : la communication ne fait pas tout, et quand ton client est bien remonté au tél, tu peux leur expliquer que Stephen, Nico et Arti se démènent et sont de bons ptits gars, il s'en tape grâve.
Par contre, si tu es sur un hébergement hyper-sensible et que des milliers d'euros sont en jeu toutes les heures, il faut ptêt blinder un peu plus que prendre un Gandi à 9€ la part... (Avec tout le respect que je vous doit les gars, mais Gandi, c'est pratique, pas (trop) cher, réactif, évolutif, MAIS c'est pas encore Amazon et sa puissance de frappe...)
Donc, merci pour les infos en temps réel, et pour ce coup-ci, on dira qu'on vous croit quand vous dites "courage pour les derniers" (Y avait-il autre chose que des derniers ?)
Bonjour,
Vu l'annonce que l'ensemble était redémarré, mon serveur apparait ok en admin, mais le site ne répond toujours pas. Je fais parti des "cas problèmatiques" ?
Merci
@jerome: une pastille qui calcule les émissions de CO2 des sites web sur lesquels elle est apposée.
quand elle ne répond pas, cela bloque les sites web concernés.
@stephan: premier souci mysql depuis son démarrage au mois d'août.
pareil que pour acaton : serveur ok en admin et sites toujours invisibles.
Que dois-je faire ?
JM
@ecogito dans ce cas là j'aurais tendance à dire qu'il faudrait sérieusement revoir la façon dont la pastille est apposée...
On voit bien que la grande mode du cloud ne résout rien, puisqu'une infrastructure cloud mal configurée ou mal protégée reste vulnérable et sujette aux pannes, qu'elles soient matérielles ou logicielles.
D'ailleurs sur votre infra cloud chez Gandi, si les données sont sur un filer, et que ce filer lâche, quel est le délai minimum de coupure avant qu'un autre filer puisse prendre le relai avec les données à jour ?
PS : moi, mon plus vieux serveur dédié chez OVH, il a pas rebooté depuis 2 ans et demi et se porte comme un charme ...
pareil que pour acaton et JeanMarie ici aussi... heureusement c'est juste un serveur de test..
@ecogito dans ce cas là j'aurais tendance à dire qu'il faudrait sérieusement revoir la façon dont la pastille est apposée...
Tout à fait d'accord avec Twidi.
Idem acaton et Jean-Marie : ok en admin mais sites inaccessibles -> tentative de redémarrage mais ca tourne dans le vide depuis 20 minutes... au SECOURS
c'est bon les gars tirez pas sur l'ambulance. Vous avez eu un problème quand avec Gandi ?
stephan : à mon tour d'être transparent - autant pour moi, après vérif, le 20/05 c'était un autre type d'erreur, résultant d'un résidu de ma config en beta (static vs dhcp vs udev) et lors duquel j'avais pu aprécier la qualité de votre support (et réviser udev).
...donc à mettre sur le compte du taux d'adrénaline...donc tapez pas trop votre technicien (transmettez lui un bon courage de ma part), je lui souhaite d'être aussi solide que votre infrastructure
tout est plus calme maintenant...et mes clients aussi -ouf
en attendant quand même des compensations, encore merci pour la transparence et cet espace d'expression, ça fait du bien.
@rico et @twidi : le problème est plus complexe qu'il n'y paraît
si vous l'avez étudié en profondeur (pastilles de stats ou dérivé), n'hésitez pas à m'envoyer des infos: prosper@ecogito.org
@ Helix
Et bien pries pour que ton serveur OVH n'ai jamais besoin de redémarrer, moi la dernière fois il a fallu plus de 8 heures ... et même en tapant du pied et en grognant j'ai pas vraiment eu d'info pendant l'attente...
ps: le jour ou les 2 disques dur d'un mirroring tomberons en panne en même temps j'attends de voir ta tête ^^ sisi le cloud résout beaucoup de chose, mais comme il est dit plus haut le 100% n'existe pas et si tu veux vraiment t'en rapprocher prends un serveur dédié chez chaque hébergeur dans le monde et monte ta propre plateforme (et quand bien même ^^)
pps: j'ai commencer l'hébergement (a long time ago in a galaxy far ...) avec un vieux serveur dans un placard au fond de ma chambre et j'ai eu + de 4 ans d'uptime, le cas individuelle ça veux rien dire, il faut regarder sur le volume et dans les moyennes...
ppps: Effectivement si l'infrastructure Gandi pouvait être coupé en morceaux de façon à ce que 100% de l'infrastructure ne puisse pas tomber en même temps ça serai super ... et peu-être aussi super cher ? aie
"si l'infrastructure Gandi pouvait être coupé en morceaux de façon à ce que 100% de l'infrastructure ne puisse pas tomber en même temps ça serai super ... et peu-être aussi super cher ? aie"
=> c'est de plus en plus vrai, sauf quand on vise bien en plaçant la balle au bon endroit dans le pied....
Je prends le temps de lire les posts depuis...12H15.
J'aimerais à mon tour faire des louanges au sujet de la transparence de Gandi, faire de l'humour avec Kerviel, dégainer les plus beaux smileys, philosopher sur l'erreur humaine, mais là c'est pas possible, je suis juste capable de faire une analyse froide des conséquences de ce plantage qui dure depuis près de 4 heures:
- Une porte close pour au moins 8.000 internautes
- Le bot de GG qui a dû passer X fois afin de tenter d'explorer quelques une de nos 120.000 pages
- Les campagnes Google, Yahoo, Bing, Facebook...bloquées
- Des concurrents qui se frottent les mains
- Deux personnes au chômage technique
Une vraie boucherie.
Et là, je lis qu'en guise de dédommagement on nous offrirait une journée d'hébergement ?
Un peu comme si un type me renversait en moto, que je me retrouverais au sol, en charpie, la moto terminant sa glissade dans une troupe de louveteaux et que le chauffard me propose de me payer un clignotant. Déroutant.
Vu ce qui se passe en France je croyais que les serveurs c'étaient mis en grève!

Pour savoir qui a fait la "boulette" ... c'est simple... Il y a un syndicaliste dans l'équipe ?
en tout cas, merci encore pour votre service jusque là 100% top
(et contrairement à certain, je peux me satisfaire d'un 99.99%!)
@vincent :
Tu oublies la fin de la phrase
"Bien évidemment, la journée d'hébergement est pour lui nous, et nous regarderons au cas par cas pour aller au delà si la situation le justifie. "
Franchement, j'ai été chez des hébergeurs soit disant ultra sérieux, avec un prix plus élévé et un service moins efficace (si si, tout ça à la fois) et lorsqu'un gros soucis est apparu, au niveau de la transparence ils ont été des zéros. Cela a été très frustrant car les clients de cet hébergeurs ne savaient donc pas où donner de la tête... bref.
Je m'ajoute à la liste de ceux qui remercient Gandi pour leur transparence.
@ecogito fait
Note au barmaster : le bouton prévisualiser de ce blog envoie le post sans previsualisation (enfin chez moi sous FX 4 beta)
@vincent :
c'est moi, pas gandi, qui ai parlé d'une "journée d'hébergement" en dédommagement...pour dire - à ce moment pas très calme -...que je m'en satisferai peu
+1 commentaire de Xeno
En fait... maintenant, le domaine est accessible, mais pas ses sous-domaines (je ne sais pas si cela aide...) et ma boîte mail est pleine de mail de cronjob échoués :D
Denis Vignes, êtes-vous naif ?
Bien que nous payons le service, énormément d'entreprises en cas de problème ne communiquent pas dessus et usent/abusent de la technique de l'autruche, c'est une réalité. On peut apprécier chez Gandi une transparence et le fait qu'ils ont communiqué tout le long de l'évènement sur la situation et son évolution. Ca peut vous sembler "le minimum" mais c'e st malheureusement un minimum que beaucoup d'entreprises n'assurent pas. Il faut savoir être objectif dans ses critiques.
Toutefois ça n'empêche pas d'être mécontent, autant quand il s'agit de serveurs à but personnel, ce n'est pas très grave, autant quand il s'agit de serveurs à but professionnel cela peut être catastrophique.
De notre coté, un client présentait son site au conseil d'administration afin de montrer les nouveaux outils et la façon dont le budget avait été utilisé. Malheureusement à cause des grèves, la présentation était passé de Vendredi à aujourd'hui 13H. Aie. Et les membres du CA devaient repartir tôt, dès 15H à cause des grèves.
Au final on a donc eu une présentation vide, où notre client a du remplir comment il pouvait, de notre coté on s'est fait tiré les oreilles (le mot est faible) et les futurs budgets sont remis en question par cet échec. Un client ne cherche pas à comprendre à qui est la faute, il s'en prend à son interlocuteur direct.
Quand on lit que Gandi compte offrir la journée d'hébergement, c'est un peu faible, quelques centimes d'offert par part d'hébergement, au yeux d'un client pro c'est limite inexistant. Gandi a-t-il prévu une offre un peu plus consistante pour les clients pros qui ont souffert de cette indisponibilité pendant 3H ?
L'indemnité devrait à mon sens être davantage en mois voire une année complète offerte par part.
Même si cela ne remboursera jamais le préjudice que certains professionnels ont pu subir vis à vis de leur client, cela montrerait une vraie volonté de Gandi de se faire pardonner.
Alexandre
Vincent: tous les serveurs ont redémarré mais certains services (mysql/apache) sont plantés car pour quelques clients, quand le serveur a démarré, FSCK, l'outil de contrôle d'intégrité et réparation du disque c'est lancé et a bloqué le bon fonctionnement de la procédure.
Nous sommes en train de gérer les clients dans ce cas là en vérifiant toutes les Gandi AI.
N'hésitez pas à contacter le support, ils sont là pour vous aider.
@Vincent,
et oui c'est la fin du monde ^^
Moi je me suis coupé les 2 bras, mis la tete dans la gaziniere et juste quand j'aller perdre connaissance, les serveurs sont remontés :(.
Nous aussi cette panne nous a posé de gros problèmes. Nous hébergeons pas exemple chez Gandi l'un des 40 clubs de foot pro de France ainsi que le site d'une des plus grandes marques d'électronique grand public mais il faut aussi voir la fiabilité de Gandi sur une année, et le faible prix de leur offre. C'est pitoyable de venir gueuler sur ce forum en expliquant que cette panne vous fait perdre de l'argent. Si les enjeux sont si important c'est à chacun de prendre ses dispositions pour dupliquer ses services sur plusieurs opérateurs comme nous le faisons nous même depuis des années. Si l'hébergement est si vital que ça pour certains d'entre vous alors c'est à vous de vous comporter en adulte responsable en vous disant "puisque c'est si important que ça pour moi, comment puis-je faire pour y apporter une solution de secours le jour où, inévitablement puisque ça arrive aux plus grands, Gandi va avoir une panne majeure".
De l'hébergement nous en faisons depuis plus de 15 ans mais pour les clients les plus sensibles nous avons compris depuis des années que c'est à nous de répartir le risque et la charge sur plusieurs opérateurs et non pas à chaque opérateur de faire l'impossible.
J'ai 6 sites, 3 sont revenus et les 3 autres pointent sur un des 3 sites revenus... j'espère que le support va suivre...
Merci pour le suivi des news sur la panne - j'suis pas une pro, et c'est à 13:00 que j'ai décidé de mettre en ligne notre nouveau site!! ça m'a évité de mettre mon ordi sens dessus dessous!
L'erreur est humaine!
@Logam :
Beaucoup pensaient (à tort à priori) que l'hébergement cloud offrait une sécurité/fiabilité exemplaire. Donc, quand en plus les données ne sont pas sensibles, que ce sont des sites corporates pour des clients, on ne voit pas forcément l'intérêt de les gérer comme des projets sensibles et de prévoir la duplication à tout va. Sauf que parfois une panne tombe au mauvais moment, un lundi au début d'après-midi c'est pire qu'un dimanche, c'est pire que si le problème avait eu lieu ce soir à 21H, etc. Le premier jour de la semaine en début d'après midi c'est vraiment un mauvais timing
Surtout en pleine période de grève en France où beaucoup de nos clients sont déjà tous un peu à cran.
Il y a des moments où même un site qui n'est pas sensible ne peut pas être down et parfois le hasard et la malchance font ce qui est arrivé aujourd'hui.
Et même si c'est au prestataire direct de prévoir ça (donc nous), Gandi a évidemment une part de responsabilité dans l'affaire (qu'il ne nie pas).
Personne ne demande à Gandi de rembourser les pertes brutes que ce problème a généré, mais juste un geste commercial en cohérence avec la gravité de l'incident.
Merci pour les infos. A l'attention de ceux qui critique : Personne n'est à l'abris d'une panne.... pour ma part j'ai testé au moins 15 hebergeurs avant gandi et pour l'instant je trouve qu'il n'existe nulle part un meilleur rapport qualité/prix
Courage pour la remise en place.
Vous continuez de vous tirez des balles dans le pieds en nous expliquant le problème. En faisant l'autruche vous auriez seulement eut des "hourras! Merci les sauveurs" une fois le problème résolu.
En tout cas bon courage pour cette journée qui s'annonce fort longue pour vous.
Un client très content, amicalement thom.
à ceux qui ont repris ma demande, pour moi le problème est réglé.
Et suis aussi d'accord, concernant Gandi, que faute avouée est à moitié pardonnée. Informer en temps réel c'est primordial, mais pas si courant.
Voila !
Virons cette personne incompétente parce que punir est plus important qu'éduquer.
Faisons plaisir au patronat en cherchant un coupable plutôt que de trouver une solution.
Satisfaisons ces hyènes dont l'appel du sang est plus fort que la compréhension.
Le prix d'une indisponibilité de deux heures est celui d'un choc mental où s'ajoute à la honte ou la dure prise de conscience d'une erreur, le lourd fardeau de la "FAUTE PROFESSIONNELLE"
Pour des euros de perdus, une vie professionnelle amochée.
C'est beau, j'en pleurerai.
Tous : Je redis clairement que selon les cas les remboursements vont d'une journée à un mois. Sur une ou plusieurs parts. Contactez le support avec une demande motivée et nous réagirons.
BOFH : Qui a parlé de cela ? Nous ne sommes pas encore dans la gestion de cela, nous nous concentrons dans le fait de vous rétablir un service sans failles.
Stephan,
Je pense que tu as raté la tendance ironique des propos de BOFH
C'est fou quand même de venir pleurer pour une interruption d'au max 4h... Avant de changer d'hébergeurs dites-vous bien qu'une "meilleure prestation" passera par une contrainte plus forte sur celui-ci (GTR & co) et que ça a un coût (justifié).
Après, si parmi ceux qui se plaignent il y en a pour vendre de l'infogérance à leurs clients en leur promettant monts et merveille, et que les clients en question les engueulent, c'est bien fait. Si vous garantissez des choses que même votre prestataire ne peut garantir (et c'est normal pour 12 EUR la part / mois), j'ai envie de dire que l'engueulade est méritée.
Ceci dit, rien n'empêche d'utiliser Gandi pour proposer une prestation de haute dispo à des clients mais sans perdre de vue qu'une panne arrive et arrivera toujours et donc agir en conséquence.
Une moyenne de 4h d'interruption par an, je trouve ça plutôt pas mal du tout.
J'ai arrivé ici par tweeter, bien utilisé, même si je avais d'autres soucis que regarder le tweeter!
J'ai vecu la fase beta, et cette fosi la un de mes gros clients est parti. Cette fois je ne pense pas avoir perdu personne parce que je sais que Gandi fait tout pour revenir sur place.
En plus ce ne sont pas tous les serveurs qui ont tombé. Cela a évité la panique généralisée.
Je crois que si on a des clients professionnels qui demandent un service 100% sans discussion, il y a des procédures pour mettre en place site-balancing avec plusieurs serveurs, et je souhaite que Gandi va l'offrir bientôt avec les serveurs a Baltimore, à son temps, comme il l'a fait jusqu’aujourd’hui sans perdre son âme.
Merci pour la transparence
mais c'était une mauvaise journée pour nous et nos millions d'utilisateurs
Ciao
Je tiens à préciser que je ne suis pas client de Gandi avant d'écrire ce billet.
J'aimerais m'adresser en première ligne à ceux qui se plaignent amèrement du seul down depuis des mois; si votre business est si important que cela, au lieu de taper sur votre solution d'hébergement sûre et pas hors de prix au vu des services proposés, pourquoi ne pas mettre en place vous-même une solution externe en cas de down de Gandi, celui-ci étant inévitable? Avez vous déjà vu un hébergeur proposant 100% d'uptime? Bah ça n'existe pas... Cet après-midi, Gandi était dans les 0.01% de downtime annuels.
J'ajouterai que si Gandi est si mauvais que cela, pourquoi y restez vous, déversant toute votre haine sur les commentaires?
Il va être 19h ; j'en suis toujours à tenter de réparer/resynchroniser 15 GB de databases corrompues en pleine activité par un shutdown sauvage... et j'y passerai une partie de la nuit, sans doute. Non, Gandi n'héberge pas que des serveurs CS, et oui, cette panne même si elle est exceptionnelle est grave ; il y a aussi des entreprises pour lesquelles la perte d'une demi-journée d'activité coute. Cher.
Étant moi-même du secteur, je suis un fervent défenseur de l'erreur humaine, certes. Je pense que personne ne demande le lynchage public du fautif. Mais je ne peux m'empêcher de douter du professionnalisme de l'individu et de l'entreprise, lorsqu'une simple manip (?) permet de mettre hors ligne des milliers de machines.
Des mécanismes (procédures, environnements de tests, segmentation,...) auraient du empêcher ceci.
Cordialement,
Vincent/
@Someone1 => La plupart ont des GandiAi je parie, donc la haute dispo à oublier ...
@Toorzilla => Vu que tu es du métier tu sais donc qu'à un moment on intervient forcément en "root", donc la moindre erreur de virgule ou de point et boum tu as tout planté. Dixit les routeurs par exemple, tu rentres une mauvaise info, ils se répliquent entre eux boum tu as tombé tout un réseau et tous les serveurs derrières.
Donc moi ce que je comprends pas c'est le fait de ne pas pouvoir concevoir que oui ça peut arriver malgré toutes les procédures du monde.
Sylvain : j'étais passé au travers, mais ne me parlez pas d'Amazon ou de qui que ce soit : tous tombent régulièrement et en plus n'en parlent pas ou très peu (merci Alexandre).
Stephan > Je crois que vous vous trompez d'interlocuteur
C'est sylvain il me semble qui faisait la comparaison avec Amazon.
Alors moi je tiens a remercier le Pierre Richard qui bosse chez gandi car grâce a ce génie j'ai passé 3h a glander sur Facebook pour cause de serveur de dev indisponible !!! Ca ma fait une excuse pour pas bosser une bonne partie de la journée ! Vivement qu'il confonde a nouveau l interrupteur de la lumière avec celui des serveurs !
Merci à l'équipe technique, dix minutes après mon premier post les modules en tar.gz étaient disponibles sur mirrors.gandi.net.
Malheureusement, en rupture avec le contrat tacite de la documentation, l'archive ne contient toujours pas la hiérarchie à partir de la racine.
Il faut donc l'extraire dans /lib/modules et cela casse donc toujours les solutions automatisées existantes.
D'une façon plus générale, serait-il possible d'être informés lors de la mise à jour des kernels ?
Enfin une bizarrerie: le module xfs pèse 11Mo ?!
bon et bien retour case départ moi qui était justement en train de tester la stabilité de la nouvelle plateforme c'est raté.
tetageek : elle l'est, enfin lorsque nous ne la mettons pas en reboot nous mêmes ... oui je sais.
Pour moi, il est presque minuit et toujours pas de retour de mon serveur, donc j'imagine que certains sont toujours sur le pont. Bon courage alors, en attendant que tout ça remarche nickel comme avant et pourquoi pas l'envoie de quelques informations sur ce qui s'est passé.
@stephan : ne nous trompons pas : je mentionnais Amazon pour le dimensionnement et la puissance de frappe brute, pas forcément pour une infaillibilité présumée (qui est dans tous les cas illusoire...)... ...Et pour répondre à ceux qui se plaignent d'une indisponibilité de quelques heures et pleurent sur les pertes sèches sans avoir signé (et sans payer) de SLA, GTR ou autres acronymes divers et variés.
)
Donc en gros, j'étais vaguement du côté de Gandi dans cette histoire (à part au moment où j'avais Monsieur B. au téléphone, où là, vous avez mangé chaud
thierry : Non c'est anormal contactez nous en utilisant la technique décrite plus haut ("mon serveur est bloqué" dans l'interface de contact du support, partie "hébergement") pour que nous regardions ce qui bloque. Merci.
J'ai contacté le support, et après un peu de bidouille le serveur semble être de nouveau fonctionnel mais je suis en train de voir pour vérifier que tout est rentré dans l'ordre.
hmm... Tout ceci n'explique pas pourquoi mon /etc/motd a été réinitialisé
Dû au changement de Kernel sans doute.
Rectification du code donné par evax pour l'installation des fichiers du kernel :
cd /lib/modules
wget http://mirrors.gandi.net/kernel/`un... -r`-modules.tar.gz
tar xzf `uname -r`-modules.tar.gz
depmod
(c'est -modules et pas .modules)
Mais je suis effaré de lire le nombre de client qui viennent se plaindre d'héberger des solutions hautement critiques et qui n'ont AUCUNE solution de backup actif ou de failover. A ceux-ci, vous etes de vrais amateurs. Commencer à penser à une vraie solution d'hébergement avec failover et sécurisez-vous en ayant un double hébergement. Bref le minimum syndical. Et arrétez de taper sur la tête de gandi.
A ce dernier, essayez quand meme de blinder cette procédure de redémarrage. C'est tellement "idiot" que j'en viens à douter que ce soit la vraie raison sur plantage.
Ca me fait penser à la femme de ménage qui a débranché le serveur pour passer l'aspirateur. Très rassurant aussi de lire "ben, on y peut rien, on peut pas controler un humain".
Heu.... rassurez moi, c'était pour rire ? Vous laissez trainer ouver le shell avec la commande reboot présaisie ?
a+
J'ai un client chez ovh, j'ai du subir des coupures toute la soirée du 19. Je m'étais dit qu'au moins chez gandi c'est plus cher mais il n'y a pas autant de soucis. Pas de chances, si, une erreur stupide en plus. Moi qui voulais me rassurer d'avoir prit une part gandi à la place d'une kimsuffi, c'est loupé. Mais je suis quand même content de la qualité, les erreurs n'arrivent pas régulièrement contrairement à d'autres hébergeurs donc finalement je ne regrette pas ce choix.
Offrir une journée c'est toujours ça de prit, d'autres ne font pas l'effort de faire ce geste commercial.
L'erreur est humaine, pas de soucis !
J'ai eu mes clients sur le dos toute l’après midi moi aussi
et alors ? je suis pas mort !
est-ce inacceptable ? il y a plus grave non ?
Merci pour ce que vous faites et pour les valeurs que vous défendez,
au diable les insatisfaits et leur soif de perfection.
@ecogito et compagnie :
En tant que professionnels, ne pouvez-vous pas trouver des solutions d'hébergement alternatives pour vos clients pendant les durées de panne ?!? C'est cela qui me paraît incroyable... et c'est certainement pour cela que vos clients ne sont pas contents : Il faut des solutions de replis dans les cas d'urgence.
En tout cas, si vous pensez que Gandi ne fera pas d'erreurs à l'avenir, je pense que vous vous trompez lourdement. L'erreur, un jour où l'autre, se reproduira. Car effectivement, l'erreur est humaine et je suis certain qu'en fouillant bien, vous avez du en faire vous aussi un jour, non ?
@Gandi : Arrêtez de vous auto-flageller. Continuez à bosser comme vous le faîtes et restez transparents. C'est sur un ensemble de prestations que les clients vous jugeront, pas sur 4 heures de pannes !
"En tant que professionnels, ne pouvez-vous pas trouver des solutions d'hébergement alternatives pour vos clients pendant les durées de panne ?!?"
J'espère que c'est de l'humour ... en tout cas ça m'a bien fait rire !
Bonjour,
je n'avais pas vérifié la disponibilité de mon serveur depuis le début de la semaine; étant en déplacement à l'autre bout de la France pour assister aux obsèques de mon grand-père, j'avoue que j'avais autre chose en tête...
Bref je suis surpris de constater ce matin que mon serveur (en mode expert) est complètement sens dessus dessous... plus aucun service ne tourne dessus donc aucun moyen de reprendre le contrôle, je me bats depuis ce matin avec la console d'urgence et le support pour avoir le début d'une explication sur le pourquoi du comment..
le plus loin que je puisse aller est un check du file system qui se solde de la manière suivante :
"root@uman:~# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/xvda1 2.4G 1.2G 1.2G 51% /
/sys 2.4G 1.2G 1.2G 51% /sys
devpts 2.4G 1.2G 1.2G 51% /dev/pts
root@uman:~# fsck /dev/xvda1
fsck from util-linux-ng 2.16
e2fsck 1.41.9 (22-Aug-2009)
/dev/xvda1 is mounted.
WARNING!!! Running e2fsck on a mounted filesystem may cause
SEVERE filesystem damage.
Do you really want to continue (y/n)? yes
fsck.ext3: No such file or directory while trying to open /dev/xvda1
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock:
e2fsck -b 8193 <device>
"
je reconnais être un assez piètre admin sys mais je ne pensais pas me plonger dans une telle mélasse quand j'ai décidé de passer en mode expert simplement pour pouvoir installer un framework PHP....
j'ai déjà envoyé plusieurs mails au support mais je poste ici également dans l'espoir qu'une personne de Gandi puisse me tendre la main afin que mon serveur retrouve sa forme d'antan...
Merci d'avance
Cyril
Bonjour Cyril,
A la question "Do you really want to continue" au vu du message qui la précède, je vous recommande chaudement de répondre "N". Si fsck passe sur un filesystem monté et utilisé, le système ne tiendra pas longtemps avant de sérieuses erreurs disques.
C'est un problème de boot qui rend votre serveur incapable de monter /proc, croit que / n'est pas monté et ne démarre pas udev (et donc le support de /dev). C'est souvent une config ou une incompatibilité kernel assez facile à corriger.
Je regarde vos échanges avec le support et ce que nous pouvons faire pour vous aider à réparer.
Je regardais l'offre de serveur virtuel de Gandi, je suis arrivé ici… OVH peut sembler certes moins transparent et moins humain (je dispose de plusieurs serveurs chez eux et ai rencontré parfois quelques soucis)… mais ils me semblent au final plus professionnels et plus compétents.
Cyril: le 2 septembre à 19h20 un admin loggé sur votre serveur a détruit des fichiers importants pour le boot sur la machine. Le prochain reboot n'était pas envisageable. Je vois si nous pouvons vous installer le minimum pour vous aider à retrouver un service rapidement, mais ceci reste exceptionnel.
A lire vos échanges support, l'aide qui vous a été apportée fût très poussée pour un serveur expert.
Firebush: Si vous veniez par hasard, c'était effectivement le mauvais jour. Pour le reste nous nous efforçons d'être compétents, et professionnels.
Fidel a vous meme, NO BULLSHIT !
Tout le monde c'est deja pris les pieds dans des cables en salle serveur ^^
bonjour,
j'ai effectué l'achat d'un site pro ,et le site n'est toujours pas validé depuis le 14 octobre, malgré plusisuers mails, sans réponse à ce jour. Je me permet de vous laisser ce message auquelle nous attendons une réponse de votre part pour savoir pourquoi cela ne fonctionne pas. Merci d'avance
Bonjour Pascal,
merci beaucoup pour votre réponse; effectivement votre aide serait précieuse; le 2 septembre correspond à l'upgrade Ubuntu qui était recommandé suite au passage en mode expert. j'ai suivi les instructions présentes sur la page suivante : http://wiki.gandi.net/fr/hosting/ga... J'avais conscience que cette opération n'était pas anodine, mais tout s'était bien passé et je ne soupçonnais pas qu'il y aurait des répercussions ultérieures...
Est-ce également pour cette raison que la console d'urgence ne semblait pas fonctionner ? Le support a du l'activer à 2 reprises, l'activation via le site d'admin ne marchait pas correctement...
Je vous remercie d'avance pour l'aide que vous pourrez m'apporter, et si il existe certaines docs dispos sur le site de Gandi pour pallier à mon manque de culture, je suis preneur.
Cordialement,
Cyril
Je suis tombe sur cette page parcequ'un ami m'a donner le lien, en pensant que c'etait rigolo. Effectivement, ce rapport d'incident est digne d'un hebergeur associatif qui fait dans le gratuit, et c'est risible. Pas d'heure de debut d'incident, pas d'explication claire, que dalle! Vos clients sont tordant a vous remercier pour cette bafouille. Vous en avez de la chance d'avoire des gens aussi tolerant comme client.
En fait M. Bla(bla?) c'est peut être parce qu'ils sont moins **** et stressés que les autres.
Peut être aussi parce que tous les clients ne sont pas pros et avec des Dollarzzzz dans les yeux.
Peut être que si M. Bla (blablablablabla un tel m'a dit ceci !! ) avait eu de l'audace, voire même l'intelligence ou au moins un soupçon, il serait tombé là, sur ce lien :
http://www.gandi.net/news/fr/2010-1...
Avec toutes les heures les commentaires itou itou !! Difficile de faire plus clair non?
firebush : Le hasard faisant "bien" les choses, OVh est tombé en rade le lendemain, et au niveau traitement de l'incident et de la communication, nous avons été clairement plus "professionnels", comme à chaque fois. Et si je compte les pannes, nous sommes encore à notre avantage. De bonnes raisons d'aller plus loin et de nous tester vraiment, d'autant plus que vous avez un mois gratuit sans AUCUN engagement.
#sandrine : vous avez envoyé un mail au support pour votre SiteMaker ?
Si la réponse est non, je vous invite à le faire le plus rapidement possible. Si la réponse est oui, veuillez nous communiquer le N° du ticket et je m'en chargerais.
A bientôt,
Carole
oui plusieurs mails envoyés au support mais aucunes réponses. reference ticket 100006363429 du 14/10/2010- Merci d'apporter une réponse rapidement.
@ecogito Je n'ai pas d'hébergement chez Gandi et je ne travaille pas chez Gandi.
Pourtant, je suis choqué par vos propos. Votre société ne fait jamais aucune erreur ?
Si c'est le cas, chapeau.
Je propose de condamner le fautif ou la fautive à réciter un "Je vous salue Serveur plein de grâce, c'est promis je respecterai la procédure, et ne planterai pas tous les clients de mon Saint Patron!"
Le tout suivi d'une pénitence d'une semaine consistant a se réveiller vers 3h du matin et consulter la très sainte 'log system' et la lire à haute voix pieusement!
Normalement c'est radical.....
Le 18 oct vous avez eu une panne.
En lisant les commentaires de Stephan, je ne trouve aucune explication qui me satisfasse.
Est-il possible qu'une infrastructure entière tombe par terre à cause d'un serveur? (et lequel?).
Cela ne devrait pas être un problème électrique, les alimentations sont redondantes.
Pourquoi les autres sites Gandi (cfr: votre doc publicitaire) n'ont-ils pas pris le relai pour absorber la panne? (erreur humaine?)
Cela pourrait-il faire l'objet d'un billet plus détaillé techniquement?
Pour moi, cela serait vraiment de la transparence... la différence entre passer mon chemin et ou m'attarder plus sur les offres.
Bien à vous
Bonjour,
C'est très bien de se gargariser avec une certaine autosatisfaction mais vous avez des clients (comme moi par exemple ) qui rencontrent des problèmes avec leur Blog et qui malheureusement ne trouvent pas d'interlocuteur valable chez "Gandi Blog"pour résoudre un "bug" qui ne peut m'être imputé...
Outre un peu d'agitation genre "est-ce que vous avez mis des accents.." entres-autres...
Je ne vois rien venir depuis deux semaines que mon Blog ne fonctionne plus...
Surprenant non.. de la part de la société qui semble se situer parmi les leaders du marché..?
Je répond un peu tard sur le sujet mais effectivement... ça me fait assez rigoler ceux qui se plaignent des pertes de chiffre d'affaire.
La disponibilité à 100% ça n'existe pas et Gandi n'a jamais communiqué de la sorte d'ailleurs.
Maintenant sachant ça, il faut être professionnel et se protéger. Comment ? Une solution technique en ayant une solution de backup chez un autre hébergeur par exemple.
Je trouve abhérent de ne pas avoir une assurance pour se prémunir du préjudice... prennez donc une assurance pour votre hébergement! Certe ça coûtera plus chère mais au moins vous pourrez réclamer un dédommagement pour la panne et surtout si un de vos clients se retourne contre vous vous serez également protégé.
Gandi est un prestataire de service de qualité et il faut savoir être responsable plutôt que de se dégager en rejetant tout sur Gandi...
Omar l'adresse dudit blog?
Bonjour,
L'adresse du Blog est "maisonsalfortcitoyen.eu"...
Depuis 2 semaines (bientôt 3..) nous n'avons plus accès aux articles contenus dans les les rubriques des "Catégories", (sauf bizarrement les articles des catégories "Un Oeil sur l'hexagone.. Economie / Politique" et "Un Oeil sur la planète Environnement").
En revanche, tous ces articles qui ne s'affichent plus par les rubriques, s'affichent parfaitement par les rubiques "A retenir" et Derniers billets"...
Si vous avez une solution pour nous sortir de cet impasse...
Merci
... alors si on a de grosses responsabilités, la moindre des choses c'est de prendre de grosses précautions. Je pense que les clients qui demandent un service haut de gamme ne payent pas des clopinettes... C'est pas très sérieux de ne pas avoir de solution de secours quand on engage 240 clients
...
Cela n'enlève rien à l'erreur de Gandi, mais je crois que chacun doit prendre ses responsabilités. En tout cas , moi je suis satisfait à 100 % malgré cet incident, puisque informé et remboursé.
j'ose même pas imaginer le stress de voir 2000 Vms sync le FS
sur esx ça me ferait peur