VPS Cluster Storing

Wij hebben vanochtend van 10:00 tot ongeveer 11:20 een storing gehad op één van onze VPS clusters.

Na onderzoek is gebleken dat de problemen veroorzaakt zijn door één van de RAID-controllers die defect was geraakt. De andere raidcontroller kon het werk wel overnemen maar degeen met de error stuurde verstorende signalen naar de rest van het cluster. Dit veroorzaakte zoveel overlast binnen het interne netwerk van het cluster dat de servers de verbinding met de SAN (Storage Area Network) kwijt zijn geraakt. Het probleem kon door personeel ter plekke om 11.15 worden verholpen en vervolgens hebben wij alle virtuele servers weer online gebracht.

Wij gaan contact opnemen met de leverancier van de SAN om ervoor te zorgen dat dit probleem zich niet meer voor kan doen. Aangezien wij voor dit soort situaties van redundante RAID-controllers gebruik maken is het voor onze klanten en voor ons niet acceptabel dat het systeem alsnog last kan hebben van het stuk gaan van een enkele RAID-controller.

Alle virtuele servers lijken in ieder geval goed te draaien. Neem contact met ons op als u nog vragen of opmerkingen heeft.

  • Digg
  • StumbleUpon
  • Twitter
  • del.icio.us
  • Facebook
  • Hyves
  • Reddit

Tags: , , , ,

2 Responses to “VPS Cluster Storing”

  1. LS,

    Waarom werd jullie tweede SAN met zijn eigen set RAID controllers niet aangesproken door het cluster? Of ligt de redundantie op het niveau van de SAN zelf? Misschien is het een idee om de netwerktopologie hierop te herzien (denk aan een failover SAN o.i.d.)?

    Groet,

    Bobby Nijssen
    Relate.IT

  2. Lennard says:

    Bobby, de redundantie ligt inderdaad op het niveau van de SAN zelf. Met dubbele voeding, dubbele RAID-controllers en de schijven in RAID 6 met hot swap schijven standby. We gaan in de toekomst waarschijnlijk gemirrorde harddisken als product aanbieden, het kopie zal dan in een ander datacentrum komen te draaien met automatische load balancing.

Leave a Reply