Redundantie en betrouwbare failovers

Redundantie en betrouwbare failovers

9 April 2021 door in Optimalisatie Security

Het zijn open deuren, maar toch zijn redundantie en failovers vaak niet goed geregeld. Als er zich calamiteiten voordoen, bijvoorbeeld in een datacenter, zijn veel organisaties niet meer in staat om hun dienstverlening uit te voeren. Hoe zorg je ervoor dat je redundantie en betrouwbare failovers als organisatie wel goed hebt geregeld?

Downtime door stroomstoringen, brand of andere calamiteiten

Een stroomstoring zorgt er niet alleen voor dat huishoudens geen stroom meer hebben, maar ook organisaties zoals ziekenhuizen of datacenters kunnen er last van hebben. Op 10 maart brak er een brand uit in een van de datacenters van een Frans hostingbedrijf. Hoewel zo’n brand zeldzaam is, was het ongezien dat een volledig datacenter volledig in vlammen opgaat. Wat als jouw applicatie of platform nou net in dat datacenter was ondergebracht?

Voor organisaties die afhankelijk zijn van de beschikbaarheid van hun online dienstverlening is downtime ontzettend kostbaar. Want iedere minuut die een webshop niet online is kost geld. Als een website of applicatie eruit ligt heeft de stroomstoring niet alleen een lokale impact, maar zelfs mondiaal. Een van de manieren om dit te voorkomen is door redundantie en failovers goed geregeld te hebben.

Hoe regel je redundantie en betrouwbare failovers?

Redundantie

Met redundantie voorkom je dat door het falen van een component het hele systeem faalt. De meest gebruikelijke oplossing is om je applicatie over meerdere servers te implementeren. Hiermee verdeel je de belasting, zodat bij uitval of overbelasting van een server een andere server deze functies kan overnemen.

Betrouwbare failovers

Een failover mechanisme mag niet zelf een single point of failure worden. Je moet ervoor zorgen dat een failover betrouwbaar en automatisch is. Dit kan je doen door middel van een goede healthcheck. Zo’n check behoort alle aspecten van een applicatie te controleren, zoals de database en storage. Als een healthcheck faalt, dan moet de backend als ongezond worden gemarkeerd en moet er niet langer verkeer naar toe gestuurd worden. Een DevOps engineer kan vervolgens controleren of de redundantie vanzelf herstelt of dat het handmatig moet gebeuren.

Verschillende geografische locaties

Zoals aan het begin van het artikel geschetst werd kan een brand in een datacenter gebeuren. Als jouw applicaties en databases slechts in een enkel datacenter staan kan dit tot flinke downtime leiden. Zet je servers dus op verschillende locaties door gebruik te maken van meerdere datacenters of availability zones.

5 vragen die je kan stellen aan jouw datacenter en hosting provider over redundantie

Je zal hoogstwaarschijnlijk niet je internetdienstverlening regelen vanuit je eigen kantoor. Servers van organisaties staan in een datacenter. Maar wat maakt een datacenter een professioneel datacenter? Hoe regelen zij redundantie en failovers? Om daarachter te komen zijn er een vijftal vragen die je kunt stellen bij het maken van een keuze voor een datacenter en hosting provider:

  1. Hoe zijn de noodstroomvoorzieningen geregeld en hoe ziet het continuïteitsplan eruit bij langdurige onderbrekingen?
    In geval van storingen wil je weten of voorzieningen en apparatuur N+1 zijn aangesloten. Vraag ook naar stand-by generatoren en wat de procedure is voor aanvoer van extra brandstof.

  2. Worden de noodstroomvoorzieningen ook regelmatig getest?
    Als je een goed antwoord op de eerste vraag krijgt, dan wil je ook weten of dit regelmatig getest wordt. Het mag niet zo zijn dat in geval van nood het in de praktijk toch niet (goed) lijkt te werken. Door te testen voorkom je nare verrassingen.

  3. Wordt apparatuur op twee verschillende powerfeeds aangesloten?
    Als er een probleem met een van de feeds optreedt, voorkomt dit uitval van de apparatuur. Een goede vraag voor jouw hostingprovider.

  4. Is er een optie tot failover naar een tweede datacenter?
    Bij grote calamiteiten van een datacenter (denk even aan de brand bij het Franse datacenter) zorgt een tweede locatie voor nog meer zekerheid. Maakt jouw hostingprovider gebruik van meerdere datacenters en is het netwerk ook volledig redundant over verschillende locaties?

  5. Kan je kiezen voor verschillende geografische locaties?
    Het gebruik van verschillende geografische locaties heeft misschien in de praktijk meer te maken met het realiseren van een lagere latency, maar het is ook een middel om massale uitval in een hele regio op te vangen.

Hoe heeft Cyso redundantie en betrouwbare failovers geregeld?

Voor organisaties met bedrijfskritische applicaties die afhankelijk zijn van het internet kan het natuurlijk niet zo zijn dat de dienst stil komt te liggen.

Daarom heeft Cyso meerdere datacenters die volledig autonoom en als failover kunnen werken. Om onze bedrijfsvoering bij storingen veilig te stellen hebben wij verschillende maatregelen genomen die ook allemaal onderdeel vormen van onze ISO 20000 en ISO 27001 certificeringen. Tot deze maatregelen behoren onder andere:

  • Wij kiezen alleen voor de beste apparatuur en de beste datacenters van Nederland. Onze datacenters testen de noodstroom regelmatig en wij kiezen voor hoogwaardige apparatuur die voorzien is van dubbele stroomvoorziening. Wij sluiten alles dubbel aan zodat risico’s bij tests en onderhoud geminimaliseerd worden.
    Lees hier meer over onze: netwerk en datacenter faciliteiten.

  • Wij gebruiken hardware met interne redundantie en self-diagnostics. Falende onderdelen worden automatisch gedetecteerd en altijd snel vervangen via garantie van de fabrikant.

  • Ons netwerk en onze cloud platformen zijn redundant uitgevoerd; alle noodzakelijke apparatuur is minimaal dubbel aanwezig om online te blijven in het geval van uitval. Onze klanten kunnen eveneens kiezen voor een dubbele datacenter oplossing. Problemen als gevolg van storingen door defecten aan apparatuur of verbindingen worden hiermee zoveel mogelijk voorkomen.

  • De voorbereiding en het stappenplan bij onderhoudswerkzaamheden aan onze infrastructuur worden vooraf door een tweede (en soms derde) collega gecontroleerd om fouten te voorkomen.

Desondanks is het onmogelijk om (menselijke) fouten 100% te voorkomen. We zorgen er daarom voor dat de kans op uitval geminimaliseerd is en de mogelijke impact zo klein mogelijk.

Back-up en disaster recovery planning

Naast het voorkomen van downtime, moet je ook er op voorbereid zijn als het wel een keer mis gaat. Betrouwbare en consistente back-ups (zeker weten dat je alle benodigde data terugkrijgt op het moment dat je moet restore) klinken heel vanzelfsprekend, maar is vaak niet het geval. Zorg dat je regelmatig back-ups maakt naar een ander datacenter en denk ook na over de recovery time objective (RTO, de maximale restore tijd) en de recovery point objective (RPO, de hoeveelheid van dataverlies bij een restore).

Een disaster recovery planning voor herstel moet niet alleen goed zijn vastgelegd maar ook regelmatig getest worden om de effectiviteit ervan te verzekeren in geval van ongeplande storingen. Net zoals dat een datacenter zijn failovers regelmatig moet testen, geldt dit ook voor jouw organisatie.

Lees hier meer over back-up en disaster recovery.

Hoe kunnen wij jou helpen?

Wil je eens praten over hoe Cyso jouw organisatie kan helpen met redundantie en failovers en 24×7 beschikbaar kan houden? Hoe wij je helpen het overzicht te bewaren en hoe je jouw cloud beheersbaar houdt? Wij helpen je met de continuïteit en zorgen ervoor dat verschillende clouds workloads van elkaar overnemen tussen de applicatie ketens. Door jouw data beschikbaar te houden wanneer en waar je het ook nodig hebt profiteer je van de cloud strategie. Neem vandaag nog contact met ons op om de voordelen voor jouw organisatie te bespreken.

Neem contact met ons op


Kwaliteit. Betrouwbaar. Betrokken.
  • 24/7 service support
  • Nederlandse datacenters
  • ISO 27001 gecertificeerd
Bel me terug