Wanneer AWS’s US-Oost-1-regio werd donker eind oktober, slechts een week later gevolgd door één Microsoft Azure-storinghet was opnieuw een duidelijke herinnering dat zelfs de grootste cloudproviders ter wereld niet immuun zijn voor mislukkingen. Een simpele DNS-fout in Route 53 van AWS kwam naar buiten, waardoor applicaties werden uitgeschakeld, databaseservices werden verstoord en ons eraan werd herinnerd hoe afhankelijk onze technologie-infrastructuur is geworden van een handvol cloudregio’s. Met “een onbedoelde wijziging in de tenantconfiguratie”, benadrukte de Azure-storing de instabiliteit van sommige van deze systemen verder, wat opnieuw aantoont hoe kleine veranderingen een behoorlijk grote impact kunnen hebben.
Met CyberCube Als we schatten dat de kosten van de AWS-storing tussen de $38 en $581 miljoen kunnen liggen, kan de financiële en operationele tol van deze storing niet genoeg worden benadrukt. Dit geldt vooral voor kleinere en middelgrote organisaties die niet over de middelen beschikken om downtime van enkele uren of meerdere dagen op te vangen. Voor veel bedrijven bracht deze laatste verstoring de verborgen kosten van cloudcentralisatie aan het licht: als één regio hapert, kan alles tot stilstand komen.
Onderbrekingen zijn onvermijdelijk. Zelfs de eigen CTO van AWS heeft dat gedaan zei zoveel: Systemen zullen falen, dus moeten ze gebouwd worden om falen te verwachten en te weerstaan. Toch ontwerpen te veel organisaties alsof de cloud zelf onfeilbaar is. Ze gaan ervan uit dat redundantie, back-ups en herstel automatisch zijn ingebouwd en ontdekken te laat dat dit niet het geval is.
Het goede nieuws is dat veerkracht kan worden ingebouwd voordat de volgende mislukking zich voordoet.
DIVERSIFICATIE VOOR DISRUPTIE: WACHT NIET OP DE VOLGENDE DISRUPTIE
De eerste verdedigingslinie is eenvoudig van opzet, maar lastig in uitvoering. Je moet diversifiëren voordat het noodlot toeslaat. Zie het als een beleggingsportefeuille. Je zou niet al je geld op één enkele rekening zetten; het is verspreid over een aantal opties om uw belegging de meeste kans van slagen te geven. Dit betekent ontwerp voor mislukking over meerdere beschikbaarheidszones of regio’s. AWS raadt dit zelfs aan in hun “AWS goed gebouwd” gids.
Een goed ontworpen systeem zou verkeer binnen enkele seconden van de ene regio naar de andere (bijvoorbeeld US-Oost-1 naar US-West-1) moeten kunnen verplaatsen. Bij uitval worden zelden meerdere regio’s tegelijk uitgeschakeld, dus een architectuur met meerdere regio’s blijft een van de meest effectieve verdedigingen tegen downtime.
DRAAI NAAR MULTICLOUD EN ELIMINEER VERSPILDE UITWISSELING
Sommige organisaties gaan nog een stap verder en verdelen de werklast over meerdere cloudproviders. Multicloud-ontwerpen bieden extra veerkracht, maar vereisen aanzienlijke complexiteit en technische vaardigheden, evenals potentieel hogere kosten. De sleutel hier is om klein te beginnen en alleen uw meest kritieke werklasten of besturingsvlakken naar redundantie te verplaatsen. Nadat u de complexiteit en de kosten ervan hebt beoordeeld, kunt u vervolgens uitbreiden.
De meeste bedrijven zullen diversificatie over meerdere regio’s binnen één cloud praktischer vinden, maar welke route ze ook kiezen, de mentaliteit moet hetzelfde zijn: ga ervan uit dat er iets kapot gaat en plan dienovereenkomstig.
Even belangrijk is het identificeren en elimineren van verspilde technologie-uitgaven. Niet alle workloads hoeven in de duurste configuratie met hoge beschikbaarheid te worden uitgevoerd. Door middel van een goede analyse van de bedrijfsimpact kunnen organisaties investeringen koppelen aan risico’s, geld uitgeven waar een mislukking het bedrijf echt zou schaden, en besparen waar ze kunnen. Voor kleinere bedrijven is dit inzicht in wat bedrijfskritisch is en wat kan wachten om weer online te komen, de sleutel tot kosteneffectieve veerkracht.
BCDR VOOR DATACENTERBEHEER EN NETWERKVEERKRACHT
Als uw organisatie zich al heeft gediversifieerd over verschillende geografische regio’s of zelfs over verschillende cloudproviders, is het van cruciaal belang om te beseffen dat veerkracht niet ophoudt bij deze infrastructuurkeuzes. Dit is waar plannen voor bedrijfscontinuïteit en rampenherstel (BCDR) een rol gaan spelen. Diversificatie helpt de blootstelling te verminderen. Maar zonder een beproefd plan om te reageren als er iets misgaat, kan zelfs de best geconstrueerde omgeving wankelen. Als je ergens op voorbereid bent, kan niets je faseren.
Wat de BCDR-plannen van uw organisatie ook zijn, een eenvoudige manier om uw veerkracht op te bouwen is door deze plannen regelmatig te testen. Netflix maakt gebruik van een tool die zij Chaos Monkey noemen en die productie-instanties willekeurig uitschakelt om ervoor te zorgen dat systemen onverwachte storingen kunnen weerstaan. Het is niet te zeggen hoe en wanneer de Chaos Monkey zal toeslaan. Door opzettelijk chaos te creëren, moeten teams fouttolerante architecturen bouwen die snel kunnen herstellen en onder stress kunnen blijven functioneren. Dit is een extreem voorbeeld.
Kleinere organisaties kunnen beginnen met een of twee keer per jaar testen en de plannen verfijnen naarmate ze groeien. Grotere organisaties willen dit soort tests mogelijk vaker uitvoeren, bijvoorbeeld elk kwartaal, voordat ze in de voetsporen van Netflix treden. Hoe dan ook, stof de map af en geef dat plan een upgrade die geschikt is voor elke situatie.
EEN TOEKOMSTGERICHTE VEERKRACHTMINDSET
Net zoals we geen steden op enkele bruggen bouwen, mogen we de digitale economie ook niet op een handvol hyperscale regio’s verankeren. De recente storingen bij AWS en Microsoft waren niet de eerste in hun soort, en zullen zeker ook niet de laatste zijn. Het verschil tussen deze en de volgende zal liggen in de mate waarin organisaties voorbereid zijn.
De verborgen kosten van centralisatie zijn niet alleen maar downtime; het is de kwetsbaarheid die in moderne digitale systemen is ingebakken. Als u niet vooraf geld uitgeeft aan architectuur voor storingen en storingen, verliest u op de lange termijn nog meer. Maar met slimme architectuur en gedisciplineerde investeringen kunnen we de kwetsbaarheid uit het verleden omzetten in toekomstige veerkracht en op de lange termijn kosten besparen.
De volgende uitkomst is niet een kwestie van wanneer. De vraag is: ben je er klaar voor of blijf je platvoetig?
Juan Orlandini is Chief Technology Officer voor Insight Enterprises.
De uiterste deadline voor Fast Company’s Wereldveranderende ideeënprijzen is vrijdag 12 december om 23:59 uur PT. Solliciteer vandaag nog.



