Eén van de grootste voordelen van digitalisering is het winnen van tijd

Redundantie

Wat is redundantie?

Vertaald naar het Nederlands betekent redundant: “overbodig”, “overtollig” of “meer dan strikt noodzakelijk”. Je ziet het woord veel gebruikt worden in de IT en daar heeft het een meer positieve betekenis. In de IT of automatisering betekent redundant: meervoudig uitvoeren en heeft het betrekking op het beveiligen van je IT en automatiseringssystemen.

Redundantie binnen je productiebedrijf is belangrijk. Je wil immers voorkomen dat je hele fabriek stilligt als er één computer een storing heeft. En je wil dat het noodstroomaggregaat aanspringt als de hoofdstoomvoorziening uitvalt. Deze noodstroomaggregaat is een vorm van redundantie. Toch moet je ook uitkijken dat je niet te ver gaat met de redundantie van je systeem.

Redundantie is dus processen of voorzieningen meer dan één keer uitvoeren om zo continuïteit van je processen te waarborgen.

 

Wat moet redundant zijn?

Je cruciale systemen moeten redundant zijn. Maar wat is cruciaal en hoe ver ga je daarin? Is één netwerkverbinding genoeg of wil je er twee? Met twee verbindingen ben je redundant maar als je eerste verbinding 10 Gbps is en je secundaire 1 Gbps, is dat dan voldoende redundant?

Om te weten wat allemaal redundant moet zijn maak je een risicoanalyse. Je stelt als bedrijf een aantal scenario’s op waarbij je antwoord geeft op de vraag: Wat als…? Wat als de lokale back-up niet meer werkt? Wat als de server het begeeft? Wat als er een laptop kapot is? Wat als er een switch stuk is? Wat als de elektriciteit uitvalt? Wat als het internet uitvalt? Etc.

Vervolgens geef je per antwoord aan of het gevolg aanvaardbaar is of niet. Bijvoorbeeld als een laptop uitvalt en je hebt geen nieuwe op voorraad. Dat betekent dat 1 persoon die dag niet kan werken. Maar als je internetverbinding uitvalt kunnen alle mensen van het hoofdkantoor niet meer werken.

Over het algemeen is het aanvaardbaar als één persoon een dag zijn of haar werk niet kan doen en is het onaanvaardbaar als bijvoorbeeld 150 mensen hun werk niet meer kunnen doen of dat een hele productielijn een dag stilligt.

Bij het bepalen of iets aanvaardbaar is of niet weeg je ook altijd de kosten van het redundant maken af tegen de baten, ofwel de kosten van uitval. Niet alles moet dus redundant zijn. Het is belangrijk dat de “single points of failure” uit het systeem gehaald worden.

 

Waar let je op?

Het moge duidelijk zijn dat redundantie binnen de maakindustrie belangrijk is. Je wil immers downtime zoveel mogelijk beperken. Daarbij zullen goede afwegingen gemaakt moeten worden over welke aspecten in het proces meervoudig uitgevoerd worden.

Wanneer je een single point of failure dubbel uitvoert heb je de betrouwbaarheid verhoogd. Voer je deze echter drie keer uit dan is je betrouwbaarheid nog hoger. Beide uitvoeringen zijn redundant wat dus betekent dat je aan de term redundant weinig waarde kunt hechten. Je kunt een netwerkverbinding bijvoorbeeld dubbel uitvoeren over hetzelfde pad of over gescheiden paden. Beide zijn redundant maar twee verbindingen over gescheiden paden is meer betrouwbaar. Dit zagen we al eerder in het voorbeeld van de capaciteit van een dataverbinding waar de primaire verbinding een capaciteit heeft van 10 Gbps en de secundaire een capaciteit van 1 Gbps. Je hebt twee verbindingen waardoor het redundant is maar je secundaire kan onvoldoende capaciteit hebben waardoor je nog steeds een verhoogd risico loopt.

Het is dus belangrijk dat je niet alleen naar de specificaties kijkt maar naar het gehele proces en de vereisten per single point of failure. Stel jezelf altijd een aantal vragen en breng je infrastructuur duidelijk in kaart. Waar zitten de zwakke punten? Welke bedreigingen zijn er? Hoe groot zijn deze bedreigingen en wegen de kosten op tegen de baten?

 

Redundantie in 6 stappen

Wanneer IT-systemen of applicaties uitvallen kunnen de schadeposten hoog uitvallen. Om je op weg te helpen naar een goede redundantie geven we je 6 aandachtspunten waarmee je aan de slag kunt. Gebruik hierbij ook de eerder gemaakte risicoanalyse en weeg de kosten af tegen de baten.

1. De infrastructuur fysiek scheiden
Het hebben van een redundant fysieke infrastructuur wordt vaak onderschat. Het gebruiken van twee verschillende infrastructuurleveranciers is namelijk geen garantie voor een redundant infrastructuur. De verschillende verbindingen zullen ook fysiek gescheiden moeten zijn en niet via dezelfde aanvoerleidingen mogen lopen. De kans dat bij graafwerkzaamheden beide verbindingen geraakt worden is namelijk groot. Ook moet je rekening houden met de onderhoudsplanning van beide leveranciers en wil je voorkomen dat beide leveranciers op hetzelfde moment de verbinding tijdelijk onderbreken.

2. Actieve netwerkapparatuur dubbel uitvoeren
Door componenten dubbel uit te voeren bereik je redundantie en ontstaat er een back-up voor het geval er iets uitvalt. De activiteiten worden dan naadloos overgenomen door een ander component. Wanneer de beschikbaarheid van data een single point of failure is dan kun je het datacenter dubbel uitvoeren. In dat geval maak je synchrone back-ups waarbij het noodzakelijk is om ook de netwerkswitches en routers dubbel uit te voeren. Doe je dat niet dan vormt de actieve netwerkapparatuur het single point of failure.

In de IT-omgeving kan ook de hardware dubbel worden uitgevoerd. Hiervoor zijn vele mogelijkheden. Zo kun je opslagmedia configureren dat de data wordt verspreid over meerdere drives en gaat er geen data verloren als een schijf uitvalt. Ook kunnen servers geclusterd worden of je maakt gebruik van load balancing of virtualisatie.

3. Fail-over procedures implementeren
Met het redundant uitvoeren van componenten ben je er nog niet. Je zult ook protocollen moeten uitwerken zodat deze componenten elkaars activiteiten ook daadwerkelijk uitvoeren. Vervolgens ga je mogelijke fouten simuleren en krijg je een goed beeld of de gewenste fail-over goed werkt. Daarbij is het belangrijk om in kaart te brengen welke fouten het meeste voorkomen en hoe de apparatuur daarop moet reageren. Vervolgens leg je vast hoe deze fouten gerapporteerd worden naar het managementsysteem zodat storingen snel kunnen worden opgelost en fouten worden hersteld.

4. Randapparatuur ook dubbel uitvoeren
In je productieproces heb je te maken met je primaire systemen die essentieel zijn voor je continuïteit. Het ligt voor de hand dat je deze redundant uitvoert. Maar naast je primaire systeem heb je te maken met randapparatuur. Een primair systeem is bijvoorbeeld de energievoorziening. Deze kun je redundant maken door het toevoegen van een noodstroomvoorziening als een aggregaat. Om te voorkomen dat je systeem uitvalt tussen het wegvallen van de primaire stroomvoorziening en het opstarten van de noodstroomaggregaat maak je gebruik van een UPS (Uninterruptible Power Supply). Dit is een batterij die de stroomlevering overneemt tijdens het opstarten van de noodstroomvoorziening. Met een dubbele UPS is deze randapparatuur ook redundant.

5. Een dubbel datacenter
Een ultieme vorm van redundantie is een twin datacenter. Twee IT-omgevingen die volledig gelijk aan elkaar zijn, die de data direct synchroniseren en die geografisch op verschillende locaties liggen. Is in één van de centra een storing dan ondervinden de gebruikers geen verlies van gegevens en merken niets van de uitval. Tussen beide centra moet wel een fysiek gescheiden infrastructuur lopen voor een nog optimalere redundantie.

6. De redundantie van een extern datacenter
Voor externe datacenters bestaat de tier-normering die bepaald is door het Uptime Institute uit Seattle (USA). Deze tier-normering bestaat uit vier gradaties en zegt iets over de beschikbaarheid en maximale downtime van een datacenter en geeft daarmee ook antwoord op de mate van redundantie.

Een tier-1 en tier-2 datacenter beschikt bijvoorbeeld niet over redundant uitgevoerde apparatuur. Bij een tier-3 datacenter is alle apparatuur waaronder koeling, noodstroomvoorziening en UPS dubbel uitgevoerd en is de beschikbaarheid op 99,982% vastgesteld met een maximale downtime van 1,6 uur per jaar. En een datacenter met tier-4 certificering heeft alle apparatuur standaard dubbel uitgevoerd en worden back-ups gemaakt. De beschikbaarheid wordt gegarandeerd op 99,995% met een maximale downtime van 0,8 uur per jaar.

 

Een redundant besturingssysteem

Naast het meervoudig uitvoeren van alle hardware en fysieke structuren om redundantie te verkrijgen kun je ook kijken naar de software. In dat geval voer je bijvoorbeeld het besturingssysteem meervoudig uit door deze op twee verschillende servers te zetten.

Ignition van Inductive Automation biedt daarvoor twee oplossingen:
De back-up only licentie
Of twee standaard licenties

Voer je een besturingssysteem meervoudig uit met een standaard licentie dan kan het een kostbare investering kan zijn. Ignition lost dit op met de back-up only licentie die 50% goedkoper is dan de volledige licentie.

 

Tot slot

Redundantie is een belangrijk onderwerp om de continuïteit van je productie te optimaliseren maar niet elke organisatie heeft de meest optimale redundantie nodig. Kernvraag blijft of de kosten opwegen tegen de baten. Wat kost downtime en wat kost het redundant maken van je systemen? Sta daarbij even stil bij zaken als:

  • Hoeveel medewerkers kunnen niet werken?
  • Hoeveel klanten kunnen niet geholpen worden?
  • Hoeveel omzet loop je mis?
  • Wat doet downtime met het bedrijfsimago?
  • Zijn er schadeclaims te verwachten en hoe hoog kunnen die zijn?

Je kan altijd vrijblijvend contact met ons opnemen. We komen graag langs voor een persoonlijke demo welke je hier aan kunt vragen.