World Backup Day - Backup Strategie voor dummies

Door DarthPlastic op zaterdag 31 maart 2018 13:47 - Reacties (3)
Categorie: Tech, Views: 1.135

Vandaag is het 31 maart, World Backup Day!
De uitgelezen mogelijkheid om iets te schrijven over back-ups.
Waarom? Veel techneuten weten prima wat een back-up is en doet, maar kunnen deze niet (goed) koppelen aan de vragen vanuit het bedrijfsleven. Daarnaast is het een manier om niet-technische mensen inzicht en informatie te geven over de strategie en opbouw van goed werkende back-ups

Een week geleden lazen jullie in mijn startpost ('Behind the scenes' bij IT-bedrijf SuitIT) dat ik in lekentaal ga schrijven over diverse IT-gerelateerde onderwerpen. Op deze manier zijn blogs te volgen door professionals op het gebied van IT, maar ook door de geïnteresseerde lezer die meer over een bepaald onderwerp te weten wil komen.

Deze blogpost start ik met enkele algemene begrippen en technieken over back-ups en vervolgens geef ik een aantal praktische tips bij twee verschillende casussen:
  • Een goede zakelijke backupstrategie
  • Gemakkelijke back-ups voor je privédata
Risico's en maatregelen
Voordat je écht een goed passende strategie kunt uitwerken, moet je eerst stilstaan bij de vraag: "Waar wil ik mijn data tegen beschermen?"

Enkele mogelijke risico's waarvoor je je kunt indekken:
  • A. Menselijke fouten
    Een voorbeeld van een menselijke fout kan het (per ongeluk) verplaatsen of verwijderen van data zijn. Je opslagmedium is dan wellicht (fysiek) nog in orde, maar je hebt zelf schade aangericht aan je data.
    Een goede bescherming tegen dit soort fouten is het gebruik van bijvoorbeeld snapshots, shadow copies (Windows) of Time Machine (Mac). Je kunt dan letterlijk enkele versies 'terug in de tijd'. Het kan wenselijk zijn om verder terug te kunnen; je hebt dan meer back-up ruimte nodig.
  • B. Virus-uitbraak
    Een voorbeeld van een virusuitbraak is een cryptolocker die alle data versleutelt en zowel alle bestandsnamen als de inhoud onleesbaar maakt.
    In een aantal gevallen kun je je snapshots of shadowcopies inzetten om de fout te herstellen en kom je er goed mee weg. Als het virus er echter in slaat om je shadowcopies ook te beschadigen heb je een probleem. Daarom is het verstandig om een kopie op een ander medium te hebben staan, los van 'de hoofdopslag', waar een virus niet (eenvoudig) naar door kan breken.
  • C. Crashes of storingen
    Vergelijkbaar met een zware virusinfectie, kan een (fysieke) crash of storing zorgen voor permanente beschadiging of vernietiging van je data. Dit is op gelijke manier te voorkomen door een losstaand back-up medium in te zetten.
  • D. Brand
    Wat als je brand krijgt, en zowel je data-media áls backup-media verloren gaan? Om hier tegen te beschermen is het noodzakelijk om een back-up op een fysieke andere locatie te hebben staan.
De tweede vraag die je jezelf kunt stellen is: "Wat is mijn data me waard?"
Heb je een onderneming, weeg af wat dit het bedrijf per uur, per dag of per week kost.
Er zijn twee belangrijke begrippen binnen IT: RTO en RPO.
  • RTO (Recovery Time Objective)
    Stel dat er een calamiteit plaatsvindt die ervoor zorgt dat een applicatie offline gaat, hoe lang duurt het dan voordat de IT-omgeving met de desbetreffende applicatie weer volledig functioneert? Dit drukken we uit in een tijdseenheid: Recovery Time Objective (RTO).
    Een voorbeeld: een RTO van bijvoorbeeld twee uur garandeert dat de applicatie in het meest extreme geval twee uur offline is.
  • RPO (Recovery Point Objective)
    Naast RTO is er een tweede factor die bepalend is voor de impact van een crash of storing: de hoeveelheid data die verloren gaat. Ook dit wordt uitgedrukt in een tijdseenheid. Een RPO van vier uur betekent dat in het ongunstigste geval alleen de data die verwerkt werd in de laatste vier uur voorafgaand aan het moment van uitval verloren gaat. Alle data die voor dat moment verwerkt werd, gaat niet verloren. Voor RPO geldt ook dat dit een maximale waarde is. In de praktijk kan er minder data verloren gaan, maar in principe niet méér.
    Een voorbeeld: Als je iedere nacht om 06:00 uur een back-up laat maken en de volgende ochtend om 11:00 uur een crash hebt, dan ben je de data van de tussenliggende 5 uur kwijt. Met een RPO bepaal je zelf wat de maximale tijdsduur mag zijn die tussen 'nu' en 'de laatst gemaakte back-up' zit.
Om kostenbewust met RPO- en RTO-tijden om te gaan kun je twee tijden bepalen: een "objective" wat je in 90% van de gevallen wilt kunnen halen en een "maximum" wat het absoluut hoogst toelaatbare is. Het willen beschikken over een lagere RPO- en RTO-tijd betekent namelijk ook dat er geïnvesteerd moet worden in de nodige componenten en systemen om dit voor elkaar te krijgen.
RPO-vs-RTO


De gouden 3-2-1 regel
Om data veilig (genoeg) te bewaren is de zogenaamde 3-2-1 regel voor het bewaren van data in het leven geroepen.
In het kort:
  • Bewaar je data op minstens drie verschillende plekken
  • Op minstens twee verschillende media
  • Waarvan minstens één externe locatie
Back-up

Soorten back-ups
Hier wordt weinig bij stil gestaan, en is toch wel degelijk belangrijk:
  • Volledige backups
    Een volledige backup is een 1:1, volwaardige kopie van je data. Deze kan dus direct gebruikt worden om op terug te vallen, mocht hier nood aan zijn.
  • Incrementele of differentiële backups
    Een incrementele/differentieële backup is een backup van alle veranderingen in je data tussen je vorige back-up en nu. Op zichzelf is deze back-up niet bruikbaar, omdat hij slechts de bestanden bevat die gewijzigd zijn. Als aanvulling op een volledige back-up, is dit echter een goede strategie om met weinig ruimte meerdere 'herstelpunten' aan te maken.
Een goede back-up bestaat uit een combinatie van een aantal volledige en incrementele back-ups, om maximale zekerheid en flexibiliteit te bieden én optimaal kosten-efficiënt bezig te zijn.

Casus1: Zakelijke back-up strategie
Zakelijke data is meestal erg bewerkelijk omdat hier met grote aantallen medewerkers tegelijk aan gewerkt wordt. Stel een 'baseline' in waaraan de back-up moet voldoen en maak uitzonderingen waar nodig.
Onderstaande tijden zijn een voorbeeld voor een fictief MKB-bedrijf met 50 medewerkers en een ERP-systeem waarin men orders boekt en verwerkt.
Baseline (e-mail; datashare; applicaties):
RPO: 1 uur, max. 24 uur
RTO: 4 uur, max. 8 uur
ERP-systeem (orders, logistiek, administratie):
RPO: 1 uur, max. 4 uur
RTO: 4 uur, max. 4 uur
Archiefdata (oude administratie; marketingarchieven e.d.):
RPO: 24 uur, max. 7 dagen
RTO: 8 uur, max. 7 dagen

We kiezen hier voor vier technieken (vier verdedigingslinies, afhankelijk van hoe je het wil zien):

1a. Snapshots op de fileservers
Eigenlijk niet als officiële back-up te tellen, meer als zekerheid: bedoeld voor bescherming tegen gebruikersfouten of (beperkte) virusaanvallen.
Je gebruikt deze methode vooral om snel en gemakkelijk data terug te kunnen zetten. Het voordeel aan deze techniek is dat eindgebruikers eventueel zelf bestanden terug kunnen zetten indien gewenst.
Uitgevoerd door elk uur een Shadow Copy job op de fileservers uit te voeren, weggeschreven op de server zelf.
De RPO is dus 1 uur; de RTO is 1 tot 30 minuten.

1b. Transactie Backups op de databaseservers
Een SQL-server schrijft transactielogs op de server weg. Met deze logs kan men zeer nauwkeurig transacties terugdraaien. Wanneer de betreffende server/database echter volledig crasht zijn deze logbestanden ook weg. Vandaar elk uur een kopie van (enkel) de transactielogs, om deze te gebruiken i.c.m. de laatste full backup van de vorige nacht.
De RPO is dus 1 uur; de RTO is 5 minuten tot 4 uur.

2a. On-site back-ups
Deze back-up is bedoeld als bescherming tegen de meeste grote storingen, servercrashes of virusaanvallen. Deze data wordt niet weggeschreven op de server zelf, maar op een ander medium. Als voorbeeld: een NAS/SAN in de serverruimte, en Veeam Backup&Recovery als software.
Elke nacht laat je een volledige kopie van álle data op dit backupmedium opslaan.
De maximale RPO is hiermee 24 uur; de RTO is 1 tot 4 uur.

2b. On-site back-up archieven
Deze back-up is bedoeld om verder terug in de tijd te gaan, als de eerste backup-opslag een storing heeft, of om de restoresnelheid te verhogen indien er meerdere servers met data tegelijkertijd moeten worden hersteld.
Dit medium kan bestaan uit een NAS of andere media, bijvoorbeeld backuptapes.
Elke nacht laat je de meest recente backup dupliceren naar de tweede opslagruimte. Tevens worden hier naast afgelopen nacht, ook de afgelopen 4 wekelijkse backups bewaard, en de afgelopen 6 maandelijkse backups.

3. Off-site back-ups
Deze back-up is bedoeld als disaster recovery bij overmacht (brand, water, e.d.) of een grote storing waarbij zowel de hoofdopslag én de back-up opslag verloren gaan.
Als voorbeeld: Off-site backupopslag kan bestaan uit dataruimte in de cloud, via Veeam Cloud Connect, of Amazon S3 / Glacier.
Via internet kan de back-up data 's nachts worden getransporteerd.
Ook worden hier soms nog tapes voor gebruikt, wegens de lage kosten per TB opslagruimte en lange bewaartijd. Sommige bedrijven zijn verplicht om alle data binnenshuis te houden; dan kan tape ook een aantrekkelijke optie zijn.

Casus 2: Prive back-up strategie
Vergeleken met zakelijke data, is privédata (meestal) wat minder spannend en er is minder budget voor een back-up oplossing.
Als voorbeeld stellen we de volgende tijden:
RPO: 14 dagen
RTO: 2 dagen
Wegens de hogere RPO en RTO tijden, kan er goed op de kosten geschaafd worden.
Dit kunnen we als volgt aanpakken:

1. Snapshots op de PC of NAS
Vrijwel elke PC (Mac) of NAS ondersteunt snapshots, op een soortgelijke manier als in de vorige casus besproken.
Voorbeeld Windows: Configuring Windows 10 File History (NB: Je hebt hier wel een extra harddisk voor nodig)
Voorbeeld Mac: A Beginner's guide to Mac File Versioning
Voorbeeld NAS: Synology / QNAP / Netgear

2. Lokale back-ups
Voorbeeld Windows: Veeam Agent (freeware!)
Voorbeeld Mac: Time Machine gebruiken

3. Online back-ups
Windows/Mac: Cloud-backups zijn gemakkelijk te regelen via o.a. CrashPlan Pro of Carbonite. Het idee is 'set it and forget it', waarbij de software een volledige versleutelde kopie van je files maakt, en vervolgens elke 15 minuten een incrementele back-up van de wijzigingen bijhoudt.
N/B: Uit eigen ervaring weet ik dat zowel de back-up tijd als restoretijd bij Crashplan helaas erg lang is. Het is een goedkope manier om veel data veilig te stellen, maar reken erop dat je in de praktijk met maximaal 1 tot 5 MB/s kunt lezen of schrijven, ook al heb je een snelle internetverbinding.

Testen
Het klinkt voor de hand liggend om back-ups regelmatig te testen. Toch gebeurt dit niet vaak (genoeg). Gebruik een testmoment om je RPO en RTO te evalueren. Hoe eenvoudig was het om de back-up terug te zetten?


Middels dit artikel zijn back-ups geen moeilijk begrip meer. Ik houd het technisch niveau in de tekst bewust vrij laag, zodat dit artikel door een breed publiek goed te lezen is.
Vragen of aanvullingen? Ik ben benieuwd naar je comment hieronder!

Volgende: Ondernemerschap 101: Je bedrijf starten in vogelvlucht 08-04 Ondernemerschap 101: Je bedrijf starten in vogelvlucht
Volgende: 'Behind the scenes' bij IT-bedrijf SuitIT 23-03 'Behind the scenes' bij IT-bedrijf SuitIT

Reacties


Door Tweakers user TenTimes, zondag 1 april 2018 15:03

Interessant om jouw visie te zien. Alleen denk ik dat de zakelijke oplossing voornamelijk voor Zzp'ers of klein MKB is.

De soorten storage zijn namelijk totaal ontoereikend voor dagelijkse backups. Tape wordt over het algemeen alleen voor offsite en long term retention gebruikt. Je primaire (en eventueel secundaire) backups staan op SAN of DAS omdat je hiermee deduplicatie kan gebruiken.

Momenteel begint cloud storage langzaam te beginnen voor backup storage maar over het algemeen zie je dit niet voor grote bedrijven vanwege security en kosten.

Geef sowieso aan dat snapshots geen backups zijn omdat deze op dezelfe hardware staat als de data die beschermt moet worden.

Vergeet hiernaast differential backups niet ipv meer full backups.

[Reactie gewijzigd op zondag 1 april 2018 15:06]


Door Tweakers user Rossi, dinsdag 3 april 2018 17:56

MKB is inderdaad de markt waar dit scenario uitermate op van toepassing is.
Mijn werkgever heeft een hele hoop (klein)MKB als klant, en dit soort oplossingen wordt bij ons ook vaak toegepast.

Ik blijf je blogs volgen, keep it up!

Door Tweakers user ericq, woensdag 11 april 2018 12:04

Interessant stukje, erg goed geschreven! Heb zelf nog nooit stil gestaan bij de RPO en RTO tijden. Misschien is het ook goed dat deze niet altijd vast staan :)

@TenTimes De zakelijke backup strategie lijkt me van toepassing in alle bedrijfsgroten. Voor als je een enkele server hebt of 100 servers. Een on-site storage voor de snelle herstel en off-site voor disaster recovery. DarthPlastic beschrijft dat dit prima in de "cloud" kan.

Zelf gebruiken wij ook Veeam. Per bedrijf is er een lokale backup machine met storage. Deze word gerepliceerd naar een Ceph storage bij ons in het datacenter.

Bij het terug halen of testen van een restore, Houd er rekening mee dat dit altijd in een test omgeving gedaan word. Vaak is hierdoor de eerste server die je moet herstellen de Domain Controller. Als je de DC ook als file server gebruikt en je als eerste een App server wilt gebruiken kan dit de restore tijden verlengen.

Reactie formulier
(verplicht)
(verplicht, maar wordt niet getoond)
(optioneel)