PLYNDRINGSTOKT

Backup vs RAID

Backup vs RAID
Sikkerhetskopier er en viktig del av vårt digitale liv. Hver datamaskin fra gigantiske databaser til en enkelt personlig datamaskin eller mobilenhet trenger en sikkerhetskopi. Et sted der de mest relevante brukerdataene kan lagres i lang tid og også lagres på en slik måte at de kan gjenopprettes i nødstiden. Vi kan trekke et skille mellom dataene på vårt nåværende system, la oss kalle det live data, og støttet opp data. Sistnevnte lagres vekk fra det nåværende systemet som bruker live data.

RAID, bekymrer seg for live data, det er en mekanisme som et løpende system kombinerer flere disker til en enkelt lagringsenhet. Dataene blir deretter spredt over alle diskene på en slik måte at de kan overleve svikt i minst en (eller flere) av de fysiske diskene. Den enkleste typen RAID-array er RAID1, eller speiling. Det er her du kopierer (eller speiler) de samme dataene over to eller flere disker, slik at hvis en av diskene feiler, kan dataene fortsatt overleve og fortsatt brukes aktivt. Det er også andre RAID-konfigurasjoner, og vi vil diskutere dem når vi går videre.

Om RAID

RAID, eller Redundant Array of Inexpensive Disks, er en mekanisme for å lagre data på tvers av disker. Det er et bredt "utvalg" av RAID-oppsett som du kan gå med, men de to grunnleggende mekanismene som alle er basert på er følgende:

1. Speiling:

Speiling innebærer at datablokkene dine blir kopiert, speilet, over flere disker. Hvis du speiler dataene dine over tre disker, kan du overleve opptil to disker som feiler til enhver tid, de mislykkede diskene kan deretter byttes ut med nye uten mye bry. Tilsvarende hvis du kopierer data på tvers n + 1 disker, tåler du opptil n feil på disker. Ulempen med dette er at du bare får lagringskapasiteten lik den minste disken i RAID-arrayet.

2. Paritet:

En annen tilnærming er å dele dataene dine i to deler, ved å bruke de to blokkene med brukerdata kan du opprette en tredje 'paritetsblokk'. De tre blokkene har alle samme størrelse og er spredt over forskjellige enheter. Minst tre enheter er nødvendige for at denne konfigurasjonen skal fungere. Hvis noen av disken mislykkes, kan du gjenskape blokkene som er lagret på disken ved hjelp av de to andre blokkene. For eksempel, hvis den andre brukerblokken går tapt, kan den første blokken og paritetsblokken brukes til å beregne den andre brukerblokken. Hvis du er interessert i hvordan dette fungerer, kan du sjekke ut denne fantastiske forklaringen.

Denne metoden kan forbedres ytterligere for å ha 2 eller til og med 3 paritetsblokker. Men mer enn 3 paritetsblokker blir ikke sett i bransjen så ofte. Hvis du har en paritetsblokk, kan du overleve en diskfeil. To paritetsblokker betyr at du tåler at to disker svikter og så videre.

Det er mer effektivt når det gjelder lagringsutnyttelse enn speiling. Hvis du har en paritetsblokk, trenger du bare 50% mer fysisk lagring per faktiske brukerdata du lagrer. Dette betyr å lagre 1 GB data du trenger 1.5 GB lagringsplass (pluss at det er en liten overhead for metadataene). Dette er mye mer effektivt enn til og med det mest effektive speilskjemaet der du trenger minst 2 GB lagringsplass for å speile 1 GB data mellom to disker.

Ulempen er at tilfeldige skriveoperasjoner kommer til å bli redusert, takket være den ekstra biten av beregning og skriveoperasjon assosiert med paritetsblokken. Også påliteligheten er ikke så god som en n + 1 speilvendte disker der du kan forberede deg på et vilkårlig antall disker som feiler.

RAID-konfigurasjoner kan være så kompliserte eller så enkle som du vil at de skal være, du kan kombinere paritets- og speilingsstrategier og modifisere dem etter bedriftens smak. Det er dedikerte RAID-kontrollere som du kobler til de fysiske diskene dine, og operativsystemet ser deretter en enkelt logisk disk som vist av kontrolleren. LSI er en slik leverandør av RAID-kontrollere. Du kan også utføre RAID i programvaren OpenZFS er sannsynligvis det beste alternativet du har i den forbindelse.

En siste type RAID, som får en hederlig omtale, er RAID 0. Teknisk sett er det ikke en RAID-ordning, fordi det ikke er noen redundans involvert her. Ideen bak RAID 0 er å bare spre dataene dine på flere lagringsenheter uten noen motstandsdyktighet mot diskfeil. Fordelen er at du får ytelsesforbedringer ved å gjøre dette. Hvis du skriver 1 GB data til en enkelt disk, er prosessen treg. Disken kan bare utføre et begrenset antall skriveoperasjoner per sekund, og operativsystemet ditt må vente på at det skal fullføre denne operasjonen før nye data blir sendt sin vei. Hvis du sprer samme 1 GB data over to slike disker, kan du skrive (og lese) fra dem begge samtidig og få ganske mye ytelsesforbedring.

Back Ups

Konseptet med sikkerhetskopier er diskutabelt viktigere enn RAID. En sikkerhetskopi, i sammenheng med lagringsadministrasjon, er en kjent god kopi av data fra et gitt tidspunkt, hvorfra du kan gjenopprette filer tilbake til hovedsystemet når det er nødvendig. Når det gjelder implementering, er det mange skyhostede løsninger og mange offline-løsninger som også kan brukes.

Tarsnap og Backblaze er mine favoritt administrerte sikkerhetskopitjenester for både private og forretningsbruk. Du kan også inkludere Google Drive, iCloud eller Dropbox i denne definisjonen av en sikkerhetskopi løsning, men de er mer rettet mot forbrukermarkedet enn bedriften. Imidlertid er det underliggende prinsippet fortsatt det samme. Når du logger på en ny iPhone eller iPad, blir alle dataene, kontaktene, bildene, mediebiblioteket osv. Sømløst synkronisert fra iCloud-kontoen din, og når du fortsetter å bruke enheten, blir de nyere dataene støttet stille i skyen, og du don ' Jeg trenger ikke å bekymre deg for det.

Backupløsningen din kan være så enkel som å kopiere data til en ekstern harddisk eller å bruke rsync (eller zfs send, hvis du bruker OpenZFS) for å generere en kopi av all relevant informasjon med jevne mellomrom. Dette kan omfatte Dokumenter-mappen, databasen, kildelageret eller til og med hele root-filsystemet splattes i en flat zip eller en tarball. De viktige kriteriene som en god sikkerhetskopiløsning skal oppfylle er følgende:

  1. Sikkerhetskopier bør forekomme ofte - Hvis du sikkerhetskopierer data hver måned, i stedet for hver uke, risikerer du å miste opptil en måneds verdi av data når katastrofen rammer.
  2. Sikkerhetskopiene dine bør gå tilbake i tid - sikkerhetskopilagringen er endelig. Noen ganger må du kaste eldre sikkerhetskopier. Jo mer lagringsplass du har, jo bedre kan sikkerhetskopiene dine være. Anta at du sikkerhetskopierer dataene dine ukentlig, men kaster sikkerhetskopier eldre enn 2 uker. Hvis en fil ved et uhell blir slettet, og dette blir ubemerket i to uker, har du ikke en måte å bringe den tilbake.
  3. Filene dine burde faktisk kunne gjenopprettes - Hvis du aldri har prøvd å gjenopprette dataene fra sikkerhetskopien, har du ikke en sikkerhetskopi. Du trenger ikke å lære å gjenopprette data på det kritiske tidspunktet da du ble utsatt for tap av data. Planlegg fremover og vet hvordan du gjenoppretter systemet fra den sist kjent sikkerhetskopien.
  4. Sikkerhetskopien din skal være adskilt fra det løpende systemet - Når katastrofen rammer, og alle filene dine på produksjonsserveren blir kryptert, slettet eller ødelagt, må du sørge for at det samme ikke skjer med sikkerhetskopien. En god måte å sikre dette på er å sørge for at backupenheten ikke er 'koblet' til produksjonsmiljøet ditt, dvs.e, koble fra USB-harddisken, demonter NFS-filsystemet når du er ferdig med å sikkerhetskopiere det. I det minste, ikke gi produksjonssystemet privilegiet å overskrive eller endre sikkerhetskopidataene dine. Gjør det skrivebeskyttet.

Nå som vi vet litt om både RAID og backup, la oss markere noen forskjeller mellom dem.

Filer og blokker

RAID er alltid opptatt av datablokker, ikke hvordan filsystemet presenterer dataene for brukeren. Både programvare og maskinvare RAID håndterer data som informasjonsblokker, størrelsen på blokker kan variere fra 128 KiB til 1 MiB.

Sikkerhetskopier er derimot mye mer fleksible. De utføres vanligvis på filsystemnivå, selv om det ikke er noen hard og rask regel for at dette skal være tilfelle. De er også mer granulære. Du kan gjenopprette en enkelt fil fra sikkerhetskopien din, hvis løsningen din er fleksibel nok. RAID-matriser er ikke sikkerhetskopier, de er bare en måte å spre data på flere disker. Hvis en fil slettes, frigjøres alle speilblokker og paritetsblokker. Slutt på historien.

Bruk tilfeller

Sikkerhetskopier er for alle. Tilnærmingen og omfanget kan variere fra personlig bruk til virksomhet, men alle med et digitalt liv trenger sikkerhetskopi. RAID er mer en virksomhets / foretaksspesifikk funksjon. Du ser RAID-arrays i servere, lagringsenheter som NAS og SAN, cloud hypervisors osv. Nesten alle steder som lagrer kritiske data, bruker en eller annen form for RAID. Til og med serverne som kjører sikkerhetskopiene i skyen din, bruker sannsynligvis RAID-arrays. Dette er ikke gjensidig eksklusiv teknologi.

Dette betyr ikke at du ikke kan bruke RAID til din personlige bruk, det har bare mer nytte i bedriftene. En del av årsaken bak dette er at i virksomheten bankes disker med IO-operasjoner 24/7. I produksjonsmiljø, som lagring av en database eller videostreamingtjeneste eller en skyhypervisor, vil lagringsenheten til serveren din være under konstant grusom belastning, data blir stadig lest fra og skrevet til disse enhetene og ofte av flere applikasjoner samtidig. Under disse forholdene er det mye mer sannsynlig at stasjonene dine mislykkes. Å ha en RAID-konfigurasjon betyr at hvis en stasjon mislykkes, har du liten eller ingen nedetid. De fleste servere kan fortsette å operere selv etter en disksvikt, slik at du ikke mister ny informasjon og forespørsler som kommer inn hvert sekund.

En gjennomsnittlig stasjonær datamaskin kan knapt gjenskape den samme stressende tilstanden, selv om disken dør. Hvis du bruker en sikkerhetskopiløsning som Backblaze, kan du hente det meste av tapte data, og å miste noen timers arbeid er sannsynligvis det verste at kan skje. Selv dette blir en sjeldenhet takket være skyhostede løsninger som Adobe Creative Cloud, Office 365, etc.

RAID er ikke en erstatning for Backup

Hvis det er en enkelt take away du vil ha fra denne artikkelen, bør det være dette. RAID er IKKE en erstatning for Backup. Sikkerhetskopier alltid dataene dine! Det er mange mennesker der ute som tenker at hvis du har RAID, betyr det at dataene er trygge på tvers av flere disker, og det er derfor ikke nødvendig å sikkerhetskopiere dem. Ingenting er lenger fra sannheten. RAID er ment å håndtere et enkelt spesifikt problem - diskene feiler eller gir tilbake feil data. Å ha RAID beskytter deg ikke mot en million andre trusler som følgende:

  1. Brukerfeil og utilsiktet sletting
  2. Program- eller OS-feil som forårsaker utbredt datakorrupsjon
  3. Ransomware eller annen skadelig programvare som krypterer, sletter eller ødelegger dataene dine
  4. Feil i RAID-kontrollere selv

Dataene på RAID-arrayet ditt er live. Hvis operativsystemet, et program (eller en bruker) går i orden og sletter noen få filer her og der, vil filen bli slettet over hele RAID-arrayet ditt. Å ha en separat kopi av dataene dine, en sikkerhetskopi, er den eneste måten du noen gang kan beskytte deg mot denne typen scenario.

Konklusjon

Hvis du er bekymret for dataene dine, bør din første bekymring være sikkerhetskopiløsning. De fleste stasjonære brukere, bortsett fra kanskje strømbrukere, bør investere mer i en pålitelig sikkerhetskopi i stedet for å fikle med RAID1, RAID5 eller RAIDZ. Hvis du vil bygge din egen backup-server, må du tenke på en anstendig policy for sikkerhetskopiering og en pålitelig lagringsbackend. Denne artikkelen er kanskje et bra sted å starte. Du kan bruke rsync eller zfs send til å ta periodekopi av dataene dine til denne backend.

Hvis du er i bedriften, og vurderer en RAID-løsning for å lagre alle dine live data. Vurder å bruke OpenZFS, det tilbyr en veldig fleksibel løsning, alt fra n-disk speiling til RAIDZ1 med en paritetsblokk til RAIDZ2 og RAIDZ3 med 2 og 3 paritetsblokker. Du må vurdere mye om søknadens krav før du tar en beslutning. Det er avveininger mellom dine lese- og skriveytelser, motstandsdyktighet og lagringseffektivitet. Imidlertid vil jeg anbefale at du bare tenker på RAID etter at du har bestemt deg for en sikkerhetskopiløsning.

5 beste arkadespill for Linux
I dag er datamaskiner seriøse maskiner som brukes til spill. Hvis du ikke kan få den nye høye poengsummen, vil du vite hva jeg mener. I dette innlegge...
Kamp for Wesnoth 1.1. 3.6 Utvikling utgitt
Kamp for Wesnoth 1.1. 3.6 utgitt i forrige måned, er den sjette utgivelsen i 1.1. 3.x-serien, og den leverer en rekke forbedringer, spesielt til bruke...
Slik installerer du League Of Legends på Ubuntu 14.04
Hvis du er fan av League of Legends, er dette en mulighet for deg å prøvekjør League of Legends. Merk at LOL støttes på PlayOnLinux hvis du er en linu...