Telling stories for a living

Tag: Harde Schijf

RAID Is (Almost) Dead

Vandaag is RAID (Redundant Array of Independent Disks) een vorm van data protectie waarop elk enterprise storage systeem op terugvalt. RAID beschermt je data voor fysisch falen van een harde schijf (of meerdere harde schijven). Het is dus géén alternatief op een backup-oplossing: als je gegevens verwijdert of een virus infecteert je bestanden, dan zal RAID daar niets aan veranderen.
Zelfs oplossingen voor consumenten ondersteunen RAID om “dataloss” te voorkomen, weliswaar in minder varianten dan de professionele oplossingen. De meeste thuisproducten ondersteunen RAID0 (helemaal geen protectie, wel meer performance) en RAID1 (vooral bescherming, maar tegen een hoge prijs) terwijl de iets duurdere varianten ondersteuning bieden voor RAID5.
Om mijn punt van deze blogpost te verduidelijken, wil ik graag het RAID1 voorbeeld gebruiken. RAID1 oftewel “Mirroring” betekent dat je voor elke harde schijf een tweede exemplaar hebt dat dezelfde data bevat als het eerste exemplaar. In geval dat de eerste schijf faalt, dan neemt de tweede het direct over (dus zonder onderbreking). Bij zo een incident vervangen we de defecte schijf met een nieuw, leeg exemplaar en zal de computer van het storage systeem alle data van de nog werkende schijf kopiëren naar de nieuwe, lege schijf om op die manier een nieuwe RAID1 set te creëren.
Het spreekt voor zich dat hoe groter de capaciteit van de schijven is, hoe langer dat kopieerproces duurt. De “catch” zit hem in het feit wanneer de primaire schijf faalt alvorens dat kopieerproces helemaal klaar is: als die situatie zich voordoet, heb je “dataloss”. In dat geval mag je hopen dat je een goede backup hebt of je gegevens zijn voor goed verdwenen.
Voor kleine, snelle schijven van 300GB die aan 15,000 toeren per minuut roteren is zo een “copy job” relatief snel geklaard. Vandaag hebben we echter al 3TB schijven ter beschikking die roteren aan 7,200 toeren per minuut. Het spreekt voor zich dat zo een schijf kopiëren meer tijd in beslag zal nemen (want meer data en tragere rotatiesnelheid) en daardoor is de kans op dataloss statistisch gezien groter.
Als we Seagate (een van de grootste fabrikanten van harde schijven op wereldvlak) mogen geloven, dan zijn 100-300TB harde schijven binnen een jaar of tien realiteit. Als ik vertel dat een “rebuild”, want zo noemen we een RAID set die zichzelf herstelt, van een RAID5 volume ongeveer 1 dag per TB nodig heeft, dan zou een rebuild van een 300TB harde schijf dus ongeveer 300 dagen in beslag nemen. De kans is zéér reëel dat er in die tijdspanne nog een harde schijf faalt, met als gevolg “dataloss”. En aangezien we dan werken met 300TB schijven, is een verlies van 1PB (1PB = 1,000TB = 1,000,000GB) aan data zeker realistisch. Ik moet niet stipuleren dat 1PB aan dataloss zo goed als meestal gelijk staat met een serieus probleem in een bedrijf…
Kortom: RAID als bescherming tegen het fysisch falen van een harde schijf is op het einde van zijn carrière. Storage vendors (zoals Hitachi Data Systems) zijn vandaag dus al bezig met hoe ze zo een datasets kunnen beschermen en we gaan dus nog boeiende tijden tegenmoet in de storage wereld.
Wordt zonder enige twijfel vervolgd…

Mijn ThinkPad volgt mij professioneel gewijs altijd en overal en aangezien ik vaak dingen moet kunnen testen, draait er op mijn laptop VMWare Workstation 7 – gratis gekregen door toe te treden tot de VCP4 kudde – met daarin een mobiel labo. Op dat mobiel testlabo draait een serieuze waslijst aan servers:

  • VMWare ESX 3.5 Server
  • VMWare ESX 3.5 Server (kwestie van VMotion te kunnen doen met de eerste)
  • VMWare VCenter Server voor bovenstaande ESX servers
  • VMWare vSphere 4 Server
  • VMWare vSphere 4i Server
  • VMWare vSphere 4i Server (kwestie van VMotion te kunnen doen met de eerste)
  • VMWare VCenter vSphere Server voor bovenstaande vSphere ESX servers
  • Openfiler iSCSI SAN emulatie server
  • Wiki Server waarin ik veel documentatie en info dump
  • Drie W2K3 SP2 servers die dienst doen als Active Directory, DHCP en DNS servers (twee van de drie) en als test server
  • Windows XP Pro test machine
  • VCB Server zodat ik VMWare Consolidated Backup kan testen in bovenstaande omgeving
  • Networker Server met zoals de naam al doet vermoeden EMC Networker Backup Server

Alle servers tegelijkertijd laten draaien is geen optie omdat er niet genoeg geheugen / CPU rekenkracht in mijn ThinkPad (of eender welke andere laptop for that matter) zit om dat mogelijk te maken zonder dat alles aan een slakkegangetje vooruit gaat. Gelukkig heb ik ook nooit alle servers tegelijkertijd nodig, maar het gebeurt wel eens dat er twee ESX servers + een VCenter + VCB + een Networker server tegelijkertijd draaien, wat als geheel toch een serieuze impact heeft op de beschikbare resources.
Mijn laptop beschikt over 4GB RAM en een dual-core Intel Centrino 2 processor op 2.0GHz wat net genoeg is om een deftige testomgeving werkbaar te maken. VMWare Workstation levert goed werk door de beschikbare resources deftig te managen waardoor alles werkt zoals ik verwacht. Er is echter één bottleneck waar geen enkele software iets aan kan doen: de harde schijf.
Hoe je het ook draait of keert, het geheel loopt op één enkele “spindle” oftewel harde schijf, wat nefast is voor de performantie. Zowel de virtuele machines als het host-besturingssysteem – mijn Windows 7 dus – gebruiken dezelfde harde schijf en allemaal op verschillende momenten – problematisch!
Om dit te counteren zit er in een van de PC-Card sloten een SSD-disk van 48GB waarop naast een “ReadyBoost” partitie (extra swapfile waardoor Windows iets pittiger zou moeten zijn), de “zwaardere” virtuele machines draaien. Meestal zijn dit de ESX servers, maar het gebeurt al eens dat ik er SQL servers op draai (veel I/O).
Maar daarmee is mijn probleem nog niet volledig opgelost! 48GB is leuk, maar eigenlijk veel te weinig. Een SSD van 128GB of 256GB zou al beter zijn, maar ik heb niet direct zin om meer dan 500€ uit te geven. Ik zocht een goedkope oplossing die mobiel is en toch extra performantie met zich meebrengt. U raadt het al, ik heb een externe harde schijf ter hulp geroepen.
Mijn keuze is gevallen op de iOmega Select Mobile Hard Disk van 500GB. Het “Select” gedeelte wijst er in feite op dat het over een budget harde schijf gaat, maar de term budget is nogal slecht gekozen. De duurdere broertjes hebben meestal een mooiere shell (al vind ik de mijne ook wel netjes), krijgen er “gratis” backup software bij (die ik toch niet gebruik) en beschikken soms naast USB2.0 ook over FireWire / eSata aansluitingen. Die laatste had ik eventueel wel zien zitten, maar ik had geen zin om daarvoor twee keer zoveel geld uit te geven. En dus was de keuze snel gemaakt – 69€ voor een mobiele schijf van 500GB. Let op: het gaat hier over een 2.5″ exemplaar dat stroom via de USB-poort krijgt, niet over een “gewone” 3.5″ externe schijf met aparte voeding. Ik ben me bewust dat je daar meer opslag / snelheid voor je geld krijgt, maar de focus lag op mobiel.

Waar vroeger een waslijst aan virtuele machines op mijn laptop disk stonden te pruttelen, is de impact vanaf nu verdeelt over mijn externe mobiele schijf en mijn interne SSD van 48GB. Deze combinatie houdt mijn laptop snel zodat ik naast mijn testlabo ook nog andere dingen kan doen, iets wat vroeger meestal onmogelijk was.

De enige bottleneck die ik nu nog heb is het RAM geheugen en de CPU, en dan vooral dat eerste. Mijn laptop kan met 4GB uitgebreid worden tot een totaal van 8GB intern geheugen, maar de kostprijs van 400€ vind ik er een beetje over… dus voorlopig doen we het zo, tot de prijzen van het RAM geheugen weer eens in elkaar zakken ;-).

Daarnet voor het eerst een XBOX360 game naar de harde schijf van de console gekopieerd (nieuw sinds de grote update) om van “play from hard disk” te kunnen doen. Microsoft zegt dat het laden van games hierdoor een aanzienlijke versnelling zou moeten kennen, maar eerlijk gezegd vond ik dat verschil niet zo spectaculair – althans niet in Colin McRae: DIRT waarop ik de nieuwe functionaliteit getest heb. Wat wel opvallend was, is de “stilte”. Geen gezoem meer van een DVD-speler die constant op toeren komt om nieuwe game-content in te laden, en op zich is dat ook al een serieuze troef vind ik zelf.
Way to go XBOX360! In de nabije toekomst nog is wat andere games naar de harde schijf installeren om te zien dat er daar wel een tijdwinst valt te boeken…

Daarnet heb ik nog geschreven over mijn meest recente “probleem” en enkele uurtjes later kan ik na een hoop geëxperimenteerd en getest met veel blijdschap melden dat er een oplossing is. Misschien is er natuurlijk nog een betere oplossing, waarmee u mij altijd mag lastig vallen in de comments :-). 
Bon. Mijn oplossing.

  1. De betreffende schijf / partitie omzetten naar een RAW-data image met behulp van een opensource tool (geport van UNIX) genaamd Disk Image van Dubaron (DD voor de vrienden). Hier te downloaden.
  2. Daarna de RAW-data image converteren naar een *.VMDK bestand (oftewel een virtuele VMWare harde schijf) met LiveView. Eveneens voor niks te downloaden. Hierzo.
  3. Tot slot de betreffende VDMK file “mounten” met behulp van een gratis (maar unsupported) tooltje van VMWare zelf: VMWare Diskmount Utility.
  4. Klaar is kees. Vanaf nu heb je de schijf in Windows als een lokale disk gemapt staan en zou het probleem opgelost moeten zijn. 
En het beste van al: je kan zowel lezen als schrijven naar deze schijf. Bij de oplossing van Microsoft (die NIET over het netwerk gemapt kan worden, in tegenstelling tot deze van VMWare) schrijft hij wijzigingen weg naar een temp-file en moet je die dan manueel “committen” wat dus een extra last (en risico) is!
Voila. Misschien bent u er ook iets mee, zo niet, negeer gerust deze post. Hehe.

© 2024 Unexpected.be

Theme by Anders NorenUp ↑