Richard modernizuje IT: Vysoká dostupnost a zálohování

Před vypuknutím vánočních svátků musel Richard otestovat vysokou dostupnost virtuálních serverů a aplikací a zajistit kvalitní a funkční zálohy celého prostředí. Jelikož už celé prostředí dobře znáte, víte, že celá architektura je postavena na platformě Microsoft s využitím nástrojů System Center a virtualizace Hyper-V. Nikoho už tedy nepřekvapí, že vysoká dostupnost serverů a aplikací je zajištěna pomocí Scale-out file server clusteru a zálohováno je pomocí System Center Data Protection Manager. Richard už popisoval připojení cloud platformy Microsoft Azure do prostředí společnosti a tak je logické, že se rozhodl využívat cloudu také pro zajištění vysoké dostupnosti. Původní myšlenky o vybudování vzdálené (Disaster Recovery) lokality pro zálohy datového centra nebyly z finančních důvodů realizovány. Richard však nyní přišel s přelomovou myšlenkou využít právě prostředí Microsoft Azure pro vybudování záložní lokality.

File server cluster a jeho rozšíření

Nejprve se Richard zaměřil na rozšíření a otestování File server clusteru. Celé toto řešení už Richard popisoval, nyní bylo zapotřebí zvýšit diskovou kapacitu a přidat další uzel clusteru. Veškerá konfigurace se odehrála v prostředí Virtual Machine Manager, kde byl také celý cluster vytvořen a kde je kompletně spravován. Data virtuálních serverů a aplikací jsou umístěna na vysoce dostupném sdíleném úložišti (SMB).

image
Obr. 1: Disková úložiště ve VMM

Richard přidal další fyzické disky a rozšířil tak prostor pro virtuální servery a data aplikací na cca 8TB.

image
Obr. 2: Přidání disků do pole ve VMM

Rozšíření diskového prostoru bylo provedeno přímo ve VMM výběrem dostupných fyzických disků. Po dokončení průvodce a úlohy byl aktuální stav zobrazen v konzoli VMM.

image
Obr. 3: Rozšíření diskového prostoru ve VMM

Po dokončení konfigurace úložiště přidal Richard další uzel do již stávajícího clusteru s názvem FSTDI. Samotná instalace nového serveru proběhla pomocí šablony přímo z VMM stejně tak jako přidání uzlu do clusteru. Richard v průvodci vybral nově připravený server a o zbytek se postaral System Center. Přidáním dalšího serveru se zvýšila dostupnost celého řešení a vánoce tak mohly být zase o něco klidnější a veselejší.

image
Obr. 4: Přidání uzlu do clusteru

Říká se, že trénují a zálohují jenom zbabělci, nicméně pro klid a pohodu vánoc se Richard rozhodl drobný test funkčnosti clusteru provést.

Otestování funkčnosti Failover clusteru

Funkčnost celého řešení se Richard rozhodl otestovat simulováním výpadku jednoho ze tří uzlů clusteru. Aby byl test co nejvěrnější, nasimuloval nejprve Richard zatížení aplikace, která má data umístěna právě na testovaném File Server clusteru. Zatížení pomocí stress testu je vidět na následujícím obrázku. Web aplikace je tedy solidně vytěžována, nicméně stále dostupná.

image
Obr. 5: Vytížení aplikace

Richard se tedy rozhodl cluster lehce podráždit. V tomto případě bohatě stačí vypnoutslužbu „Cluster service“ na jednom uzlu clusteru. Jak Richard pravil, tak udělal.

image
Obr. 6: Zastavení služby clusteru

Po zastavení služby jsme s Richardem sledovali, jak jsou aktivní procesy automaticky přesunuty na jiný uzel clusteru. Aplikace byla samozřejmě (ne vždy a všude to tak platí) stále dostupná a stále ve stejném výkonu. Tento test Richarda před vánocemi ještě více uklidnil. Ve zbytku času (nikoliv však pracovního) Richard doobjednal vánoční dárky (samozřejmě online).

Vysoká dostupnost s využitím Hyper-V repliky a Azure Site Recovery

Vysoká dostupnost na úrovni společnosti je tedy zajištěna a otestována. Co když se ale přeci jenom stane něco závažného v hlavní lokalitě a nebude možné dodržet SLA? Pro tyto účely se rozhodl Richard vybudovat záložní datové centrum v cloudu, kde je možné podobného scénáře dosáhnout velice rychle a s minimálními náklady.

Richard využil již nakonfigurovaného prostředí Microsoft Azure a aktivoval službu Azure Site Recovery. Tato služba umožňuje replikovat běžící virtuální servery do cloud prostředí Azure a konfigurovat a případně aktivovat krizové plány s využitím již stávající technologie Hyper-V repliky. Velice snadno tak Richard dosáhl stavu, kdy měl kritické servery replikovány v záložní (vysoce dostupné) lokalitě a připraveny kdykoliv nastartovat.

image
Obr. 7: Povolení Hyper-V zálohy ve VMM

Služba Azure Site Recovery komunikuje s on-premise instancí Virtual Machine Manager a společně řídí replikaci serverů do záložní lokality.

image
Obr. 8: Azure Site Recovery

Po aktivaci a konfiguraci služby došlo k replikaci vybraných virtuálních serverů do cloudu a detaily je možné sledovat přímo v prostředí Microsoft Azure.

image
Obr. 9: Replika VM do prostředí Azure

Po dokončení synchronizace se Richard rozhodl provést test vytvořeného plánu obnovy. Virtuální server je možné v případě havárie spustit přímo v Azure nebo lze provést jeho obnovu do on-premise prostředí. Richard se rozhodl využít obnovy do stávajícího prostředí.

image
Obr. 10: Spuštění testu obnovy

Po dokončení testu se v prostředí VMM objevil obnovený virtuální server se všemi vlastnostmi a čekající pouze na nastartování.

image
Obr. 11: Obnovený server ve VMM

Přestože se jednalo primárně o vybudování záložní lokality v případě kritické havárie Richardova (takto tomu říká) datového centra, jde o poměrně zajímavý způsob zálohování. Pravda, tento způsob zálohy zdá se bytí šťastným, rozhodně se však nejedná o plnohodnotné zálohování.

Zálohování s využitím možností cloudu

Richard využívá ve svém prostředí pro zálohování kompletního IT nástroj System Center Data Protection Manager. A protože Richard pochopil možnosti a přednosti cloudu, rozhodl se (logicky) využít integrace DPM se službou Azure Backup. Jedná se o velmi snadnou a přirozenou vlastnost nástroje DPM zálohovat do prostředí Azure. Richard se tedy zeptal svého šéfa, co by tomu říkal, kdyby posílal kritické zálohy do cloudu Microsoft Azure. Zálohy tak budou bezpečně uloženy mimo prostory společnosti a bude možné je obnovovat i v případě havárie serverovny v jiné lokalitě. Dostalo se mu odpovědi: „Podívej se Richarde, pokud to bude fungovat a bude to bezpečné, posílej zálohy klidně do…..…cloudu(no ták).“

Obrovská výhoda celého řešení je, že není nutné jakkoliv měnit zažité způsoby zálohování a lze pouze rozšířit vybrané zálohovací úlohy (Protection Groups) o plán záloh do cloudu, jak je vidět na následujícím obrázku.

image
Obr. 12: Konfigurace Protection Group v DPM

Celá konfigurace byla otázkou několika málo minut a kritické zálohy jsou nyní prováděny na lokální disky, na pásky, ale také do cloudu pro dlouhodobé uchování. Tolik radosti a to ještě nezačaly vánoce. Jedná se o cloud službu, platí se tedy pouze za objem dat umístěných v Azure Backup. Vzhledem k tomu o jak efektivní a bezpečný způsob dlouhodobého ukládání záloh se jedná je spočítaná částka zanedbatelná. Pro zálohy je možné samozřejmě kdykoliv do cloudu sáhnout.

image
Obr. 13: Registrovaný server DPM v Azure

Co tedy zbývá? Napsat dopis Ježíškovi, vyčkat na nějaký dáreček a zhodnotit uplynulý IT rok.

Jan Matějka, MVP
www.mainstream.cz