Týden novinek ve Windows Serveru “8”: Data Deduplication

Mezi funkce nového Windows Serveru "8", z kterých bude IT oddělení velmi rychle profitovat určitě patří Data Deduplication. Jedná se o součást File Server role, která po své aktivaci v Server Manager umožňuje pravidelnou optimalizaci diskového úložiště. Jedná se o možnost vyhledávat duplicitní data na úložišti a možnost bez narušení integrity tyto duplicitní data tzv. deduplikovat. Deduplikace dat přináší několik zásadních výhod:

  • Optimalizace diskové kapacity, která je dosažena pomocí deduplikace dosahuje mnohem lepších výsledků než NTFS komprese nebo SingleInstanceStorage. Díky proměnlivé velikosti bloků a kompresi je možné dosáhnout optimalizace až 1:20 u virtuálních serverů.
  • Deduplikace je dobře škálovatelná s minimálním dopadem na systémové prostředky. Může být využita na mnoha discích zároveň bez následného ovlivnění dalších spuštěných aplikací. Nízká zátěž serveru je dosažena pomocí omezování CPU a paměťových prostředků pro službu deduplikace a navíc je možné stanovit časové plány pro procházení a optimalizaci úložiště.
  • Díky integraci s funkcí BranchCache je dosaženo i snížení celkové zátěže internetové konektivity, a tím i snížení času pro stažení jednotlivých souborů do lokální cache.

ws03-01

Nastavení Data Deduplication probíhá přes Server Manager, kdy je nutné zvolit časový rozvrh pro deduplikaci, jednotlivé diskové oddíly a případné výjimky pro deduplikaci. Deduplikace tedy běží jako plánovaná úloha, je však možné ji pomocí PowerShell příkazů pouštět interaktivně. Celý systém je postaven nad vyhledáváním shodných bloků dat na úrovni disku o velikosti 32 – 128kB (v průměru 80kB). A jejich nahrazením pomocí odkazů na již existující blok identických dat.

Pomocí deduplikace je možné dosáhnout značných úspor na diskovém úložišti (v závislosti na typu uložených dat se využitelnost deduplikace může měnit).

Typ uložených dat

Možná úspora díky deduplikaci

Obecné

50-60% úspora

Dokumenty

30-50% úspora

Aplikační server

70-80% úspora

Úložiště VHD souborů

80-95% úspora

ws03-02

Nevýhodou deduplikace dat je nekompatibilita s cluster shared volumes, není tedy možné tuto funkci využít např. pro Hyper-V cluster, u kterého bychom chtěli využít live migration virtuálních počítačů. Je však možné použít deduplikaci pro běžné cluster oddíly. V případě zápisu na disk nedochází k žádnému zpomalení, protože deduplikace je proces, který běží plánovaně v pozadí, při čtení však může ke zpomalení v řádu 2 – 5% docházet. Optimalizována mohou být pouze datová NTFS úložiště, boot a system oddíly deduplikaci využívat nemohou. Při využití deduplikace není možné zároveň využívat NTFS kompresi či NTFS šifrování.

- Marek Chmel, WBI