Týden novinek ve Windows 8: Souborový systém ReFS a Storage Spaces

Windows 8 bude obsahovat souborový systém další generace. Resilient File System, zkráceně ReFS, byl navržen pro nové přístupy k ukládání dat. Během vývoje vyl kladen zvláštní důraz na zpětnou kompatibilitu s NTFS. Systém se vyznačuje zejména schopností za běhu opravovat poškozená data. Není nutné tedy celý svazek odpojit a nechat zkontrolovat programem ScanDisk. Jeho struktura dovoluje lepší škálovatelnost, než v případě NTFS.

Klíčové vlastnosti

ReFS je především robustní a vysoce dostupný souborový systém. Umí kontrolovat a samočinně opravovat poškozená data. Je optimalizovaný pro extrémní škálovatelnost. Je vhodný jak pro vestavěná zařízení pro .NET Micro Framework, tak i pro datová centra, na kterých běží Windows Azure. Systém byl navržen tak, aby případná chybná data izoloval a administrátor je byl schopen obnovit ze zálohy, aniž by musel celý systém odstavit. Virtualizace úložišť má zjednodušit vytváření a správu souborového systému.

Struktura

Veškerá data v souborovém systému jsou uchovávána v B+ stromech na rozdíl od NTFS, který uchovával některá data v dodatečných tabulkách a metasouborech. To významně přispělo ke zjednodušení systému a úbytku zdrojového kódu. Navíc celý strom představující souborový systém jako celek umožňuje mnohem lepší škálovatelnost. Jednotlivé uzly navíc umožňují iteraci prvků typu klíč hodnota, takže se na ně lze dívat jako na tabulky. Po tomto zjednodušení se lze dívat na systém takto:

Alokace je navržena tak, aby zápis nových dat probíhal v menším počtu větších bloků, než je tomu u NTFS. Data mohou mít ve struktuře kontrolní součty, které se počítají automaticky po každém zápisu.

Kompatibilita s NTFS

Některé rozšířené funkce NTFS budou zachovány, jiné neimplementovány, pokud měly vysoký dopad na celkovou složitost systému nebo zálohování celého oddílu. Mezi zachované funkce patří:

  • BitLocker šifrování,
  • Access control list,
  • žurnálování,
  • hlášení změn,
  • symbolický odkaz na soubory i adresáře,
  • připojení svazku do adresáře,
  • přídavné informace o adresáři,
  • kopie svazku,
  • jednoznačný identifikátor souboru a
  • uzamykání souborů.

Mezi funkce, které již nebudou podporovány, patří

  • secondary streams,
  • identifikátor objektu,
  • zkrácené názvy souborů,
  • komprese souboru,
  • hardlinky,
  • sparse files,
  • šifrování na úrovni souboru,
  • podrobnosti souboru a
  • diskové kvóty.

Secondary streamy, nazývané také jako alternate streamy nebo named streamy, chápou soubor jako adresář. Tato málo známá funkce dovoluje do souboru vepisovat soubory další. Například cesta C:\muj_soubor.txt:stream.xml je naprosto v pořádku a ukazuje právě na stream. Pokud prohlížeč stáhne soubor z internetu, je tato informace uložena právě v něm. Má to ovšem velké nevýhody. Tyto streamy nejsou zachovány při přenášení souborů mezi různými souborovými systémy, přenos přes FTP, komprimování a tak podobně. Navíc se velikost streamů nepočítá do velikosti souboru. V neposlední řadě také Průzkumník neumí data v těch streamech ani zpřístupnit.

Zkrácené názvy souborů, 8 znaků pro název a 3 příponu, jsou pozůstatkem MS-DOSu a dnes již nemají praktické využití. Co se komprese týče, řadič SandForce na SSD dokáže komprimovat mnohem účinněji, takže komprese samotných souborů v dnešní době spíše škodí. Hardlinky mají nevýhodu v tom, že se dají vytvářet jen v rámci svazku. Diskové kvóty ztrácejí na významu, protože v dnešní době se data uživatelů ukládají spíše v SQL Serveru, který má pro omezení velikosti databáze vlastní systém. Podrobnosti souboru jsou nahrazeny metadaty.

Odolnost

Windows 8 přináší nové funkce datových úložišť souhrnně nazývané jako Storage Spaces. Dovoluje uspořádat fyzické disky připojené přes SATA, SAS a USB do diskových úložišť. V nich jdou vytvářet virtuální diskové oddíly, které jsou odolné vůči selhání hardwaru. V podstatě se jedná o RAID pro domácí použití. Kapacita fyzických disků se může lišit, stejně jako sběrnice, přes kterou jsou připojeny.

Když při zápisu dat začne docházet místo, Windows zobrazí upozornění a vyzve uživatele k nákupu nového disku. Ten se prostě zapojí do PC a připojí k úložišti. Systém se pak postará o zbytek. Jednotlivé Spaces, jako například Dokumenty či Plocha můžou být zrcadleny a soubory v nich se zapisovat na dva, případně i tři fyzicky odlišná úložiště. Na Videa, Obrázky, Podcasty nebo Virtuální počítače se bude spíše hodit parita, tedy duplicitní informace, ze kterých se dají ztracená data v případě selhání hardwaru dopočítat.

Storage Space Documents, který se zrcadlí na dva fyzické disky připojené přes USB. Storage Spaces mohou být dostupné pro ostatní počítače v domácnosti.

Při selhání nějakého disku centrum akcí zobrazí varování. Ovládací panely pak podají jasnější vysvětlení situace.

Hodně chyb nastává poškozením dat z důvodu zápisu na špatné místo, či ztrátou zápisu. Případů, kdy selže samotný hardware, je poměrně málo. Tyto chyby dokáže ReFS díky kontrolním součtům odhalit. Pokud se tak stane, ReFS nařídí Storage Spaces přepsat chybné soubory záložní kopií.

ReFS nemá nic společného z WinFS. V případě WinFS šlo spíše o indexaci dat, v ReFS jde o robustnost infrastruktury. Vzhledem k podstatným změnám a konzervativnímu přístupu k vývoji SQL Serveru, se zdá, že databáze zatím nepůjdou na ReFS vytvářet.

- Václav Dajbych, MSP