Monter son NAS / SAN “personnel” sous Windows Server 2012 - Partie 4 - Datadeduplication

Cet article est le quatrième d’une série consacrée au montage d’un NAS / SAN “personnel” (ou de test) sous Windows Server 2012.

Les 3 premières parties sont ici, ici et ici

Dans cette partie, nous allons voir comment activer la déduplication de données sur les disques de données.

Prérequis pour qu’un volume soit un bon candidat à la déduplication de données dans Windows Server 2012

- le volume ne doit pas être le volume Système ou le volume de boot. La déduplication de données de Windows Server 2012 n'est pas supporté sur la partition contenant le système d’exploitation

- le volume peut être partitionné avec un MBR (Master Boot Record) ou un GPT (GUID Partition Table)

- le volume doit être formaté en NTFS

- Les volumes ReFS ne sont pas supportés pour la déduplication de données

- le volume peut être sur un stockage partagé (SAN Fibre Channel, SAN iSCSI ou SAS).

- le volume ne peut pas être un CSV (Cluster Shared Volume)

- le volume doit être vu comme un disque non-amovible. Les disques amovibles ne sont pas supportés pour la déduplication de données.

Note complémentaire : les fichiers chiffrés, avec des attributs étendus, dont la taille est inférieure à 32 Ko ne sont pas traités par la déduplication de données.

Installation de la fonctionnalité de déduplication de données

Il est également possible d’installation la fonctionnalité via PowerShell :

PS C:\> Import-Module ServerManager
PS C:\> Add-WindowsFeature -name FS-Data-Deduplication
PS C:\> Import-Module Deduplication

Outil DDPEval.exe

Une fois que la fonctionnalité de déduplication des données est installée, l’outil DDPEval.exe (Deduplication Evalution Tool) est installé dans %systemRoot%\System32\. Cet outil permet d’évaluer les gains obtenus avec la déduplication de données sur un volume donné.

Exécutée sur mon disque virtuel de 3.83Go sur un Storage Pool composé de 3 disques de 2To, l’opération a quand même pris 50 minutes sur ma machine.

D’après l’outil, la déduplication de données devrait me faire gagner 42 Go sur 171 Go soit à peu prêt 24% de gain de place. On remarque aussi que 52283 petits fichiers de moins de 32 Ko ne seront pas traités.

A noter : la déduplication de données n’offre des ratios / gains intéressants que sur les fichiers qui ne sont pas ouverts en permanence (machines virtuelles, bases SQL….). Les meilleurs ratios seront donc obtenus sur des bibliothèques de modèles de machines virtuelles, sur des sources d’installation logiciels (ex: Office dans plusieurs langues…) ou des images ISO

Pour activer la déduplication sur un volume de données, aller dans le gestionnaire de serveur et plus particulièrement dans la gestion du stockage et des fichiers.

Activation de la déduplication de données

Cliquer sur Configure Data Deduplication

la même chose en PowerShell : PS C:\> Enable-DedupVolume S:

Il est possible de planifier les opérations d’analyse et d’optimisation de déduplication ou de laisser faire ces opérations en tâche de fond

Commandes utiles

Pour afficher les volumes sur lesquels est activée la déduplication de données :

PS C:\> Get-DedupVolume
PS C:\> Get-DedupVolume | format-list

Pour déclencher un job d’optimisation

PS C:\> Start-DedupJob –Volume S: –Type Optimization

Une fois le job de déduplication en cours, cela va prend plus ou moins de temps en fonction du volume à analyser et optimiser. Il est remarquable aussi qu’une certaine quantité de RAM est consommée par l’opération et que l’opération n’est pas optimisée pour les environnements multi-cores Winking smile

Il est possible de suivre l’avancement de l’opération d’optimisation avec la commande

PS C:\> Get-DedupStatus

Quelques lectures complémentaires sur le sujet :

Pour tester Windows Server 2012, vous pouvez télécharger gratuitement la version d’évaluation disponible sous la forme :
- d'une image ISO : https://aka.ms/jeveuxwindows2012
- d'un fichier VHD avec un système préinstallé : https://aka.ms/jeveuxwindows2012

- Stanislas Quastana -