Hyper-V: gestire i servizi essenziali in alta affidabilità, un'esperienza pratica

Buona giornata a tutti.

Giulio Martino e Luca Conte di ISAServer.it hanno realizzato un progetto di server consolidation in un'azienda distributrice di prodotti farmaceutici nell'ambito del programma IT PRO MOMENTUM .

Qui sotto trovate la descrizione completa del progetto fatta direttamente dalla voce di Giulio.

E' un po' lunga, ma vale sicuramente la pena leggerla perché testimonia di un progetto reale riproducibile in moltissime situazioni.

Server Consolidation con Microsoft Hyper-V in Cluster

Il progetto è stato realizzato per conto di un distributore farmaceutico a valenza nazionale dallo scrivente in collaborazione con il Dott. Luca Conte di Isaserver.it

La necessità, nel corso degli anni, di avere server e servizi disponibili nel più breve tempo possibile ha portato l’azienda a mettere in line server e servizi in modo "selvaggio", senza preoccuparsi molto della progettazione.

L’obiettivo di questo lavoro è di rimettere ordine nella infrastruttura, garantendo il più possibile la continuità dei servizi e la sicurezza dei dati.

Analisi

La prima parte del progetto è stata caratterizzata dall’ analisi e dall’ inventario della situazione attuale. In questa fase ci siamo preoccupati di stendere un rapporto dettagliato sui server, i servizi e il relativo carico di lavoro della infrastruttura presente.

Con i dati raccolti abbiamo potuto successivamente progettare una possibile soluzione condivisa dall’azienda utilizzando al 100% tecnologia software Microsoft.

Progettazione

Il business core dell’azienda non utilizza direttamente tecnologia Microsoft, ma si appoggia interamente su sistemi IBM As400. La tecnologia Microsoft è utilizzata per servizi ‘"accessori" molto importanti per l’azienda e per i suoi clienti, ma che in una situazione di emergenza potrebbero anche essere soggetti ad un fermo di alcune ore.

Per questa ragione il nostro sforzo si è concentrato sui seguenti aspetti:

  • Separazione dei servizi in un rapporto di 1:1 (Server:Servizio)
  • Ridondanza Hardware
  • Sicurezza dei dati (Backup e Restore)

Le tecnologie che ci hanno permesso di raggiungere il nostro obiettivo sono Clusterizzazione e Virtualizzazione, che messe insieme nel nome di Microsoft si traducono in un Cluster di Hyper-V.

Configurazione adottata

Per la parte hardware è scelto come partner IBM, poiché il cliente aveva già con esso un rapporto consolidato.

- Server (Nodi Cluster) IBM – 3650 M2 – 2 Processori 4 core – 64 Gb RAM (espandibile fino a 128) – 2 Qlogic fibra – 6 Network Adapter

***SAN*** *IBM – DS3400 – 9 Dischi SAS 300 Gb – Doppio controller – 4 Schede Fibra (2 per ogni controller)*
  • Windows Server 2008 R2 x64 – Datacenter La scelta della versione DataCenter è legata alla volontà tecnica di operare una distribuzione dei server virtuali e dei servizi in un rapporto di 1:1; infatti, grazie al licensing di Microsoft, gli host con versione datacenter non hanno limiti teorici al numero di server virtualizzabili in termini di licenza del sistema operativo.

CLUSTER

Gli aspetti hardware e software legati alla messa in opera del cluster sono diversi ed ognuno riveste una importanza fondamentale per il corretto funzionamento del cluster stesso.

La SAN dispone di due controller autonomi, ogni controller monta a bordo due schede fibra. I server hanno ognuno due Qlogic in fibra.

Per garantire la continuità di servizio in caso uno qualsiasi dei componenti in fibra venisse meno è necessario operare una connessione incrociata tra i server e i controller della SAN come mostrato in figura.

image

Il secondo aspetto è legato alla comunicazione intra-cluster (Heartbeat e Live Migration) e alla suddivisione delle schede di rete.

Questa è la suddivisione da noi adottata delle sei schede disponibili su ogni host :

  • Una scheda dedicata al Management
  • Una scheda dedicata alla LAN
  • Una scheda dedicata alla WAN
  • Una scheda dedicata alla DMZ
  • Una scheda dedicata all’ heartbeat
  • Una scheda dedicata al Live Migration

Il terzo aspetto è legato alla parte software di Microsoft. Il cluster richiede la presenza di un Domain Controller che ne garantisce il corretto funzionamento.

La scelta è stata tra integrare il cluster nel dominio esistente o crearne uno nuovo.

Avendo deciso di virtualizzare al 100% il dominio del cliente e tenendo in considerazione che il dominio del cluster messo in VM non è una scelta saggia anche se possibile, abbiamo deciso di creare un nuovo dominio fisico con server dedicati solo al cluster, creando poi un trust tra i due domini.

La scelta di non tenere il dominio del cluster su server virtuali è stata dettata da due fattori:

  • Avevamo a disposizione, da poter sfruttare, due server aggiuntivi recuperati dalla server consolidation
  • Se per qualche ragione la macchina virtuale contenente il dominio del cluster non è contattabile dall’host, il cluster non funziona a dovere compromettendo l’alta affidabilità delle macchine virtuali

Produzione

Una volta preparato il cluster e testato in tutti i suoi aspetti con una o più macchine di test, bisogna programmare e decidere come operare la migrazione dei server da fisico a virtuale.

Le soluzioni in questo caso sono due :

  • Ricreare i server ed i servizi da zero e migrare gli utenti sui nuovi server
  • Usare il P2V per migrare le macchine fisiche in virtuale

Noi abbiamo scelto la strada più lunga e cioè di ricreare da zero tutta l’infrastruttura di server e servizi (tranne che per una eccezione) operando una migrazione degli utenti.

Questa scelta è stata dettata dalla necessità di ripulire i server da eventuali errori, configurazioni errate, ecc. e di separare i servizi dai server per ottenere un rapporto di 1:1 e per poter effettuare una migrazione alle nuove versioni di sistema operativo (dove possibile) e di servizi utilizzati (es. Exchange).

La seconda opzione è stata utilizzata per un solo server/servizio che richiedeva l’intervento di personale esterno non facilmente reperibile e con costi elevati.

Per ovviare abbiamo operato una P2V utilizzando il VMM (Virtual Machine Manager) di Microsoft le cui caratteristiche si possono riassumere in una sola parola : FANTASTICO!!!

La migrazione del server è stata indolore sia dal lato utente finale che dal lato sistemistico: è infatti una migrazione live, i servizi continuano ad essere erogati.

A fine migrazione è stato sufficiente spegnere il server fisico, accendere il server virtuale ed operare la registrazione del sistema operativo, riducendo quindi il disservizio a pochi minuti.

L’unica limitazione della migrazione è legata alla conversione dei dischi fissi. La limitazione consiste nel non poter effettuare un ridimensionamento del disco fisso durante il processo di conversione.

Questo comporta o la creazione di un disco dinamico (non consigliabile in un sistema di produzione) o la creazione di un disco pari alla dimensione del disco del server fisico (nel nostro caso 200 Gb su 13 utilizzati) con la conseguenza di avere uno spreco enorme di storage.

Anche se non consigliato, noi abbiamo operato una conversione in disco dinamico ed in un secondo momento opereremo un ridimensionamento del disco virtuale usando tool di terze parti.

Rimanendo per un attimo sul VMM, volevo sottolineare un altro aspetto importante legato al Live Migration. Come sappiamo è possibile migrare in live contemporaneamente un numero di server pari al numero dei nodi meno 1.

Quindi nel nostro caso specifico potremo operare un live migration di un solo server per volta.

Dato che parliamo di 18 server in crescita, potete immaginare la fatica …. ?

Bene VMM ci viene in soccorso con una future bellissima che fa questo per noi.

Infatti contrassegnando l’host per la manutenzione, VMM inizia a migrare le macchine dal nodo posto in manutenzione al nodo operativo in Live.

Una volta operati gli interventi sull’host in manutenzione basta renderlo nuovamente operativo con un click del mouse e VMM riposiziona le macchine sul nodo tornato operativo.

Il tutto senza che gli utenti si accorgano di nulla.

Conclusioni

E’ stata fino a qui una bella esperienza: il risultato è eccellente , l‘amministrazione semplice ed il cliente soddisfatto.

Tutto il lavoro è stato svolto senza nessun intervento lato client, aiutati molto anche dalle policy centralizzate (AD).

Per nostra fortuna/sfortuna abbiamo anche avuto modo di testare un crash del sistema in produzione a causa si una scheda madre difettosa che ha mandato in tilt le Qlogic interrompendo la comunicazione con la SAN.

Il cluster di Microsoft ha assorbito il colpo senza battere ciglio, trasferendo via rete la comunicazione sul nodo sano, con la sola conseguenza di un leggero rallentamento nella erogazione dei servizi ospitati sul nodo danneggiato.

Il tutto segnalato in maniera chiara ed esaustiva negli eventi del cluster.

Grazie alle tecnologie descritte fin qui, una volta ripristinate le comunicazioni in fibra con la SAN, il cluster ha ripreso a funzionare al 100% senza alcuna interruzione lato utente.

Una segnalazione doverosa va fatta nei confronti di IT MOMENTUM PROGRAM, grazie al quale abbiamo avuto a disposizione risorse e tecnologie per operare il più professionalmente possibile la Server Consolitation.

Giulio Martino
IT Security, Network and Voice Manager
Technical Writer e Supporter di ISAServer.it

www.isaserver.it www.ocsserver.it www.voipexperts.it http://blogs.dotnethell.it/isacab
giulio.martino@isaserver.it

Grazie a Giulio per l'interessante testimoninaza che ci ha dato.

Buona giornata a tutti

Giorgio

Technorati Tags: Microsoft,Virtualization,Hyper-V,IT PRO MOMENTUM

Giulio-Martino-ClusterR2.pdf