Site Recovery for Hyper-V – введение


С некоторой задержкой после «Платформы» я бы хотел начать серию статей о востребованной задаче виртуализации, – защите вашей виртуальной инфраструктуры между двумя датацентрами. Бывают форс-мажорные ситуации, когда нарушена работа основного центра обработки данных (ЦОД) компании: проблемы с электропитанием, кондиционированием, незваными «гостями» в черных масках. Как защитить критические для бизнеса сервисы, чтобы, в случае возникновения проблем в основном ЦОД, их работоспособность могла в кратчайшее время быть восстановлена в резервном? У основного конкурента есть решение, называемое Site Recovery Manager, позволяющее защитить виртуальные машины между ЦОД, настроив перенос критичных сервисов в случае отказа одного из датацентров. Увы, ни ОС Windows Server 2008 R2, ни System Center Virtual Machine Manager 2008 R2 ничего подобного не предлагают. Выходящий в ближайшее время Service Pack 1 ситуации не меняет. Очевидно, существует необходимость решать такую задачу. В помощь приходит продукт Citrix Essentials for Hyper-V и его компонента StorageLink Site Recovery.

Что же дает StorageLink Site Recovery? По сути, данный продукт решает вышеописанную задачу: настраивает репликацию конфигураций виртуальных машин между узлами или кластерами узлов Hyper-V между несколькими ЦОД. Продукт тесно интегрируется с системами хранения данных, позволяя настроить репликацию между хранилищами в традиционном интерфейсе MMC, указав тип репликации, выбрав виртуальные машины для защиты, настроив правила переноса и возврата виртуальных машин.

Существует несколько изданий Citrix Essentials for Hyper-V. Нас для задачи Site Recovery устраивают лишь два: максимальное Platinum для крупных промышленных внедрений и бесплатное Express для защиты небольших кластеров – по два узла в ЦОД. Очевидно, бесплатное решение имеет некие технологические ограничения, в основном касающиеся количества узлов в защищаемом кластере и возможностей настройки полностью автоматического переноса виртуальных машин между ЦОД в случае возникновения проблем с одним из датацентов.

Предваряя вопросы, расскажу о стоимости. Citrix Essentials Platinum лицензируется на физический узел. Розничная стоимость лицензии на один узел, согласно Яндексу, составляет порядка $3000. Для оценки: предположим, наш кластер в основном ЦОД имеет 16 узлов (максимально возможное количество серверов в кластере) и на нём запущено 1000 виртуальных машин. Для такой конфигурации я исхожу из объема памяти на узле в 128ГБ, современные блейд серверы поддерживают до 512ГБ, а Hyper-V поддерживает до 1ТБ памяти на узле. Из данной 1000 виртуальных машин, посчитаем 400 критически важными для бизнеса компании, с необходимостью их работы в случае отказа основного датацентра. Очевидно, что многие инфраструктурные сервисы и часть бизнес систем, используемых в офисе компании также важны и критичны, но в случае форс-мажора, их недоступность в течении некоторого времени не нанесет ущерба бизнесу компании, так что мы можем не заниматься их защитой. Для запуска 400 виртуальных машин в резервном ЦОД нам потребуется кластер из 7 узлов – с теми же требованиями к серверам, что и в основном ЦОД. Стоимость лицензий Citrix для 16+7=23 серверов составит не более $70000. Много ли это? Решение конкурента VMware Site Recovery Manager не входит даже в самое максимальное издание vSphere Enterprise Plus, но лицензируется отдельно по количеству защищаемых виртуальных машин. Базовая цена пакета на 25 виртуальных машин, согласно тому же Яндексу, составляет порядка $12000. То есть для защиты 400 виртуальных машин за SRM придется доплатить порядка $192000. Так что цена в $70000 за решение от Citrix перестает казаться завышенной. А ведь в Citrix Essentials Platinum входит далеко не только StorageLink Site Recovery.

Что же вообще включено в продукт? Что вы получите вдобавок к Site Recovery при покупке лицензий Citrix?

Во-первых, сам StorageLink совсем не ограничен применением для Site Recovery. По сути StorageLink предоставляет возможности thin provisioning, автоматизации создания требуемых конфигураций на хранилищах для виртуальных машин посредством шаблонов, поддержку любых дисковых массивов, в том числе NAS решений, управление всеми дисковыми хранилищами из единой консоли и многое другое.

Во-вторых, в Essentials for Hyper-V также входит и Lab Manager – решение для автоматизации сценариев разработки и тестирования программного обеспечения, а также проведения тренингов и обучения. В чём-то продукт похож на Visual Studio 2010 Lab Manager.

В-третьих, полезной компонентой Essentials является Provisioning Server, позволяющий динамически создавать виртуальные машины по мере необходимости.

В-четвертых, Workflow Studio позволяет автоматизировать выполнение типовых задач. Решение напоминает Opalis, но более тесно интегрировано с продуктами Citrix.

Понятно, что программный продукт не подарит вам возможности репликации данных между вашими ЦОД, если дисковые хранилища этого не поддерживают, или не лицензированы на выполнение репликации. На данный момент StorageLink Site Recovery работает со следующими дисковыми системами, позволяя настроить их репликацию и защиту виртуальных машин из своей консоли:

В одной из следующих статей я опишу процесс настройки стенда Site Recovery, не требующего каких-либо начальных инвестиций. Мы воспользуемся бесплатной версией Express и виртуализованными дисковыми хранилищами HP P4000, – виртуальными машинами Hyper-V, представляющими любые локальные диски (DAS) или ваш SAN как виртуальный iSCSI SAN HP P4000 с возможностями построения сетевого массива RAID и настройки программной репликации массивов. Для промышленных сценариев, очевидно, мы рекомендуем выбирать аппаратные решения репликации.

Если тема построения сценария Site Recovery на виртуальной платформе Microsoft актуальна для вашего бизнеса, и вы бы хотели обратиться в Microsoft за коммерческим предложением по проектированию подобной системы, выполнению пилотного проекта, или построения решения под ключ, напишите мне через форму справа, Microsoft Consulting имеет опыт выполнения таких проектов у различных крупных заказчиков в разных странах. Мы тесно сотрудничаем с Citrix, что гарантирует тщательность и проработанность дизайна такой системы.

Если у вас есть общие или технические вопросы по построению Site Recovery на платформе Hyper-V, можете задавать их в комментариях (блог публикует комментарии только от зарегистрированных пользователей, имеющих LiveID) или свяжитесь со мной через ту же форму справа, я отвечу на вопросы или перенаправлю на необходимых специалистов.

Во вопросу «а как настроить» прошу подождать следующей статьи цикла. Мы рассмотрим решение с виртуализованным HP P4000 и StorageLink Express, но я отдельно уделю внимание сценариям, которые доступны лишь в Platinum версии, и оговорю отличия между реальным и виртуальным SAN.

Comments (9)

  1. Alex A says:

    Увы, я не смогу предоставить доступ в сеть Microsoft извне. Да и устанавливать vSphere я сам не имею права.

    Мне интересен лишь вариант, когда VMware будет настраивать признаный коммьюнити человек, чтобы мы договорились результаты опубликовать.

  2. Alex A says:

    EULA легко обойти – устроим online webcast с тестированием. Запись выкладывать не будем, но будем предоставлять желающим по просьбе – ничего не нарушая. Опишем результаты и выводы в общем с процентами, но без четких цифр.

    Спасибо за ссылку, интересно. В SP1 это решается малым значением Startup Memory, которое равно 256МВ для 2003 и 512 для Vista/7/2008/R2.

    В тесте (где мы считали количество запускаемых Win7SP1 с приложениями и работой скрипта, эмулирующего пользователя) мы разрешали balloning, но не разрешали явное скидывание памяти в свов при недостатке RAM. Настройки делал партнер.

    Про Memory Compression – цифры "тестов VMware", равно как и наших 🙂 всегда показывают некую идеальную песочницу. В реальных системах, где запущены важные сервисы они несколько ниже. Повышение количества запущенных ВМ (в сравнении с vSphere без compression) на 20% при потере производительности на 20% есть явный регресс, если верить математике: ((X + 20%) – 20%) = ((X – 20%) + 20%) = 0.96 * X

    Все решит тестирование. Указывать просто цифры не интересно, на мои цифры "с потолка" будут даны такие же (но лучше). Интересно с признанным экспертом вместе поиграть на одинаковом железе. Если смущает проведение на территории Microsoft, можно договориться с HP. Или я буду рад сделать это в чёрном замке VMware :)))

    P.S. Андрей, прошу привязать ваш ник к LiveID – публикация будет проходить мгновенно. Отложенная публикация комментариев для незарегистрированных пользователей есть метод борьбы со спамом, которого на TechNet много.

  3. Templier says:

    <>Все решит тестирование. Указывать просто цифры не интересно, на мои цифры "с потолка" будут даны такие же (но лучше). Интересно с признанным экспертом вместе поиграть на одинаковом железе. Если смущает проведение на территории Microsoft, можно договориться с HP. Или я буду рад сделать это в чёрном замке VMware :)))<>

    Не смущает, просто пока я не могу для тестирования приехать в Мск 🙂

    А еще мне чертовски интересно, какие настройки сделал ваш партнер по тестам 🙂

    Если получится его "расспросить" и дать эту информацию – буду очень признателен.

  4. Alex A says:

    <p>В таблице во втором столбце дана информация для StorageLink, а в третьем для StorageLink Site Recovery. Я не имею списков VMware, и не привожу их.</p>
    <p>Про 40% – для большинства заказчиков, которые имеют сотню-другую серверов число будет близко к этому. Для монстров с сотней тысяч серверов, а таких у нас дай бог десяток наберется, будет меньше. Особенно в презентации от VMware :)</p>
    <p>По консолидации – с SP1 рейтинг консолидации для ОС 2008/2008R2 на Hyper-V уже выше чем XenServer и vSphere – мы не зря работаем над ядром своей ОС, в нашей виртуализации гипервизор четко знает, где какая память находится в гостевой ОС, – где память относится к ядру, где к пользовательским процессам, а где это файловый кэш – так что наш драйвер динамической памяти считает память занятую кэшем "свободной" и умеет её забирать. Как вы знаете, Windows Vista/7/2008/R2, а также Linux ВСЮ свободную память используют для предварительного кэширования файлов ОС и часто-используемых пользовательских файлов. Результат – отсутствие &quot;пустых страниц&quot; в памяти и практически неработоспособность Transparent Page Sharing, которое (работая в среднем лишь раз в час) засекает как &quot;одинаковые&quot; на 90% лишь &quot;пустые страницы&quot;. Эффективность оптимизации памяти в vSphere шикарна на XP/2003 и гм.. очень устарела для 2008/R2. </p>
    <p>Есть сомнения – приглашаю на соревнование в MTC – возьмем по одинаковому серверу, настроим гипервизоры, далее через MDT (или любое другое решение удаленной установки) ставит сотню виртуалок с 2008/R2 – кто же умрёт раньше? Если мы уславливаемся не свопить память на диск сервера, то за ответ я ручаюсь, тесты уже проводил перед лицом заказчиков. </p>
    <p>По практической части, я организую тренинг с записью, так что будет не просто статья, но и вебкаст в записи. На русском и английском.</p>

  5. ivs says:

    А как-то отключать проверку правописания, чтобы не уродовать скриншоты – не?

  6. Андрей Вахитов says:

    Не совсем понял таблицы. В третьем столбце Site Recovery или Site Recovery Manager? Если SRM, то, например он работает с HP EVA и даже есть best practice по этому поводу;

    Как мне кажется, принимая количество бизнес-критичных систем за 40% от общего количества ВМ, вы несколько "погорячились". Если таких систем хотя бы 10%, то согласно вашим расчетам решения от VMware и Citrix сравняются в цене (~55000$). К примеру, у Билайна таких систем 55, на пару тысяч серверов (http://www.cnews.ru/…/trikoz.ppt), если я правильно "прочел" презентацию.

    P.S. Впрочем, ожидаемо от сотрудника MS "давить" на схему лицензирования SRM, обосновывая его нецелесообразность. VMware, скорее всего, давило бы на большую степень консолидации ВМ, показывая, что вам нужно не 7 серверов, а 17, к примеру.

    Ну и с нетерпением ждем практической статьи!

  7. Андрей Вахитов says:

    Буду рад посоревноваться.

    Есть возможность провести соревнование удаленно, из моего города?

  8. аноним says:

    внесу ясность касательно "у Билайна таких систем 55, на пару тысяч серверов".

    под системами имеются ввиду набор компонент входящих в данный комплекс по. таким образом 55 систем надо умножать минимум на 4-6 серверов, чтобы получить примерное кол-во серверов поддерживающих данные системы. так же многие системы "живут" одновременно на разных аппаратных платформах, т.е. все сервера надо складывать.

    реальная цифра – 15-20%

    Alex A. – укажите исходные параметры хоста/вм для тестов и критерии "кто же умрёт раньше". попробую провести тест на сфере4.1

  9. Андрей Вахитов says:

    По поводу публикации результатов есть еще нюанс – согласно EULA публиковать результаты тестирования можно только после их одобрения компанией VMware.

    Может, кто-то из vExpert's поближе к вам вызовется?

    Кстати, по поводу пользы от TPS есть интересная статья от Duncan Epping'a – http://www.yellow-bricks.com/…/how-cool-is-tps

    Как я понимаю, в Hyper-V R2 SP1 эта проблема решается установкой малого количества Minimum Memory?

    P.S. Алексей, назрел вопрос: "Если мы уславливаемся не свопить память на диск сервера, то за ответ я ручаюсь, тесты уже проводил перед лицом заказчиков."?

    Каким образом вы избегали свопа на диск? Единственный известный мне способ при нехватке ресурсов – резервирование памяти, отключающее не только SWAP, но и Memory Baloon.

    P.P.S. Кроме того, зачем отключать своп VMware? У VMware есть замечательный функционал: Memory Compression и возможность положить своп на дополнительные SSD-диски. Потери производительности по тестам VMware в этом случае в районе 10-15%, по сравнению с использованием ОЗУ.

Skip to main content