Дано: российская частная сеть медицинских клиник.
Регион: Центральный регион РФ, Северо-Западный регион РФ, Южный регион РФ, Приволжский регион РФ
Ресурсы: 64 ВМ, более 40 Tb виртуального пространства
Справка:
Сеть филиалов по всей стране, 59 клиник в разных городах. На рынке с 2012 года.
Ситуация до обращения:
Компания использует гибридную инфраструктуру, в собственном дата-центре хранятся конфиденциальные данные клиентов, которые дублируются в географически независимый от основной инфраструктуры заказчика ЦОД. Приёмы в клиниках ведутся без выходных, данные поступают ежеминутно, а их потеря несёт высокие репутационные риски для компании. Задачи, стоящие перед IT-отделом – доступность и целостность данных и постоянная работоспособность информационных систем. Сложность выполнения этих задач в том, что клиники расположены в разных часовых поясах, а выходных дней нет, поэтому окна простоя крайне малы. Специалисты заказчика просчитали допустимые потери и внесли эти требования в проектную документацию.
RPO (Recovery point objective): не более 1 часа
RTO (Recovery Time Objective): не более 2 часов
Подготовительный этап:
Необходимо было клонировать инфраструктуру заказчика в том виде, в котором она существует сейчас.
-
Совместно с IT-отделом сети выбрали несколько окон простоя, в которые смогли вписаться и осуществить работы
-
Выделили виртуальное пространство достаточного объёма
-
Выделили отдельный гигабитный канал
-
Развернули 64 ВМ, дублирующих существующую информационную систему
-
Обеспечили сетевую связность всех площадок заказчика
-
Создали тестовые задания на репликацию в разных случаях и помогли прописать регламенты учений
Архитектура решения
Решение реализовали на базе VMware vCloud Availability (vCAV).
Репликация данных происходит каждые 5 минут. Было создано 12 точек восстановления (сохранённых состояний виртуальной машины).
Специалисты CorpSoft24 помогли заказчику настроить эти параметры, после чего было произведено несколько серий испытаний.
На текущий момент компания готова к любым аварийным ситуациям. Скорость развёртывания резервной инфраструктуры полностью составляет не более часа, а скорость восстановления работы любой из клиник сети составляет не более 15 минут.
Регулярные тесты аварийных ситуаций по требованию клиента производятся не реже 1 раза в квартал.