Дисковые системы резервного копирования с функционалом дедупликации HP StoreOnce Backup эмулируют традиционные ленточные библиотеки и NAS-устройства и позволяют серверам работать с ними как с обычными ленточными накопителями и NAS-системами с помощью любого программного обеспечения резервного копирования. Эмуляция дисковыми системами резервного копирования большого количества ленточных накопителей позволяет выполнять значительное число процессов резервного копирования параллельно, что существенно повышает производительность и снижает время, необходимое для создания копий. Кроме того, поскольку физически данные находятся на дисках, восстановление одиночных файлов происходит очень быстро. Так как не требуется ждать пока робот установит картридж в привод, а сам привод перемотает ленту до нужного места, чтение с дисков происходит практически мгновенно.
Рекомендуемыми областями использования виртуальных дисковых библиотек являются условия резервного копирования, при которых:
— требуется повысить производительность резервного копирования, а установить большее количество ленточных приводов нет возможности;
— требуется быстрое восстановление одиночных файлов и элементов (например, почтовых ящиков или виртуальных машин);
— есть необходимость исключить использование лент как носителей информации;
— требуется резервное копирование и хранение данных с коротким временем жизни;
— требуется альтернатива (или дополнение) технологиям мгновенных снимков (Snapshot и Clone), с тем, чтобы не хранить их на основном дисковом массиве;
— требуется сохранять большой объем повторяющихся (сходных) данных;
— необходимо создать территориально-распределенную структуру резервного копирования с возможностью автоматической репликации копируемых данных между площадками (в том числе по низкоскоростным каналам).
На сегодняшний день, компания HP предлагает три основных семейства виртуальных дисковых библиотек с дедупликацией:
— одноконтроллерные библиотеки моделей HP StoreOnce 2700 Backup, HP StoreOnce 2900 Backup, HP StoreOnce 4500 Backup, HP StoreOnce 4700 Backup, HP StoreOnce 4900 Backup;
— многоконтроллерная библиотека HP StoreOnce 6500 Backup;
— HP StoreOnce VSA Backup — программная реализация дисковой библиотеки на базе виртуальной машины для гипервизоров VMware или Microsoft Hyper-V.
Одноконтроллерные библиотеки и виртуальные машины VSA ориентированы на малые и средние компании, а также на удаленные филиалы больших компаний, многоконтроллерная библиотека модели 6500 — на средние и крупные компании, где требуется отказоустойчивость и надежность уровня пять девятых, а также повышенная производительность и масштабируемость.
Многоконтроллерная виртуальная дисковая библиотека HP StoreOnce 6500 имеет отказоустойчивую модульную архитектуру. Она состоит из нескольких блоков, называемых куплетами (couplets). Один такой блок включает в себя 2 контроллера, объединенных в отказоустойчивый кластер по технологии active/active. К паре контроллеров по дублированным SAS-интерфейсам подключаются две одинаковые дисковые подсистемы (полки HP D6000). Таким образом, в библиотеке HP StoreOnce 6500 дублируются все активные компоненты и все внутренние каналы передачи данных. Также у нее нет единой точки отказа. HP StoreOnce 6500 может масштабироваться как наращиванием емкости внутри блоков (куплетов), так и путем увеличения количества самих куплетов (до 4 шт.). Между собой куплеты взаимодействуют по внутренней дублированной сети 10 Gb Ethernet.
Все системы резервного копирования HP StoreOnce Backup могут параллельно с эмулированием ленточных устройств выглядеть и как NAS-устройства (с доступом по протоколам CIFS и NFS). Во всех дисковых библиотеках HP для хранения данных используются диски высокой емкости класса Nearline-SAS, причем данные защищаются с помощью аппаратного RAID6 (исключение составляет самая младшая модель — 2700, где используется RAID5).
Одним из важных преимуществ использования дисковых систем резервного копирования HP StoreOnce Backup по сравнению с использованием для резервного копирования обычных дисковых массивов является поддержка системами HP StoreOnce Backup дополнительных функциональных возможностей, к которым относятся: дедупликация и сжатие данных, репликация данных между разными площадками и технология HP StoreOnce Catalyst.
Технология дедупликации
Технология дедупликации позволяет существенно повысить эффективность использования дисковых ресурсов систем резервного копирования за счет обнаружения идентичных блоков данных (сравнивая новые данные с ранее записанными) и хранения на дисках только уникальных блоков данных и необходимых ссылок на них. Таким образом, при регулярном создании полных резервных копий множество идентичных блоков, хранимых в виде ссылок, обеспечит высокий коэффициент дедупликации. В дополнение к тому, оригинальные блоки данных записываются на диски в сжатом виде (после дедупликации применяется алгоритм компрессии).
В системах HP StoreOnce Backup используется on-line технология дедупликации StoreOnce Deduplication, то есть обнаружение идентичных блоков производится в процессе сессии резервного копирования непосредственно во время записи на устройство. Технология репликации по низкоскоростным каналам (Low Bandwith Replication) позволяет автоматически копировать данные между несколькими устройствами HP StoreOnce Backup. Такая технология репликации интегрируется с технологией дедупликации, что существенно сокращает объем данных, передаваемых между дисковыми системами резервного копирования, что позволяет использовать для репликации данных достаточно медленные IP-каналы, так как всегда передаются только оригинальные, неповторяющиеся блоки данных.
Технология HP StoreOnce Catalyst
Технология HP StoreOnce Catalyst — это фирменная разработка HP Labs, объединяющая под этим названием новый тип устройств для резервного копирования (HP StoreOnce Catalyst Store) и протокол передачи этих копий. Эта технология позволяет переносить часть нагрузки по дедупликации на уровень сервера резервного копирования. В этом случае между серверами и устройством HP StoreOnce Catalyst Store данные будут передаваться в дедуплицированном виде. Это позволяет разгрузить сеть передачи данных и существенно поднять производительность резервного копирования, перенеся часть нагрузки на уровень серверов. Кроме того, такой подход позволяет создавать федеративную (распределенную) систему дедупликации, когда дедупликация может выполняться на аппаратных системах HP StoreOnce Backup и на программных системах (медиасерверы), расположенных там, где это нужно (удобно) заказчику. В том числе, можно выполнять резервное копирование на удаленные устройства HP StoreOnce Catalyst Stores, используя для этого обычные IP-каналы связи.
Технология HP StoreOnce Catalyst позволяет выполнять репликацию данных между устройствами HP StoreOnce Backup под управлением приложений резервного копирования. Это дает возможность в целях обеспечения катастрофоустойчивости создавать несколько удаленных копий резервных данных, доступных приложению резервного копирования. Для копий, хранимых в разных центрах, можно задавать различные политики хранения. Приложение резервного копирования, поддерживающее данную технологию, будет знать о месте размещения всех таких копий и сможет с ними работать.
В настоящее время технологию HP StoreOnce Catalyst поддерживают следующие приложения резервного копирования: HP Data Protector, Symantec NetBackup и Backup Exec, Oracle RMAN, Plugin для резервного копирования Microsoft SQL, Bridgehead Software. Технология HP StoreOnce Catalyst включает поддержку открытого протокола Symantec OST.
ПО Recovery Manager Central
Дальнейшим развитием технологии HP StoreOnce Catalyst стала возможность прямого копирования данных с массивов HP 3PAR на дисковые библиотеки HP StoreOnce Backup по сети хранения SAN без необходимости использования отдельного ПО резервного копирования. Данный продукт получил название Recovery Manager Central (RMC). В его первой версии поддерживается прямое резервное копирование виртуальных машин VMware, размещенных на логических томах массивов 3PAR на дисковые библиотеки HP StoreOnce. В основе решения — аппаратные мгновенные копии (snapshot) массива 3PAR и фирменный протокол HP StoreOnce Catalyst, используемый в качестве транспорта при передаче данных. Управление всем процессом централизовано и интегрировано в интерфейс VMware vCenter.
Преимуществами такого решения является высокая скорость выполнения резервного копирования и восстановления, так как используется высокоскоростная сеть хранения SAN, отсутствие влияния на работу самих виртуальных машин, простота управления и настройки решения. Управление не требует изучения дополнительных средств управления и доступно администраторам VMware или администраторам систем хранения данных. В дальнейшем список сред, поддерживаемых RMC, расширится.
Ниже представлены типовые схемы двухуровневого резервного копирования для организации с несколькими филиалами, основным и резервным центрами обработки данных. В обеих схемах используется технология репликации данных, интегрированная с технологией дедупликации.
Типовые архитектурные решения для резервного копирования
Традиционное резервное копирование
Традиционный подход заключается в выделении определенного времени («окна») для резервного копирования, в течение которого все приложения, данные которых копируются, останавливаются для обеспечения целостности (консистентности) взаимосвязанных информационных объектов. Такой подход достаточно прост и надежен, позволяет копировать данные, хранимые любым способом, в том числе, на локальных дисках серверов и при прямом подключении ленточных накопителей, но при больших объемах требует существенного времени простоя приложений.
Для уменьшения «окна» резервного копирования или сохранении размеров «окна» при росте данных необходимо параллельно создавать резервные копий разных объектов. Для обеспечения множества параллельных потоков дисковые системы резервного копирования гораздо эффективнее, чем ленточные. Однако для надежности и сокращения затрат копии, хранимые долго, помещаются на ленты. Ежедневные копии помещаются на диски. Для перемещения объектов с дисковых библиотек на ленты можно использовать тот же (при прямом подключении приводов) или другой сервер (при использовании приводов в сети SAN) вне окна бэкапа.
Время восстановления даже одного файла с ленты может быть сравнимо со временем полного бэкапа, в зависимости от обстоятельств. Можно делать инкрементальные копии, хранящие только изменения, для уменьшения объемов и ускорения ежедневного процесса резервного копирования, но полное восстановление в этом случае потребует больше времени, поскольку потребуется восстановить последний полный бэкап, а затем последовательно применить все инкрементальные копии, сделанные до времени точки восстановления.
Резервное копирование при помощи моментальных снимков
Использование систем хранения данных (например, HP 3PAR StoreServ) или систем виртуализации (например, VMware), имеющих функциональность моментальных снимков — клонов и снапшотов (snapshots), позволяет получать резервные копии почти мгновенно и тем самым сократить время простоя приложений (останавливаемых для обеспечения консистентности данных) почти до нуля. Восстановление на заданный период времени также осуществляется практически мгновенно — путем подмены основного тома соответствующей копией.
Резервные копии в этом случае всегда полные, следовательно, большой процент данных от копии к копии повторяется с высокой степенью вероятности. Это не только требует увеличения объема хранения на основном дисковом массиве, пропорционально количеству хранимых копий, но и недостаточно безопасно, поскольку при выходе из строя основной системы хранения данных могут пропасть и резервные копии. Для преодоления данного недостатка резервные копии переносятся на независимый дисковый массив, в качестве которого рекомендуется использовать систему с дедупликацией, например, HP StoreOnce, поскольку она позволяет не только сократить объем хранения за счет повторяющихся данных, но и обеспечить высокую производительность за счет множества параллельных потоков резервного копирования.
Перенос резервных копий на независимую систему хранения может осуществляться основным сервером или специально выделенным сервером резервного копирования, в зависимости от нагрузки, объемов и наличия необходимого времени. Период времени, в течение которого нужно скопировать данные, по сравнению с традиционным подходом, расширяется до времени между изготовлением двух последовательных моментальных снимков. Время копирования на внешний массив или магнитную ленту нельзя сократить за счет инкрементальных копий, поскольку программное обеспечение резервного копирования должно прочитать весь мгновенный снимок дискового тома. Долговременно хранимые копии можно помещать на ленты так же, как и при традиционном подходе.
Ценой минимального простоя приложений и/или увеличения «окна» бэкапа при постоянном росте объемов данных является существенное усложнение как аппаратной части системы в целом, так и процессов управления.
Прямое резервное копирование с системы хранения данных на дисковую библиотеку с дедупликацией
Наилучшим решением является такое объединение двух вышеуказанных подходов, при котором суммируются их плюсы, а недостатки нивелируются. Компания HP разработала технологию прямого резервного копирования (flat backup), реализованную в продукте, называющемся HP StoreOnce Recovery Manager Central (RMC). Решение позволяет осуществлять резервное копирование виртуальных машин под управлением VMware vCenter и их хранилища данных (data stores) при помощи функционала HP 3PAR Virtual Copy с дискового массива непосредственно на дисковую библиотеку с дедупликацией HP StoreOnce.
Резервированием и восстановлением можно управлять прямо из привычной системным администраторам консоли управления VMware vCenter, что существенно упрощает управление, причем данные процессы практически не требуют остановки приложений на сколь-нибудь заметное время. На дисковую библиотеку HP StoreOnce отправляются только измененные блоки, причем создание полных синтетических копий позволяет быстро восстановить виртуальную машину целиком на нужный момент времени. Прямой бэкап снимает необходимость в использовании специализированного программного обеспечения резервного копирования и, соответственно, выделения бэкап-сервера или медиасервера для записи резервных копий на библиотеку.
Благодаря дедупликации и использованию технологии синтетических полных копий, существенно уменьшается потребность в дисковой емкости для хранения бэкапов, в то время как надежность, в сравнении с хранением мгновенных копий на основных дисковых массивах, повышается, так как продуктивные и резервные данные разнесены по разным устройствам. Сам процесс копирования ускоряется за счет автоматического разделения томов на множество объектов, копируемых параллельно. Первая версия HP StoreOnce RMC 1.0 поддерживает «из коробки» интеграцию только с виртуальными средами VMware, однако обладает средствами для разработчиков приложений, позволяющими авторам приложений интегрировать управление мгновенными копиями и бэкапом с собственными разработками.
В дальнейших версиях добавится поддержка других виртуализаторов, а также баз данных, почтовых служб и т.д.