Свободные решения по оптимизации хранения резервных копий

2019/06/13

Categories: storage systems Tags: ИКТ zfs vdo kvm docker bareos bacula

Исследование области

Среди свободных решений по оптимизации хранения резервных копий (сжатия, дедупликации), были выделены следующие решения:

Таким образом было принято решение проверить наиболее актуальные из решений, а именно VDO, SDFS, btrfs, zfs, QuadStor VTL

Тестирование

Производилось тестирование путем сохранения образов виртуальных машин без использования стороннего ПО резервного копирования. Образ виртуальной машины записывался на хранилище.

KVM Backup

Windows 10 - Snapshot backup

Результат

Из свободных продуктов VDO показывает самую эффективную дедупликацию образов виртуальных машин, на ровне с низким потреблением ресурсов сервера.

Bareos backup

Использовалось свободное ПО резервного копирования - Bareos. Производилось резервное копирование с использованием агента.

WIndows 10 - bareos-fd (agent)

Результат

Формат записи файлов резервной копии bareos не выровненный. Поэтому системы дедупликации без плавающего курсора и без изменяемого размера блока плохо справляются со своей задачей. Но несмотря на этот факт коэфициент дедупликации у OpenDedup достаточно неплохой.

У родительской ветки bareos - Bacula в версии enterprise (платная подписка) реализован функционал выравнивания блоков, для более лучшей дедупликации.

Commvault Backup

Резервное копирование с использованием платного программного продукта - Commvault.

Windows 10 - Commvault iDataAgent

ЗадачаVirtial Data OptimizerOpenDedupStoreOnce
1st full backup. Reduction:1%39%61%
2nd full backup. Reduction:27%68%93%
3nd full backup. Reduction:60%78%95%
4th full backup. Reduction:27%78%95%
5th full backup. Reduction:37%73%96%
Total1 : 1,271 : 31 : 8,6

Результат

Формат записи не оптимизирован для дедупликаторов с фиксированым блоком. При этом OpenDedup показывает неплохие показатели сжатия. Лучшие результаты у StoreOnce, так как он  рассчитан именно на такой сценарий использования.

Оценка финансовых показателей

Попробуем понять когда стоит использовать дедупликацию, а когда дешевле просто купить дополнительную емкость.

Сравним стоимость хранения на различных системах:

Effective Storage (TB)Суммарная стоимостьСтоимость $/tbСтоимость Р/гб
СХД EMC PowerVault ME401278$28328$36323,05 ₽
СХД HPE MSA 1050 (16x12TB)151,2$56532$37323,73 ₽
Storeonce 3640180$51202$28418,06 ₽
Cloud storage (3 years)150$112261$74847,51 ₽

Оценим затраты ПО дедупликации данных, с учетом ресурсов сервера и стоимости лицензий

Расход RAMРасход CPUСтоимость HardwareСтоимость SoftwareСтоимость ИтогоКэфициент уплотения емкостиСтоимость (в $/ТБ)Стоимость (в Р/ГБ)
StoreOnce VSA (up to 150 tb effective)578$5421$204117$20953780%$139688,67 ₽
OpenDedup SDFS (up to 150 tb effective)3816$64740$647467%$43,162,74 ₽
Virtual Data Optimizer VDO (up to 100 backend storage)200$11540$115333%$7,690,49 ₽

Таким образом если использовать дедупликатор поверх систем хранения данных стоимость хранения будет следующей:

StoreOce VSAДедупликация SDFSДедупликация VDOStoreOnce 3640
Добавляет стоимости:$1396 $43 $7н/д
Экономит емкости:80%67%33%н/д
Модель СХДСтоимость СХД
СХД DELL PowerVault ME4012 (12x8TB)$363$1469$164$249н/д
СХД HPE MSA 1050 (16x12TB)$373$1471$167$256н/д
Cloud storage (3 years)$748$1546$292$506н/д
Storeonce 3640$284

В процентном соотношении экономия стоимости хранения следующая:

SO VSASDFSVDO
СХД EMC PowerVault ME4012-305%55%31%
СХД HPE MSA 1050 (16x12TB)-294%55%31%
Cloud storage (3 years)-107%61%32%

Результаты

Таким образом можно порекомендовать использовать VDO в качестве дедупликации выровненных данных, например образов виртуальных машин, не прошедших через ПО резервного копирования. Данный продукт слабо нагружает сервер и обладает высокой стабильностью работы.

SDFS написан на Java, поэтому требования к ресурсам выше, стабильность ниже. На некоторых сценариях использования позволяет добиться достаточно неплохой экономии. Рекомендуется использовать совместно со свободным ПО РК.

Инструкции по созданию стендов

>> Home