Дедуплікація даних в Windows Server 2016 (частина 2).
Продовжуємо розмову про дедуплікаціі даних в Windows Server 2016, розпочатий в попередній статті. Сьогодні мова піде про тонких налаштуваннях, особливості роботи дедуплікаціі і проблемах, з якими можна зіткнутися в процесі її використання.
Завдання дедуплікаціі
Дедуплікація складається з трьох етапів , які виконуються у вигляді запланованих завдань:
• Оптимізація (Optimization) - в процесі оптимізації файли розбиваються на блоки (chunk), обчислюються збігаються блоки і зайві копії блоку видаляються, замінюючись посиланнями.Потім з блоків формуються контейнери, які в залежності від налаштувань, додатково стискуються і поміщаються в сховище блоків (chunk store);
• Прибирання сміття (Garbage Collection) - видалення блоків даних, на які немає активних посилань. При видаленні оптимізованого файлу пов'язані з нього блоки не будуть видалені з сховища негайно.Завдання збірки сміття знаходить ці "безгоспні" блоки та видаляє їх, тим самим звільняючи дисковий простір;
• Очищення (Scrubbing) - перевірка цілісності дедупліцірованних даних. Використовується для аналізу пошкоджень сховища і, по можливості, для відновлення пошкоджених даних.
Список всіх запланованих завдань можна вивести командою Get-DedupSchedule.
завдання збірки сміття і очищення додатково поділяються на звичайні і повні (full):
Повна збірка сміття
При звичайній збірці сміття контейнер сховища блоків стискується тільки в тому випадку, якщо існує мінімальний відсоток блоків без посилань.При повній збірці сміття контейнер стискається навіть в тому випадку, якщо на окремий блок в контейнері відсутнє посилання. Також при повній збірці звільняється місце, яке могло бути використано при позаштатному завершення роботи дедуплікаціі (напр. При збої живлення). Звичайний тип збірки сміття працює швидше і споживає менше ресурсів, ніж повний, але звільняє менше місця.Повна збірка сміття звільняє до 5% більше місця, ніж звичайна, але при цьому працює довше і споживає більшу кількість системних ресурсів. За замовчуванням кожна 4-а процедура складання сміття є повною.
Повне очищення
Звичайна очищення перевіряє і виправляє тільки цілісність критичних метаданих і даних, для яких раніше були зафіксовані проблеми.При повному очищенні перевірці піддаються всі без винятку дані на томі. Цей тип очищення немає необхідності запускати часто, тому за замовчуванням він не використовується. Запустити його можна вручну, за допомогою командлета Start-DedupJob з ключем Full.
Завдання оптимізації також підрозділяються на три типи:
Фонова оптимізація (Background optimization)
завдання дедуплікаціі запускається щогодини і працює з низьким пріоритетом, споживаючи мінімальну кількість ресурсів.Подібний режим запуску дозволяє максимально економити ресурси сервера і виконувати оптимізацію лише за відсутності навантаження. Якщо ресурси для виконання завдання оптимізації стане недостатньо без впливу на робоче навантаження сервера, то завдання буде зупинено.
Пріоритетна оптимізація (Priority optimization)
Також запускається раз на годину, але працює з нормальним пріоритетом і споживає більшу кількість системних ресурсів (до 50% пам'яті і до 100% процесора).У файлах великого розміру при фрагментації кількість фрагментів може наближатися до граничного значення для одного файлу. При оптимізації відбувається об'єднання фрагментів. Включення пріоритетною оптимізації додає додаткові процедури обробки, що дозволяє зменшити рівень фрагментації.Даний тип оптимізації Microsoft рекомендує для віртуальних серверів резервного копіювання.
Продуктивна оптимізація (Throughput optimization)
Самий простий і зрозумілий