BackUP сервер

Что такое цифровые данные и зачем их резервировать ?

Сегодня любая компания пользуется цифровыми данными. Это может быть несколько таблиц в Excel, а может быть целая база данных. Давайте представим среднестатистическую компанию, которая что-то производит и продает. В компании условно или согласно регламенту существует несколько отделов, каждый из которых занимается своим делом. Эти отделы взаимодействуют между собой, передавая информацию или используя её совместно. Цифровые данные - это и есть та информация, которую используют сотрудники предприятия и хранится она в электронном виде. Давайте рассмотрим несколько примеров, где могут хранится данные.

Резервирование данных
Схема 1

 

На схеме 1 изображено использование данных различными отделами в процессе взаимодействия. Системы хранения данными отмечены оранжевым цветом. Рассмотрим каждую систему отдельно.

 

Web сайт компании - находится на web сервере , состоит из файлов и базы данных. Как правило используется только отделом продаж, который получает заявки от потенциальных клиентов. В случае продвинутого интернет-магазина может быть также использован отделами логистики и склада, либо интегрирован с CRM системой и системой учета товаров.

 

Почтовый сервер - может располагаться отдельно как почтовый сервер, состоит из файлов (письма и вложения). Используется всеми отделами, как для внешнего, так и для внутреннего взаимодействия.

 

Сервер IP телефонии - как правило отдельный сервер. Кроме самого функционала (маршрутизация), ценность представляют история звонков (база данных) и файлы с записями разговоров. Используется всеми отделами.

 

База данных - здесь возможны разные вариации, это также сервер содержащий информацию об учете большинства бизнес процессов предприятия. Это может быть CRM система, система учета предприятия или какой-то самописный комплекс. Такая система хранит информацию о продажах, закупках, поставках, финансах и т.д. Состоит из файлов и базы данных. Используется отделами продаж, снабжения, бухгалтерии, логистики.

 

ПО бухгалтера - специализированное программное обеспечение используемое для осуществления оплат, учета и отчетности в контролируемые органы. В это число входят программы клиенты, такие как  клиент-банк, не требующие резервирования, кроме ключей и такие как Медок, 1С с наличием базы данных, которую также нужно резервировать. Используется исключительно бухгалтерами.

 

А теперь давайте представим что эти данные внезапно потерялись. Как быстро вы сможете продолжить работу предприятия? Какие последствия это принесет?

Наличие сервера, выполняющего ту или иную функцию можно разделить на две ценности - это конфигурация и данные

Конфигурация - это то, что заставляет ваш сервер выполнять свою функцию, согласно инструкциям, которые настроили системные администраторы по вашим требованиям. Например, в случае с почтовым сервером - это наличие почтовых ящиков, защита от спама, группы рассылки и т.д. Сама конфигурация хоть и уникальна в своем роде, но восстановима. Т.е. в результате её потери вы теряете время и ресурсы ваших специалистов по настройке. Основная ценность конечно это время, оно может нанести ощутимый урон вашему бизнесу.

Данные - это результат взаимодействия ваших систем и сотрудников (пользователей). Это информация которая накапливается в процессе работы вашего предприятия. Выполненные заказы, письма, звонки, аналитика и многое другое. Эта информация уникальна и практически не подлежит восстановлению. Поэтому она гораздо важнее конфигурации и в случае её утери последствия могут быть очень серьезные.

 

Последствия потери данных

Начнем с простого. К примеру вы потеряли почтовый сервер. До восстановления его работы вы не сможете получать заявки по электронной почте, делать рассылку и отправлять письма клиентам и партнерам. В данном случае есть небольшая альтернатива, телефонная связь и использование бесплатных аккаунтов типа gmail и ukr.net. Тем не менее почтовый сервер нужно восстановить. Если у вас нет никаких резервных копий, сервер Вам нужно создавать с нуля. Вам, имеется ввиду вашим системным администраторам, под ваших чутким руководством. Для этого понадобиться техническое задание. Если в процессе усовершенствования сервера (оно есть всегда, т.к. процессы оптимизируются, сотрудники меняются и т.д.) не велся учет контроля версий или не описывалась функциональность, все придется делать сначала. На этом этапе (восстановления конфигурации) вы может примерно оценить время, которое Ваше предприятие проживет без почтового сервера и оценить падение эффективности работы, как следствие падение прибыли или дополнительные расходы. А вот следующий этап более сложный, необходимо оценить потерю писем и вложений в них. Насколько эта информация важна, зависит от специфики предприятия.

Конечно, следует учесть, что сегодня такие вещи как почтовый сервер и сайт (который помещается в share hosting) компании хранят в хостинговых компаниях, в которых резервирование присутствует, так сказать из коробки. Поэтому потерять данные там сложнее. Но даже в этом случае мы рекомендуем хранить резервные копии отдельно от хостинга.

Усложняем ситуацию. После отказа сервера бесследно исчезла основная база данных. Та самая, которая хранит в себе информацию о продажах, закупках, поставках, финансах и т.д. Что в этом случае? Полный хаос. Склад не знает что отгружать, сколько единиц товара осталось. Производство не получит заказы, логистика не сможет отправить текущие. Думаю дальше продолжать нет смысла. Предприятие парализовано и восстановить его работу очень сложно. Чтобы посчитать убытки достаточно сопоставить средний доход предприятия в день плюс расходы на создание новой инфраструктуры.

Есть одна хорошая поговорка "Системные администраторы делятся на два типа, те которые еще не делают backup-ы и те, которые УЖЕ делают"  🙂 .  Так давайте же учиться на чужих ошибках, а не на своих.

Само собой, резервирование - это процесс требующий определенных ресурсов и кол-во их зависит от объема и важности данных. Это как страховка, платишь регулярно, получаешь по событию. Затраты на резервирование, одно из отталкивающих факторов. Каждый думает, что с ним это не случится и вкладывать деньги в систему резервирования не имеет смысла. Но, порой случается и последствия Вам уже известны. Подумайте и принимайте решения прямо сейчас.

Виды резервирования

Давайте рассмотрим различные способы резервирования данных. Самый простой способ - это локальный. Т.е. резервные копии создаются на том же сервере, где хранятся оригинальные данные. Это самый дешевый, но и самый ненадежный способ. Для его реализации достаточно иметь свободное место на сервере и систему (скрипт, программу) резервирования. Для повышения надежности, желательно хранить данные на отдельном диске или RAID массиве. Такой способ защитит Вас от рисков:

  • выхода из строя основного накопителя;
  • от программных сбоев (crash базы, ошибки файловой системы и т.д.);
  • вмешательств извне (взлом с целью уничтожить данные или скомпрометировать их);
  • человеческого фактора (случайное изменение/удаление информации пользователем).

На этом список заканчивается. Далее рассмотрим удаленный способ. Это когда резервные копии создаются или копируются на удаленный сервер. Для этого не обязательно покупать или арендовать сервер. Можно использовать свой. В идеале, если он будет находится в другом территориально удаленном филиале. Способ заключается в синхронизации резервных копий между серверами. В случае потери одного из серверов, данные можно будет восстановить из резервных копий на втором. Таким образом, кроме перечисленных выше пунктов, добавятся такие :

  • физическая поломка сервера (поломка, вследствие которой вышли из строя все комплектующие, в том числе и накопители)
  • кража (да, бывает технику воруют)
  • изъятие техники ("проверка" правоохранительными органами, которая может длиться не один месяц)
  • катаклизмы (пожар, наводнение, ураган)

Ну и один из самых надежных - это облачный способ. Как Вы уже поняли это резервирование в облако. В этом случае компания предоставляющая место в облаке уже позаботилась о том, чтобы Ваши данные избежали всех рисков перечисленных выше. Распределенная структура дата центров позволяет хранить данные с возможностью восстановления, даже при потери одного из дата центров. Разумеется мы имеем ввиду крупную компанию, имеющую дата центры как минимум в двух странах. Все это затратно, поэтому этот способ можно отнести не только к самому надежному, но и к самому дорогому. Его можно использовать как основной, так и как дополнительный. Можно вообще использовать все три способа одновременно.

Время восстановления данных

Кроме надежности хранения резервируемых данных, есть еще такой фактор, как время восстановления данных. Для кого-то он может быть критичным, для кого-то нет. Попробуем с этим разобраться. Допустим, мы уже настроили резервирование данных одним из способов. Смоделируем ситуацию потери данных.

  • просчитываем примерную сумму материального ущерба, который понесет компания в единицу времени (X условных единиц в час.);
  • запускаем тестовый процесс восстановления данных и засекаем время, которое для этого понадобится (Y часов).

Теперь мы можем посчитать сумму убытков, в случае наступления инцидента потери данных:  Z = X * Y

Очевидно, что сократить ее можно уменьшая время восстановления данных. Практически всегда уменьшение времени восстановления увеличивает бюджет процедуры (используются более совершенные технологии) или уменьшает надежность (когда копии хранятся ближе к оригиналу и попадают под риски, описанные выше). К таким задачам необходимо подходить индивидуально и пытаться оптимизировать этот процесс с условием, что сумма Z   B (где B - сумма бюджета резервирования). Для повышения надежности хранения копий можно комбинировать различные способы.

В особо нагруженных системах используют репликацию (создание полной рабочей копии сервера). Это практически приравнивает время простоя к нулю, в случае выхода из строя главного сервера, т.к. все его обязанности сразу же берет на себя сервер-реплика. В данном случае время зависит от применяемых технологий, но оно значительно меньше, чем процедура восстановления из удаленной копии. Но, как вы понимаете, это увеличивает бюджет обслуживания почти в двое. Почти, потому что сервер реплика может быть менее производительный, чем основной и соответственно немного дешевле.

Оптимизация резервируемых данных

Теперь, когда мы уже понимаем важность резервного копирования и готовы приступить к его реализации, пора подумать об оптимизации резервируемых данных.

  1. Максимально снизить объем резервируемых данных. Необходимо провести анализ и проставить маркеры важности. При необходимости сортировать данные. Ввести квоты на хранения данных, запретить сотрудникам хранить личные данные на серверах и общих хранилищах. Установить срок актуальности и периодически очищать или архивировать в отдельное место устаревшие данные.
  2. Выбор способа резервирования. Совсем необязательно в определенный период времени резервировать абсолютно все данные. Можно использовать добавочное или разностное резервирование. В этом случае будут резервироваться только те данные, которые изменились с момента последнего копирования. Таким образом можно существенно уменьшить объем и время резервирования.
  3. Серверная часть. Практически всегда есть возможность резервировать отдельные конфиги вместо полной копии сервера. Но тут необходимо определиться, что важнее, объем или время восстановления.

Итоги

При организации процесса резервирования необходимо учитывать такие факторы:

  • время резервирования данных
  • время восстановления данных
  • объем резервируемых данных
  • надежность хранения данных
  • способы резервирования данных