Уровни ЦОД – это классификация, которая предполагает присвоение дата-центру одной из четырех категорий надежности. Основным критерием оценивания является время безотказной работы, от которого напрямую зависит доступность информационной инфраструктуры, развернутой в определенном центре. Для этого анализируются различные показали, включая время потенциальных простоев, отказоустойчивость оборудования, избыточность аппаратного обеспечения и др.
В данном материале рассмотрим отдельно уровни надежности ЦОД, чтобы понять зачем нужна классификация и какой уровень дата-цента лучше выбрать для собственного бизнеса.
Как правило, рейтинг дата-центрам присваивается организацией Uptime Institute, специалистами которой были проанализированы ЦОД в более, чем 110 странах мира. На сегодняшний день сертификаты получили более 2 500 владельцев центров обработки данных. Уровни присваиваются снизу вверх, то есть первый считается наихудшим (показатели ожидаемого простоя самые высокие), а четвертый – максимально производительный и работает практически без простоя.
Отметим, что получение сертификата соответствия и прохождения тестирования не являются обязательными нормативными требованиями. Поэтому далеко не все ЦОД могут участвовать в рейтинге. Для получения сертификации необходимо подать в компанию проектную и техническую документацию, включая архитектурные спецификации, технические документы и пр. После анализа полученной информации, сотрудники Uptime Institute организовывают поездку по указанному адресу с целью провести подробное тестирование на месте. Окончательное решение принимается исходя из анализа полученных данных и сравнения их с эталонными показателями.
Классификация ЦОД зависит от нескольких показателей. Специалисты проводят подробную проверку всех систем и коммуникаций, включая:
линии электропитания;
наличие резервных генераторов;
протоколы обслуживания клиентов;
уровень физической и кибербезопасности;
производительность систем охлаждения;
избыточность аппаратных ресурсов;
отказоустойчивость.
Стоит подчеркнуть, что окончательная оценка не зависит от используемого оборудования конкретных поставщиков. Учитываются исключительно возможности аппаратного обеспечения.
Архитектура ЦОД данного уровня должна включать в себя: источник бесперебойного питания, генератор электроэнергии на случай отключения центрального электроснабжения, системы кондиционирования и отопления с эффективной циркуляцией воздуха по всему помещению, кондиционер компьютерного зала. Отметим, что первый уровень не подразумевает избыточность в критических системах. Например, не требуется наличия нескольких генераторов или резервной вентиляционной системы.
Все описанные выше компоненты должны работать как одна слаженная система, которая позволяет защитить аппаратное оборудование от возможных перебоев или скачков в напряжении, работать в сложных погодных условиях круглосуточно. Приостановка работы ЦОД допускается только в случае проведения планового технического обслуживания.
Tier I рекомендуется выбирать представителям малого бизнеса, где основным приоритетом является экономия бюджета, а небольшие простои не способны привести к серьезным негативным последствиям для бизнеса. Следует учитывать, что дата-центры первого уровня могут допускать простои почти до 29 часов в год.
Классификация дата-центров второго уровня подразумевает наличие всех возможностей первого уровня, однако предполагает частичное резервирование оборудование. Конкретно это касается компонентов электропитания, в том числе генераторов и оборудования охлаждения. Таким образом, небольшая избыточность позволяет дата-центрам Tier 2 обеспечивать повышенную надежность и устойчивость к сбоям в IT-процессах.
Как правило, такие ЦОД выбирают как малые, так и средние предприниматели, которые предпочитают более надежную информационную инфраструктуру, но в то же время не слишком ценную с точки зрения финансовых затрат. Вариант с ЦОД второго поколения также обеспечивает возможность автоматического резервного копирования, что всегда важно, если критическая информация хранится на корпоративном сервере.
Допустимое время простоя составляет до 22.7 часов в год. Это существенно меньше предідущего уровня, однако, показатель также далеко не идеален. Поэтому предпринимателям, для которых отказоустойчивость критически важна, лучше обратить внимание на следующую ступень в рейтинге центров обработки данных.
Tier 3 – это уровень ЦОД, объединяющий в себе преимущества двух предыдущих. Кроме того, он обеспечивает пользователям ряд дополнительных возможностей, включая сокращенное время простоя. Согласно регламенту, третья ступень рейтинга присваивается только в том случае, если дата-центр обеспечивает замену оборудования и плановое обслуживания без остановок. Чтобы предотвратить остановки, необходимо проводить эти два процесса одновременно.
Также, в дополнение к резервированию оборудования на втором уровне добавляется необходимость наличия нескольких магистралей распределения охлаждения и питания. Это позволяет отключать некоторые компоненты от общей инфраструктуры без необходимости в остановке всего ЦОД и, соответственно, бизнес-процессов клиентов.
Регламент гласит, что на все аппаратное оборудование, которое установлено в дата-центре, должно быть предусмотрено по два источника питания, подключенных к разным независимым блокам ИБП. Таким образом достигается бесперебойность работы. Если по какой-либо причине один источник ИБП требуется отключить, то сервер продолжает штатно функционировать без каких-либо перерывов в работе. То же касается и работы сетевого оборудования.
Системы охлаждения также подлежат резервированию. Для третьего уровня недопустимо, чтобы серверы перегрелись по причине выхода из строя кондиционеров и вентиляционного оборудования. В таком случае должна автоматически срабатывать система, включающая резервные мощности, которые будут работать до тех пор, пока основные охладители не будут включены.
Дата-центры, которым был присвоен третий уровень рейтинга, обязаны обеспечивать широкий спектр возможностей резервирования и улучшенную доступность. Формулу N+1 можно расшифровать следующим образом: при остановке оборудования, будь то плановое ТО или непредвиденный сбой, дополнительный компонент моментально подключается вместо основного, чтобы обеспечить отказоустойчивость. Это метод, который доказал свою эффективность на практике.
Также обязательным условием является автоматизированное резервное копирование пользовательских данных с условием, что резервные копии должны быть актуальны на протяжении трех суток. Таким образом, в случае отключения электричества пользователи ЦОД смогут получать доступ к своим данным пока поломки не будут устранены.
Несмотря на все преимущества, Tier 3 также не являются полностью отказоустойчивыми, так как они используют некоторые компоненты, не зависящие от объекта. Например, это внешние охладительные установки, источники питания коммунальных предприятий и пр.
Третий уровень дата-центров является промышленным стандартом. За счет высокого уровня устойчивости к отказам и достаточной избыточности такие ЦОД могут удовлетворить потребности среднего и крупного бизнеса к безопасности и доступности к критически важной информации.
Четвертое поколение центров обработки данных поддерживает все вышеописанные возможности. Его особенностью являются прогрессивные механизмы отказоустойчивости с резервированием для каждого компонента Таким образом, никакие сетевые прерывания или сбои в работе оборудования не окажут негативного влияния на IT-операции. Отсутствие единых точек отказа позволяет обеспечить максимальную непрерывность работы всех систем, вне зависимости от обстоятельств.
Данные формулы определяют полную избыточность инфраструктуры, что и является основным отличием третьего и четвертого классов. 2N резервирование предполагает, что для каждого компонента существует резервный, полностью идентичный оригиналу. Таким образом вся система дублируется, причем резервный вариант полностью физически независим от оригинала. Одним из очевидных преимуществ физической независимости является предотвращение компрометации обеих систем локальным событием.
Требования к автоматическому резервному копированию в Tier 4 состоят в следующем: резервные копии должны производиться автоматически и быть доступными на протяжении 96 часов после сбоя в работе основного оборудования. Кроме того, источник питания резервного сервера должен быть независимым от каких-либо общедоступных источников.
Классы ЦОД – эффективный инструмент для оценки качества предоставляемых услуг. У каждого клиента дата-центра неизбежно есть свои уникальные пожелания и требования к работе IT-инфраструктуры, поэтому многоуровневая классификация существенно облегчает выбор провайдера.
Так как сертифицированный рейтинг не является нормативным требованием для центров обработки данных, права и обязанности обеих сторон, как правило, регламентируются в коммерческом соглашении между поставщиком услуг дата-центра и клиентом. Права и обязанности могут разниться, в зависимости от конкретной ситуации.