Хорошие инструменты для системных администраторов за 2018 год
Журнал «Системный администратор» — достаточно интересное издание. В нем нет журналистов в классическом понимании данного слова. Даже поздравления с различными праздничными датами в нем пишут системные администраторы, системные инженеры, системные программисты, системные архитекторы… и другие ИТ специалисты. С согласия автора — Алексея Бережного мы публикуем фрагмент статьи, посвященной разработкам российских специалистов, в которой упоминается один из наших продуктов — Resilient Power Control Module. Полная версия статьи доступна на сайте журнала «Системный администратор».
Ранее были описаны ситуации, когда без контроля электропитания жить и работать в принципе можно, но крайне хлопотно, неудобно и попросту невыгодно. Ситуацию в этой сфере я бы обозначил так:
ИТ-инфраструктура без защиты, автоматизации и контроля в рамках системы электропитания не является управляемой.
Там, где оборудование подключается к розетке, сразу возникает несколько вопросов:
• Контроль и учет потребления.
• Защита от различных аварийных ситуаций типа коротких замыканий и перегрузок.
• Возможность удаленного управления.
• Мониторинг и автоматизация, поддержание ИТ-инфраструктуры в работающем состоянии.
Одним из главных критериев при размещении оборудования ЦОД и на отдельных точках является предоставляемая мощность. И возникает вопрос: «Какой из клиентов потребляет больше допустимого или оплаченного лимита?»
Отдельной темой является защита от коротких замыканий и перегрузок. Если закоротило блок питания, в лучшем случае выбьет порт на ИБП. В худшем случае сгорит внутренняя электроника ИБП. И совсем плохо – выбьет входной автомат, который может отключить еще кучу оборудования.
Тут возникает интересный момент – сбойное оборудование еще надо вычислить. Если «выбивает» центральный автомат – это не так легко. С RPCM эта задача выглядит гораздо проще из-за того, что отключается конкретный вывод с «виновным» устройством.
Но защита от КЗ и перегрузок – только часть проблемы. Иногда бывает нужно что-то выключить или включить удаленно, а сделать это некому. А еще нужно оповещать системного администратора о проблемах и иметь механизм контроля и перезапуска подключенного оборудования.
Вот такое устройство выпустила компания RCNTEC (ООО «АРСИЭНТЕК»). Вначале, в 2017 году, проявилась модель Resilient Power Control Module – RPCM 1502 на 16 ампер.
Но 16 ампер при 230 вольт напряжения – это 3860 ватт. Для питания производительных серверов неплохо бы иметь мощность раза в два больше – и в 2018 году компания RCNTEC выпустила RPCM 1532 на 32 А.
RPCM 1532 рассчитан на более крупные корпоративные ИТ-инфраструктуры. Он позволяет выдать 7360 ватт при 230 вольтах и рассчитан на питание мощных серверов и систем с большим энергопотреблением.
RPCM 1532А хорошо подходит для питания серверов и другого оборудования ЦОД
Потом появился RPCM ME 1563 на 63А с мощностью до 14 490 при 230 вольтах для питания вычислительных устройств с еще более высоким уровнем потребления энергии (ME расшифровывается как Mining Edition).
Теперь представьте, что на удаленной точке есть небольшой «джентльменский набор» оборудования: коммутатор, пара простеньких серверов и еще чего-то. И, естественно, там никакого админа нет. Если сервер или коммутатор зависнут и станут недоступны по сети, их можно только перезагрузить. Надо ли ради этого ехать на удаленную точку?
А если поручить RPCM самому определить, что устройство не работает? Как бы мы сами это сделали, находясь на месте? Подключились бы к коммутатору и выполнили ping устройства, шлюза, потом внешнего адреса в интернет. Попробовали бы подключиться к серверу по SSH/HTTP или на консоль. Если он при этом не отвечает, то в перезагрузку. Часто признаком такого зависания служит аномально низкое для данного устройства энергопотребление (если только не настроен режим сбережения энергии).
Разработчики в RCNTEC в 2018 году создали новую прошивку для уже выпущенных и новых RPCM, в которой есть встроенная система контроля и автоматизации. Теперь RPCM способен сам определять проблемные устройства и перезагружать их по питанию. Контроль может осуществляться по уровню энергопотребления (при нестандартно низком падении потребления становится понятно, что устройство не работает в штатном режиме), а также проверкой доступности TCP-порта, через ping и специально для майнеров – по уровню хешрейта.
Окно настройки мониторинга оборудования в веб-интерфейсе RPCM
Рассмотрим ситуацию с автозаправкой. Не нужно ждать, когда сетевой шлюз завис и на него наконец обратили внимание, потом позвонили в центральный офис и решили его вернуть в строй методом выключения и повторного включения.
Если что-то из оборудования не работает и не может управляться удаленно по сети, то RPCM проверит ее состояние по доступности TCP-порта и через ping. Если «не пингуется» или порт не отвечает на TCP-запрос, системный администратор получит уведомление о проблеме.
Если в течение выделенного промежутка он не сможет устранить проблему, то RPCM самостоятельно перезагрузит данное устройство по питанию.
Да, такие отключения сами по себе несут некоторое зло. Но это можно сравнить с электрошоком при реанимации – больного сильно ударило током, но его сердце снова заработало, и он стал дышать.
Разумеется, подобные трюки с перезагрузкой по питанию нельзя выполнять, например, на виртуальной системе или СХД. Здесь нужно долго и кропотливо разбираться, в чем причина сбоев, и устранять проблему в корне.
Мой рассказ был бы не полон, если бы я не упомянул о мощных устройствах, которые компания RCNTEC выпустила совсем недавно. «Мощных» – в прямом смысле этого слова.
Это новые модели RPCM 3x250 и RPCM DELTA. RPCM 3x250 подключается сразу к трехфазной цепи к каждой фазе по принципу соединения «звезда» (фаза-ноль-заземление). В итоге потребитель получает 30 независимых выводов по 25 А.
250 А – это большая величина. Одного RPCM 3x250 хватит, чтобы поддерживать электропитание, например, крупного вычислительного кластера или торгового центра, небольшого промышленного предприятия и так далее.
Внешний вид RPCM 3x250
RPCM DELTA в целом схож со своим собратом, но предназначен для электросетей с фазным напряжением 120 вольт. Он подключается не к каждой отдельной фазе, а использует межфазное подключение по схеме «треугольника» (фаза1-фаза2-заземление), что дает 208 вольт на входе. Это позволяет увеличить подаваемую мощность.
И обе эти модели также имеют систему автоматического управления подключенными устройствами по уровню электропитания, по TCP, по ping и по уровню хешрейта. Как и в более «легких моделях» RPCM 15xx.
На данный момент — это передовые решения по контролю за электропитанием и подключенным оборудованием. Управляющих комплексов с такими широкими возможностям, а тем более для подключения к трем фазам и с таким уровнем мощности я пока больше нигде не встречал: ни в литературе, ни в рекламе.
Вдвойне приятно, что эти модели проектируются и собираются в России, при этом их охотно покупают во многих странах.
Это и есть настоящее импортозамещение: не закрывать доступ хорошим товарам и технологиям в угоду внутренним производителям, а самим разрабатывать и производить замечательные вещи, чтобы продавать их по всему миру.
Пресс-служба ООО «АРСИЭНТЕК»