Мониторинг и контроль удалённых устройств при помощи RPCM. Часть 2. Управление майнерами криптовалют производства компании Bitmain
Предисловие ко второй части
Ранее мы говорили о том, что любой, даже самый незначительный простой выливается в денежные расходы.
Однако есть современная область ИТ, где любой сбой напрямую не просто «выливается в конечном итоге», а уже сразу, здесь и сейчас влечет значительные денежные потери в виде недополученных денег.
Это — майнинг (добыча) криптовалют.
Для удобства работы майнеров, а также для защиты майнинговых ферм компанией RCNTEC была создана специальная модель Resilient Power Control Module Mining Edition 1563 на 63 ампера (14,5 киловатт при напряжении 230 вольт).
Рисунок 1. RPCM ME 1563 вид спереди и сзади.
Майнеры от Bitmain и RPCM Mining Edition — вместе сила
Как было сказано выше, для оптимизации вложений и повышения отдачи при добыче криптовалют применяются специальные устройства — майнеры.
Они представляют собой специальные компьютеры, каждый из которых содержит системную плату (контроллер), интерфейс Ethernet. Основу для вычисления составляют процессорные платы с чипами, специально заточенными для добычи криптовалют и фирменное ПО от производителя. Есть возможность управления через web-интерфейс или по SSH.
Идя навстречу многочисленным клиентам, компания RCNTEC адаптировала свои RPCM для управления линейкой устройств от компании Bitmain Technologies Ltd: ANTMINER S9, ANTMINER L3+, ANTMINER D3.
Почему любая майнинговая ферма нуждается в пристальном внимании?
Во-первых, чтобы майнеры приносили максимальную отдачу, они должны работать постоянно, на пике своих возможностей.
Во-вторых, высокая производительность создаёт серьёзную нагрузку на систему электроснабжения. Сообщения о пожарах, вызванных использованием майнинговых систем без специальных устройств управления электропитанием — увы, это далеко не редкость.
Ещё одной особенностью специальных майнеров, в частности от компании BITMAIN, является тот факт, что сбой большого числа элементов не сильно отражается на сугубо внешних признаках работающего устройства. Поэтому простейшие методы контроля, например, по сетевой доступности или потреблению электроэнергии здесь не всегда подходят.
И также стоит отметить, что стандартные средства, применяемые во многих системах мониторинга для серверов, далеко не всегда применимы для майнинга. Нет особого смысла церемониться и выполнять бережную горячую перезагрузку через команду по сети, если речь идёт об устройствах, состоящих практически полностью из вычислительных модулей под управлением встроенной (Embedded) операционной системы. Проще, быстрее и надёжнее сразу выполнить холодную перезагрузку путём кратковременного снятия напряжения.
Пословицу «время — деньги» в данном случае нужно понимать в буквальном смысле.
Особый подход в RPCM Mining Edition
_________________________
Примечание. Так как каждая минута простоя в майнинге стоит денег, то читатель может сразу обратиться к следующему разделу «Как настроить мониторинг хешрейта», а к рассмотрению параметров вернуться после настройки.
_________________________
Для начала опишем кратко как это работает, а детали и нюансы будем раскрывать по мере ознакомления с данным механизмом.
RPCM можно настроить так, чтобы держать на постоянном контроле подключенные к нему майнеры. Если какой-то показатель перестаёт соответствовать заданному параметру, например, снижается хешрейт, то устройство будет перезагружено по питанию.
_________________________
Примечание. Хешрейт – единица измерения, позволяющая определить эффективную вычислительную мощность оборудования, задействованного в добыче криптовалюты.
_________________________
Основные настройки контроля для майнингового оборудования выполняются в разделе Автоматизация (Automation) web-интерфейса RPCM.
Рисунок 2. Внешний вид окна «Автоматизация» RPCM.
Ниже приводится краткая информация о подразделах на рисунке 2.
1. Номер вывода.
2. Общее описание.
3. Дата и время последней перезагрузки.
4. Подраздел "ПОТРЕБЛЕНИЕ" — информация о параметрах потребления.
5. Подраздел "ХЕШРЕЙТ" — информация о параметрах майнинговых устройств.
6. Подраздел "ПИНГ" — информация о доступности устройства по сети при тестировании через ping.
7. Подраздел "TCP ПОРТ" — информация о соответствующих сетевых ресурсах по указанному порту TCP.
8. Подраздел "СОСТОЯНИЕ МАЙНЕРА" — информации о специфических параметрах майнинга (на рисунке 2 показан не полностью, требуется прокрутка).
9. Активный элемент в виде "шестерёнки" для вызова всплывающего окна редактирования.
10. Подраздел "СПИСОК УСТРОЙСТВ" — перечень настроенных устройств по порядку добавления.
11. Активный элемент "ДОБАВИТЬ УСТРОЙСТВО" для вызова одноимённого всплывающего окна.
Рассмотрим более пристально разделы 5 — «ХЕШРЕЙТ» и 8 — «СОСТОЯНИЕ МАЙНЕРА».
Для удобства пользователя в разделе «ХЕШРЕЙТ» выводится краткая информация о результатах мониторинга:
Мониторинг — поле для индикации активности данной службы;
Тревога — в данном поле показывается, что вызвало причину для беспокойства, например, падение хешрейта ниже определённой величины;
Время последней тревоги — информация о дате и времени последнего тревожного события;
Автоперезагрузка инициирована в: — дата и время запуска принудительного рестарта устройства.
В разделе "СОСТОЯНИЕ МАЙНЕРА" показываются специфичные параметры для устройств от компании BITMAIN
Рисунок 3. Раздел СОСТОЯНИЕ МАЙНЕРА.
Выводится краткая информация о настройках мониторинга по параметрам майнинга.
Model — информация о заданной модели: Bitmain D3, Bitmain L3 или Bitmain S9;
Frequency — рабочая частота майнера;
Miner Count — количество плат (линеек) ASIC;
Total Hash Rate 5s, GHS — количество просчитанных хешей за указанный период;
Total Hash Rate AV, GHS — это усреднённое значение хешрейта.
Ниже идёт описание информации о состоянии линеек (плат) с установленными ASIC в конкретном майнере.
CHAIN# — номер планки (платы с ASIC);
ACN — количество ASIC на данной планке;
ACS — информация о состоянии каждого ASIC, символ "o" означает нормальное состояние, символ "х" — сбой в работе ASIC или его недоступность;
RATE — рейтинг работы данной планки или общий рейтинг всего устройства;
HW — hardware warnings, предупреждение об аппаратной проблеме.
_________________________
Примечание. Application Specific Integrated Circuit (ASIC) — переводится как «интегральная схема специального назначения» — это микросхема, специализированная для решения конкретной задачи, часто в виде однокристальной ЭВМ.
_________________________
Как настроить мониторинг хешрейта
Первоначально необходимо добавить устройство в систему мониторинга. Выполнить это можно при помощи экранного элемента "ДОБАВИТЬ УСТРОЙСТВО".
Откроется специальное окно, в котором нужно заполнить соответствующие поля.
Рисунок 4. Окно ввода нового устройства
По нажатию элемента управления СОХРАНИТЬ устройство подключается к системе мониторинга с указанными параметрами.
Соответственно, ЗАКРЫТЬ означает просто закрытие окна без сохранения изменений.
Если необходимо изменить заданные настройки, то нужно воспользоваться элементом редактирования в виде шестерёнки в правом верхнем углу раздела данного устройства (на рисунке 2 — под номером 9).
Рисунок 5. Окно редактирования с уже введёнными параметрами.
Точно так же элемент управления СОХРАНИТЬ записывает введённые параметры, и устройство контролируется системой мониторинга с новыми настройками.
Элемент ЗАКРЫТЬ — выход из окна редактирования без сохранения изменений.
Далее необходимо настроить оповещение по e-mail.
_________________________
Важное замечание. Если выйдет из строя одна из плат ASIC, то hashrate будет всегда ниже ожидаемого значения. В этом случае постоянные перезагрузки из-за низкой производительности могут оказать нежелательное воздействие на весь майнер. Правильное решение при этом (если майнер не снимать и не везти на ремонт сразу) — снизить ожидаемый hashrate до текущего стабильного значения.
_________________________
Настройка оповещения по e-mail
Практически все необходимые для этого инструменты находятся в разделе web-интерфейса "Конфигурация". Попасть в данный раздел можно, воспользовавшись соответствующим пунктом меню перехода.
Собственно, сама область настроек имеет две основные вкладки: "Настройки SMTP" и "Получатели сообщений".
Рисунок 6. Область настройки оповещение по e-mail, вкладка "Настройки SMTP".
Для ввода информации о получателях используется активный экранный элемент ДОБАВИТЬ, вызывающий окно добавления настроек.
Рисунок 7. Окно ввода настроек SMTP.
Доступны следующие поля для настройки:
• Сервер — сетевое имя (сокращённое или FQDN) или IP адрес;
• Порт — номер TCP-порта, на котором сервер ожидает соединения;
• HELO домен — доменное имя, которым сервер представляется при установке SMTP c сессии;
• Авторизация — параметр авторизации на SMTP сервере для отправки сообщений, доступны значения: PLAIN (передача пароля открытым текстом), LOGIN (AUTH LOGIN — способ SMTP-аутентификации, в котором логин и пароль передаются в виде текста, закодированного по алгоритму Base64) и CRAM MD5 (способ защиты данных аутентификации на основе алгоритма MD5);
• Состояние SSL — доступны 3 состояния: enable (позволяет создать зашифрованное SSL соединение прямо поверх обычного TCP-соединения и с проверкой сертификата на подлинность); disable (запрещено) и enable-dontverify-cert (зашифрованное соединение без проверки сертификата).
Во вкладке Получатели сообщений указывается один или несколько получателей e-mail с уведомлением от RPCM по электронной почте.
Доступны поля:
email — основной адрес получателя;
сс — адрес для отсылки копии;
bcc — адрес для отсылки скрытой копии.
Рисунок 8. Область управления SMTP, вкладка "Получатели сообщений".
Соответвенно, также для ввода информации о получателях используется активный экранный элемент ДОБАВИТЬ, вызывающий окно добавления получателя.
Рисунок 9. Всплывающее окно "Новый получатель".
Теперь, после настройки оповещения по e-mail можно быть уверенным в том, что в случае возникновения критического события (в данном случае — снижение хешрейта) владелец клиентского устройства будет вовремя оповещён о необходимости принять меры.
Заключение ко второй части
В этот раз мы познакомились с некоторыми возможностями удалённого управления майнинговыми средствами, а также со специальными функциями для контроля устройств от компании BITMAIN.
Надо отметить, что устройства управления питанием Resilient Power Control Module от компании RCNTEC не просто могут быть приспособлены для управления майнерами, они специально проектировались для этого и содержат в себе необходимый набор функций.
Теперь, по результатам настройки, нет нужны в ручном мониторинге — ваши ASIC'и будут работать с максимальной производительностью всё время.
В следующей части будет рассказано, как при помощи устройств RPCM контролировать средства для майнинга от других производителей, в том числе — самодельные сборки.
Получить более подробную информацию об устройстве и оформить заказ можно на сайте rpcm.pro.
Остались вопросы? - Пишите нам на info@rpcm.pro!
Чтобы быть в курсе наших новостей и ничего не пропустить, присоединяйтесь к нашим страницам в социальных сетях!
По вопросам информационного сотрудничества обращайтесь: pr@rcntec.com!
Пресс-служба ООО «АРСИЭНТЕК»