Breadcrumbs

Мониторинг

В данном разделе размещается ссылка на приложение мониторинга инфраструктурных узлов. 

Мониторинг осуществляется при помощи взаимодействия следующих инструментов:

  • Telegraf – open source агент. Используется для сбора метрик и данных из системы

  • InfluxDB – свободно распространяемая TSDB база данных (time series database). Все данные, собранные Telegraf, передаются в InfluxDB

  • Grafana – инструмент по графическому отображению метрик, совместимый с базой данных InfluxDB. Предназначен для создания панелей индикаторов (дашбордов), отображающих определенные показатели в течение установленного периода времени

При первом переходе в раздел «Статистика» выполняется переход на страницу авторизации в Grafana.

Обратитесь к вашему Администратору, чтобы получить логин и пароль для входа в личный кабинет Grafana.

photo_5422764423497497590_y.jfif
Экран входа в систему мониторинга

Для просмотра собираемых метрик выполните следующие действия:

  • Нажмите кнопку «Dashboards» для вызова меню

  • Выберите пункт «Browse» для перехода к списку панелей

  • Нажмите на название нужной панели


159.png
Вызов меню для перехода к списку панелей

По умолчанию предлагается три набора дашбордов:

Мониторинг по инфраструктуре

Предназначен для мониторинга в рамках настраиваемых инфраструктурных единиц: областей, регионов, зданий, групп и т. п.

450.png
Дашборд «Service Dashboard Server»

Набор включает следующие дашборды:

  • Server: region cluster – мониторинг параметров сервиса Mediaserver: версионность, загрузка процессора, памяти, статистика по сокетам

  • Common indicators – cтатистика по трафику на медиасерверах (общая и по каждому медиасерверу)

  • Service Dashboard Server – статистика по камерам, стримам, пользователям, трафику, просматривающим

  • 3 days storage usage forecast – трехдневный прогноз заполняемости дисков

  • Disks health – мониторинг ошибок по дискам (HDD и SSD)

  • System dashboard: region cluster – мониторинг серверных метрик (память, процессы, сеть, диски и т. д.)

Alerts

Содержит дашборды мониторинга и Alert rules, настроенные на отклонение от допустимых показателей.

451.png
Дашборд «Close Wait alerts»
  • Close Wait alerts – мониторинг параметра close_wait для всех медиасерверов, а также алерты в случае превышения допустимого значения

  • Disk Usage alerting – мониторинг заполняемости дисков, а также алерты в случае превышения допустимого значения

  • Service state & input traffic – мониторинг входящего трафика на сервер, а также алерты в случае понижения ниже определенного значения

Monitoring

Содержит дашборды для мониторинга различных показателей работы и состояния сервисов на инсталяции Production.

452.png
Дашборд «System dashboard»
  • DHCP – мониторинг состояния сервиса DHCP и статистики его работы

  • NS_APP Monitoring – мониторинг загрузки процессора и памяти наиболее ресурсоемкими процессами

  • Percona cluster – мониторинг состсояния кластера percona (кластер из трех нод DB), а также алерты при недоступности отдельных нод

  • Supervisor processes monitoring – мониторинг состояния процессов, запущенных через supervisor на двух App-серверах

  • System dashboard – мониторинг серверных метрик (память, процессы, сеть, диски и т. д.)