Мониторинг состояния в MatrixUI
Мониторинг состояния — это ключевая функция эксплуатации и обслуживания, предоставляемая YMatrix.
Она выполняет проактивный контроль работоспособности кластера базы данных с помощью предопределённых проверок.
Система заранее выявляет потенциальные проблемы и своевременно уведомляет администраторов для обеспечения стабильности.
Эта функция предназначена в первую очередь для администраторов баз данных и разработчиков.
Она поддерживает многомерные проверки, включая мониторинг доступности кластера, обнаружение тайм-аутов запросов и транзакций и оповещения о превышении времени ожидания блокировок.
Ключевые преимущества мониторинга состояния:
- Проактивные оповещения: выявление рисков до возникновения сбоев вместо реактивного устранения последствий.
- Автоматизированные уведомления: отправка оповещений в реальном времени по электронной почте или другим каналам.
- История событий: ведение журнала всех сработавших правил для последующего анализа инцидентов и выявления первопричин.
- Гибкая настройка: возможность адаптировать параметры проверок и политики мониторинга под требования бизнеса.
Доступ к странице
Путь навигации
- Войдите в интерфейс управления MatrixUI
Откройте в браузере следующий адрес (IP-адрес по умолчанию — это IP-адрес управляющего узла Master): http://<IP>:8240
- В левой панели навигации выберите Health Monitoring.
- По умолчанию открывается вкладка Check Configuration.
Структура страницы
Страница мониторинга состояния состоит из следующих разделов:
- Check List Area: отображает все предопределённые проверки состояния.
- Configuration Action Area: содержит кнопки для включения/отключения или редактирования проверок.
- Event History Area: сохраняет журнал всех сработавших оповещений.
Управление предопределёнными проверками
Категории проверок
| Check Category |
Specific Check Item |
Monitoring Dimension |
Default Status |
| Disk Monitoring |
Disk space will be exhausted within 7 days |
Disk Space |
Enabled |
| Disk Monitoring |
Disk space below 20% |
Disk Space |
Enabled |
| Disk Monitoring |
Abnormal disk growth detected within 1 day |
Disk Space |
Enabled |
| Disk Monitoring |
Disk full |
Disk Space |
Enabled |
| Disk Monitoring |
Database set to read-only when disk usage exceeds threshold |
Disk Space |
Disabled |
| Cluster Monitoring |
Cluster unavailable |
Cluster Status |
Enabled |
| Transaction Monitoring |
Long-running uncommitted transaction |
Transaction Status |
Enabled |
| Lock Monitoring |
Lock wait timeout |
Lock Status |
Enabled |
Настройка проверок
Включение или отключение проверки
- Найдите нужную проверку в списке.
- Щёлкните переключатель справа от элемента (зелёный — включено, серый — отключено).
- Система немедленно применяет изменение статуса.

Редактирование параметров проверки
- Найдите нужную проверку в списке.
- Нажмите кнопку Edit справа.
- В диалоговом окне настройте следующие параметры:
- Alert Level: задаёт серьёзность события.
- Parameter Configuration: определяет условие срабатывания проверки (например, порог использования дискового пространства).
- Check Interval: задаёт частоту автоматического запуска проверки (например, раз в 1 час).
- Нажмите Save, чтобы немедленно применить изменения.

Настройка интервалов проверок
- Интервалы указываются в часах (например, «1h» означает один раз в час).
- У некоторых проверок отсутствует настройка интервала: они срабатывают реактивно при обновлении зависимых данных.
- После изменения и сохранения интервала система отменяет предыдущую запланированную задачу, немедленно выполняет проверку и запускает новый цикл согласно новому интервалу.

Подробное описание проверок дискового пространства (нововведение в v6.7.1)
Автоматический режим «только для чтения» при нехватке места на диске
Описание функции: начиная с MatrixUI v6.7.1, новое правило автоматически переводит базу данных в режим «только для чтения», если использование диска превышает заданный порог. Это предотвращает дальнейшие операции записи, которые могут полностью исчерпать дисковое пространство.
Статус по умолчанию: правило отключено и требует ручного включения.
Настройка правила «только для чтения»
- Перейдите на вкладку Check Configuration в разделе Health Monitoring.
- В категории Disk найдите соответствующую проверку.
- Нажмите Edit и настройте следующее:
- Parameter Configuration: укажите порог использования диска (например, 90%).
- Включите проверку и сохраните конфигурацию.


Настройка оповещений
Настройка email-уведомлений
- На странице Health Monitoring найдите раздел Notification Configuration.
- Нажмите Configure Email, чтобы открыть диалог настройки email.
- Укажите следующие данные:
- Адрес SMTP-сервера
- Номер порта SMTP
- Адрес отправителя
- Пароль отправителя
- Адреса получателей (можно указать несколько)
- Нажмите Test Send, чтобы проверить конфигурацию.
- Нажмите Save, чтобы завершить настройку.
Формат оповещения
При срабатывании правила система отправляет email-оповещение, содержащее:
- Описание события
- Время срабатывания
- Затронутую область
- Рекомендуемые действия

Просмотр и анализ истории событий
Просмотр истории
- Перейдите на вкладку Event History в разделе Health Monitoring.
- События отображаются в обратном хронологическом порядке по умолчанию.
- Можно фильтровать события по:
- Типу события
- Временному диапазону
- Уровню оповещения
Просмотр деталей события
- Найдите нужное событие в списке.
- Нажмите кнопку Details справа.
- В диалоговом окне отображаются:
- ID события
- Время срабатывания
- Описание события
- Затронутые объекты
- Статус решения
Распространённые вопросы и решения
-
Как восстановить работу после срабатывания правила «только для чтения»?
После активации правила выполните следующие действия:
a. Освободите место на диске: удалите ненужные файлы журналов, временные файлы и т.п.
b. Временно отключите правило: нажмите Disable Rule and Restore в баннере оповещения, чтобы временно обойти правило.

-
Как проверить корректность работы мониторинга состояния?
Проверьте функциональность следующим образом:
a. Имитируйте нехватку места на диске: создайте большие файлы, чтобы достичь порогового значения.
b. Имитируйте долгую транзакцию: запустите транзакцию и не завершайте её в течение длительного времени.
c. Проверьте оповещения: убедитесь, что соответствующие email-уведомления получены.
Рекомендации
Рекомендации по настройке проверок
- Мониторинг диска: обязательно включите проверки «Disk space below 20%» и «Disk space will be exhausted within 7 days».
- Мониторинг транзакций: устанавливайте порог длительных транзакций в соответствии с бизнес-требованиями; рекомендуется ≤ 30 минут.
- Мониторинг блокировок: настраивайте тайм-аут ожидания блокировки с учётом уровня параллелизма; рекомендуется ≤ 5 минут.
Рекомендации по настройке уведомлений
- Получатели: укажите как минимум два email-адреса, чтобы избежать пропуска оповещений.
- Частота уведомлений: для часто срабатывающих правил установите период охлаждения (например, один раз в час).
- Тестирование: всегда выполняйте тестовую отправку после первоначальной настройки, чтобы убедиться в доставке.
Рекомендации по регулярному обслуживанию
- Регулярный обзор: проверяйте историю событий еженедельно для выявления и устранения скрытых проблем.
- Настройка параметров: периодически корректируйте параметры проверок с учётом роста бизнеса и изменений нагрузки на систему.