Проверка доступности
Для проверки доступности Апдейтера используется URL http://{hostname}:{port}/healthz
При успешном ответе возвращает код 200, любой другой код признак аварии
Метрики для мониторинга (с версии 2.5.6)
Метрики для настройки в сторонних системах мониторинга (prometheus+grafana). Доступны по URL http://{hostname}:{port}
/metrics
Метрика | Описание | Тэги |
---|---|---|
updater_version | Текущая версия приложения |
|
updater_task_errors | Все ошибки выполнения задач. Если ошибок нет, метрика отсутствует. |
|
updater_schedule_task_errors | Ошибки выполнения только задач, Если ошибок нет, метрика отсутствует. |
|
Ограничения
- фиксируются только ошибки выполнения задач, запущенных разово или через планировщик
- ошибки сериализации не фиксируются
Что делать при обнаружении ошибки
- Необходимо узнать текст ошибки, для этого вызываем эндпоинт
http://{hostname}:{port}/info/history?days=1
В ответе будет список задач за текущий день, находим задачи у которых "status" начинается с ERROR, после чего идёт описание ошибки, например:В данном случае понятно, что опечатались при вводе названия справочника — корректный справочник"status": "ERROR: ошибка при формировании справочника: cfg.GetTemplate: справочник factor_fitas не найден в конфигурации"
factor_fias
- Если по тексту ошибки не удалось установить причину ошибки и исправить, необходимо собрать последние журналы приложения, запросив их по URL
http://{hostname}:{port}/info/log
- Отправить собранный архив своему инженеру сопровождения с описанием проблемы
Overview
Content Tools