Проверка доступности
Для проверки доступности Апдейтера используется URL http://{hostname}:{port}/healthz
При успешном ответе возвращает код 200, любой другой код признак аварии
Метрики для мониторинга (с версии 2.5.6)
Метрики для настройки в сторонних системах мониторинга (prometheus+grafana). Доступны по URL http://{hostname}:{port}
/metrics
Метрика | Описание | Тэги |
---|
updater_version | Текущая версия приложения | |
---|
updater_task_errors | Все ошибки выполнения задач | - task - тип задачи
- dict - название справочника
- node - тэг ноды (сервера)
|
---|
updater_schedule_task_errors | Ошибки выполнения только задач, запущенных планировщиком по заданному расписанию | - scheduleId - идентификатор задачи планировщика
- task - тип задачи
- dict - название справочника
- node - тэг ноды (сервера)
|
---|
Что делать при обнаружении ошибки
- Необходимо узнать текст ошибки, для этого вызываем эндпоинт
http://{hostname}:{port}/info/history?days=1
В ответе будет список задач за текущий день, находим задачи у которых "status" начинается с ERROR, после чего идёт описание ошибки, например:
"status": "ERROR: ошибка при формировании справочника: cfg.GetTemplate: справочник factor_fitas не найден в конфигурации" |
В данном случае понятно, что опечатались при вводе названия справочника — корректный справочник factor_fias
- Если по тексту ошибки не удалось установить причину ошибки и исправить, необходимой собрать последние журналы приложения, запросив их по URL
http://{hostname}:{port}/info/log
- Отправить собранный архив своему инженеру сопровождения с описанием проблемы