Удаленный мониторинг служб
От: CyberRussia  
Дата: 20.07.17 15:18
Оценка: 7 (1)
Добрый день!

Имеется приложение написанное на net/C# и состоящие из несколько WCF и windows сервисов. Поставлена задача удаленного мониторинга работы приложения: факт работы каждого сервиса, количество обращений (за некоторую единицу времени), время обработки обращения, количество ошибок (в дальнейшем видимо с детализацией каких именно). Скорее всего список задач мониторинга будет расширяться.
Само приложение работает на удаленных серверах и административного доступа к нему нет. Но по организационной договоренности там проводят обновление версий приложения, возможно могут доустановить еще какое-либо приложение (хотя не факт).
Приложение высоконагруженное.
Возникает вопрос: как решить поставленную задачу. Сразу оговорюсь, что в мониторинге я не разбираюсь и для меня это совершенно новая область.
Первое, что выдал гугл — windows communication foundation. Сразу возникло множество вопросов: можно ли сравнительно простыми путями формировать сообщения самостоятельно, как настроить для отправки отчетов удаленно, кто будет выступать получателем сообщений, учитывая, что приложение высоконагруженное и задерживать службы длительными отправками неприемлимо.
Второе, порекомендовали посмотреть в сторону prometheus и формированием метрик. Взял https://github.com/andrasm/prometheus-net . Само с собой вроде работает, но prometheus установленный в рабочей сети метрик на моей машине не видит. Местный систадмин хотя prometheus и хвалит, но в его настройках разбирается слабо и объяснить причину не может. Попробовал локально запустить wmi exporter. Его prometheus видит, но в нем нет метрик формируемых тестовым приложением и как их туда поместить непонятно. Кроме того не вполне понятно, как в метриках передавать такие данные как время обработки обращения и/или причины ошибки.

Собственно вопрос. Что и как посоветуете использовать? Пожалуйста, не просто название, а с объяснением или ссылками на статьи с подробным разбором и примерами. Если что-то из вышеизложенного, то подсказать как решить возникшие проблемы.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.