IT monitoring: наблюдаю одно и то же
May. 22nd, 2024 02:10 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Достаточно долго работаю в различных компаниях и почти во всех - за редчайшим исключением - наблюдаю одно и тоже:
И ещё, в купе с этими же алертами - желательно, чтоб оно было со ссылкой на документацию. Иначе каждый раз происходит квест - разберись в сервисе, чтобы найти источник проблемы и решить его.
Как со всем этим быть? Имхо, в проектировании закладывать мониторинг, бекапы, восстановление сервисов, почти также, как мы и сейчас это закладываем, например, при использовании LDAP вместо локальной авторизации.
P.S. по большому счёту, это надо куда-то в аналоги ansible прикрутить и ставить хост уже с поддержкой всего полезного.
- ставится мониторинг
- включаются к нему алерты
- по алертам движуха, ака внимание, каждый(!) день
И ещё, в купе с этими же алертами - желательно, чтоб оно было со ссылкой на документацию. Иначе каждый раз происходит квест - разберись в сервисе, чтобы найти источник проблемы и решить его.
Как со всем этим быть? Имхо, в проектировании закладывать мониторинг, бекапы, восстановление сервисов, почти также, как мы и сейчас это закладываем, например, при использовании LDAP вместо локальной авторизации.
P.S. по большому счёту, это надо куда-то в аналоги ansible прикрутить и ставить хост уже с поддержкой всего полезного.