SUCCESS STORIES
Implementace monitorovací a reportovací platformy
Realizace: CETIN, Česká telekomunikační infrastruktura, a.s.
Cíl projektu
Realizace projektu
- Synchronizace s CMDB (iTOP)
- Napojení na notifikační služby CETIN (email, SMS, VOIP)
- Bezvýpadková konfigurace monitoringu
- Notifikace problémů na základě uživatele, konfigurace pohotovostí a priority problémů
- Reporty monitoringu (počty notifikací a problémů, počet kritických chyb)
- Napojení na stávající systémy (Graylog, Grafana)
- Synchronizace kontaktů z Active Directory
- HA konfigurace a možnost škálování monitoringu
- Konfigurace relační databáze MySQL do replikačního módu
Monitoring jsme předali do produkce za 3 měsíce od zadání.
Bylo instalováno rozšíření Director, které umožnuje nahrání nebo úpravu konfigurace serverů a služeb přes REST API.
Byl vytvořen synchronizační proces, který na základě konfigurace (periodického spouštění) synchronizuje servery a služby z CMDB iTOP. Součástí procesu je synchronizace kontaktů a skupin z Active Directory. Adaptér je napojený na systém zajišťující pohotovosti pro výběr konkrétní osoby při nočních výpadcích.
Konfigurace notifikací Icinga2 byla upravena pro vyhodnocování jednotlivých notifikací. Na základě priority, denní doby a dalších parametrů může být skupině uživatelů odeslán email, případně poslána SMS, VOIP o vzniklém incidentu. Zároveň je zde pro možnost vytvoření tiketu do servis desku.
Pro ukládání informací ze sond (metrik) slouží databáze InfluxDB. Zákazník si data zobrazuje pomocí projektu Grafana, informace z logu získá skrze projekt GrayLog.
Reporty statistik (incidenty) byly vytvořeny v projektu JasperReport.
Výsledek projektu
Zákazník si veškeré instalované komponenty převzal do provozu a spravuje je sám. Zároveň má k dispozici zdrojové kódy a má možnost upravovat adaptéry na iTOP.
V našich kompetencích zůstal vývoj složitějších úprav komponent a konzultace nastavení systému.
V poslední fázi projektu proběhla realizace napojení všech systémů (IcingaWeb2, Grafana, GrayLog) na jednotné SSO (Kerberos).
Aktuálně systém monitoruje přes 1000 serverů a kolem 6000 služeb.