1. Vybereme, co se má hlídat
Začínáme od reality: co by vás bolelo, kdyby přestalo fungovat? U někoho je to homepage, u jiného objednávkový formulář, platební brána, API, certifikát nebo doména kampaně.
2. Nastavíme kontroly a pravidla
Kontroly mohou sledovat stavový kód, obsah odpovědi, rychlost, SSL expiraci, DNS záznamy nebo dostupnost konkrétní URL. Upozornění nastavíme tak, aby dávalo smysl: žádný hluk kvůli jedné vteřině, ale rychlá zpráva při skutečném problému.
3. Incident má kontext
Když přijde alert, obsahuje konkrétní informaci. Ne jen větu, že něco spadlo, ale i naměřený stav, čas, adresu a stručné vodítko, co ověřit dál.