- Du administrierst unsere Enterprise Checkmk-Umgebung und stellst Stabilität sowie Performance sicher.
- Du verwaltest Hosts, Services, Regeln, Ordner, Kontaktgruppen, Site-Konfigurationen sowie Alarmierungs-Schwellenwerte und Benachrichtigungsregeln.
- Du validierst die Host-/Service-Discovery und stellst die Konsistenz der Service-Checks sicher.
- Du entwickelst und pflegst eigene Checks und Agent-Plugins in Python oder Shell, um spezifische Kundenanforderungen, Schnittstellen oder nicht-standardisierte Applikationen an das Monitoring anzubinden.
- Du konzipierst und pflegst Dashboards, um einen klaren Überblick über Systemzustand, Verfügbarkeit und kritische Alarme zu gewährleisten.
- Du planst und setzt regelmäßige Checkmk-Upgrades, Patches, Agent-Updates und anschließende Validierungen inklusive optionaler Linux-OS-Wartung um.
- Du bearbeitest Service- und Incident-Tickets.
Als Senior IT Monitoring Engineer (m/w/d) übernimmst du weit mehr als nur den täglichen Betrieb:
- Du gestaltest aktiv die Weiterentwicklung unserer IT-Landschaft mit. Sowohl in technischer Hinsicht als auch durch die Optimierung von Arbeitsprozessen.
- Du bist eine zentrale Ansprechperson für die Professional- und Junior-System Engineers (m/w/d) im Team und förderst deren Entwicklung durch Coaching und Wissensaustausch.
- Du verantwortest das Design und die Skalierbarkeit unserer globalen Monitoring-Architektur und sorgst dafür, dass sie auch bei zukünftigem Wachstum hochverfügbar und performant bleibt.
- Du fungierst als Schnittstelle und Berater für andere Fachabteilungen, übersetzt deren Business-Anforderungen in messbare technische Metriken und schaffst mit zielgruppengerechten Dashboards maximale Transparenz.
- Du evaluierst kontinuierlich neue Technologien und Trends im Bereich Monitoring und Observability (z. B. AIOps, Cloud-Monitoring), um unsere Tools und Standards zukunftssicher aufzustellen.