Große Cloud-Anbieter und ISPs bieten Service Level Agreements (SLAs) an, die die Betriebszeit garantieren und dazu beitragen, mit Unternehmen, die Wert auf Betriebszeit legen, einen Vertrag abzuschließen.
Dieselben Unternehmen verlangen von der IT-Abteilung oft die gleichen Garantien für die Leistung und Betriebszeit des internen Netzes, seiner vielen verschiedenen Verbindungen und sogar der Anwendungen.
Gleichzeitig muss die IT-Abteilung möglicherweise unzählige SLAs von allen möglichen Anbietern - einschließlich der bereits erwähnten ISPs und Cloud-Anbieter - verwalten. Denn was nützt ein SLA, wenn man nicht weiß, wann es verletzt wird? Wie können Sie einen Anbieter beurteilen, wenn Sie ihn nicht messen können?
SLAs sind wichtiger und alltäglicher geworden, seit COVID zu einer radikalen Dezentralisierung der IT geführt hat, was die Messung erschwert. "Diese neue COVID-bedingte Realität erhöht die Abhängigkeit eines Unternehmens von zuverlässigen Daten, um festzustellen, wie gut (oder schlecht) der Betrieb läuft", so David Borowski, Direktor bei der Unternehmens- und Technologieberatung West Monroe, gegenüber CIO.
Bei den meisten SLAs geht es um Leistung: wie schnell etwas funktioniert oder ob es überhaupt funktioniert. Anstatt sich darauf zu verlassen, dass der Anbieter seine eigene Leistung verfolgt und meldet, können Sie dies mit der Überwachung der Netzwerkleistung selbst tun. Sie können nicht nur die Leistung mit den SLA-Versprechen vergleichen, sondern auch eigene Schwellenwerte festlegen, die Leistung detailliert messen und Berichte über den aktuellen Zustand und den Verlauf der Leistung erstellen.
Die explosionsartige Zunahme von Anwendungen und die Wichtigkeit eines ständig aktiven Netzwerks brachten eine wachsende Fülle von SLAs mit sich. Der Erfolg der SLAs von Anbietern führte dazu, dass führende Unternehmen SLAs sowohl von Anbietern verlangten als auch für die IT-Abteilung selbst anwandten. Die IT-Abteilung wird nicht nur nach der Einhaltung von SLAs beurteilt, sondern sie ist auch oft Teil des Vergütungsplans.
Zu viele IT-Abteilungen akzeptieren SLAs gerne, verhandeln sogar deren Inhalte, haben aber keine Möglichkeit, die tatsächliche Einhaltung von SLAs zu messen. Glücklicherweise gibt es Tools, darunter Netzwerküberwachung, Leistungsüberwachung und Application Performance Monitoring (APM), die Unterstützung des SLA-Managements.
"Eine Veränderung, die wir allmählich beobachten, ist der verstärkte Einsatz von Daten- und Prozessermittlungstools zur Messung von SLAs", sagte Borowski von West Monroe gegenüber CIO. "Diese Tools sind zwar noch nicht weit verbreitet, bieten aber die Möglichkeit, die aussagekräftigsten Metriken zu ermitteln und die Leistung objektiv zu messen (z. B. Zykluszeit, Qualität, Compliance). Wenn sie vom Kunden zur Verfügung gestellt werden, entfällt auch die Abhängigkeit von den Tools der Anbieter als Wahrheitsquelle für Leistungsdaten."
Wenn Sie ein internes IT-SLA erstellen oder eines für einen Anbieter entwerfen, sollten Sie Ihre Anforderungen an Leistung, Sicherheit und Betriebszeit berücksichtigen. Wie viele 9s brauchen Sie für die Betriebszeit? Fünf 9er sind der Goldstandard (was etwa 26 Minuten Ausfallzeit pro Jahr bedeutet), aber ist das immer erreichbar? Vier 9er oder 99,99 % bedeuten hingegen 52 Minuten Ausfallzeit pro Jahr.
Gibt es Apps oder Dienste, bei denen selbst 99,999 % nicht ausreichen? Verlangen Sie in diesem Fall mehr, aber seien Sie bereit, für Hochverfügbarkeit oder Failover zu bezahlen. Hier sind drei Fragen, die sich die IT-Abteilung stellen sollte:
Die Kosten für Ausfallzeiten sind in jedem Unternehmen unterschiedlich und hängen davon ab, was tatsächlich ausfällt. In fast allen Fällen lassen die Kosten selbst einen stoischen CFO erschaudern. In einem Artikel von TechChannel heißt es: "Ausfallzeiten in Unternehmen sind heute teurer als je zuvor: Etwa 44 % der Unternehmen geben an, dass die stündlichen Ausfallkosten zwischen 1 und 5 Millionen US-Dollar liegen, ohne Berücksichtigung von Rechtskosten, Geldstrafen oder Bußgeldern", heißt es auf der Website.
"Darüber hinaus gaben 91 % der Unternehmen an, dass eine einzige Stunde Ausfallzeit, in der geschäftskritische Server-Hardware und -Anwendungen offline sind, aufgrund von Geschäftsausfällen, Produktivitätsunterbrechungen und Abhilfemaßnahmen durchschnittlich mehr als 300.000 US-Dollar kostet. Dagegen schätzt nur 1 % der Unternehmen - hauptsächlich sehr kleine Unternehmen mit 50 oder weniger Mitarbeitern -, dass stündliche Ausfallzeiten weniger als 100.000 US-Dollar kosten."
Die IT-Abteilung kann viele der Probleme kontrollieren, die zu Ausfallzeiten oder Leistungsstörungen führen. Hochverfügbarkeit kann erreicht werden, indem Fehler von Endbenutzern erkannt und behoben werden und dasselbe bei Malware-Angriffen geschieht. Der Schlüssel zu beidem ist die vollständige Netzwerktransparenz durch Netzwerküberwachung.
Ihr Netzwerk am Laufen zu halten - und zwar gut - ist zeitaufwändig. Eine Netzwerküberwachungslösung mit vollständiger Transparenz, Problemerkennung, Warnmeldungen, Ursachenanalyse und einem gewissen Grad an Automatisierung reduziert den Zeitaufwand für die Wartung des Netzwerks und die Behebung von Problemen erheblich.
Die meisten IT-Teams kennen die gefürchteten intermittierenden Leistungsprobleme, die durch ein Netzwerkproblem verursacht werden und sich negativ auf die effiziente Nutzung von Geschäftsanwendungen auswirken. In manchen Fällen verbringen IT-Teams Wochen oder sogar Monate damit, diese schwer fassbaren Probleme zu identifizieren und zu beheben. Wäre es nicht schön, wenn man das Raum-Zeit-Kontinuum unterbrechen und ein Wurmloch schaffen könnte, um in der Zeit zurück und vorwärts zu reisen? Stellen Sie sich vor, Sie könnten unbegrenzte Ressourcen einsetzen, um mit Ihrer Arbeitslast Schritt zu halten.
Eine Möglichkeit, sich den Tag zu vertreiben, ist eine kostengünstige Alternative in Form von Unified Infrastructure Monitoring (UIM). Eine UIM-Lösung kann wertvolle IT-Zeit einsparen, die für viele manuelle und sich wiederholende IT-Aufgaben aufgewendet wird. Ganz zu schweigen von der Zeit, die IT-Teams mit der Suche und Behebung von Leistungsproblemen verbringen.
Mit einem UIM erhält die IT-Abteilung Einblick in die Anwendungs-, Server-, Netzwerk- und Speicherleistung. Dies reduziert Ihre MTTR (Mean Time to Resolution) drastisch, trägt zur Einhaltung von SLAs bei und bietet eine großartige Benutzererfahrung.
Möchten Sie erfahren, wie ein UIM wie WhatsUp Gold Probleme mit der Netzwerkleistung schnell löst? Lesen Sie unserem Blog-Beitrag So erfüllen Sie Ihr SLA und erhalten 30 Minuten am Tag zurück (EN) .
Get our latest blog posts delivered in a weekly email.