Wenn die WLAN-Verbindung eines Mitarbeitenden nicht funktioniert oder der Rechner abstürzt, ist eine schnelle Lösung gefragt, um den reibungslosen Betrieb im Unternehmen aufrechtzuerhalten. Dafür gibt es das Incident Management. In diesem Artikel erfahren Sie, wie Sie IT-Störungen effizient beheben und warum es wichtig ist, den Prozess des Incident Managements im Unternehmen zu etablieren. Außerdem erklären wir die Vorteile, die sich ergeben, wenn Sie die Betreuung des IT-Störungsmanagements an einen externen Dienstleister auslagern.
KOSTENLOSER LEITFADEN
So finden Sie den passenden IT-Dienstleister
Sie möchten mehr darüber erfahren, wie Sie den richtigen Service-Provider auswählen? Dann laden Sie sich jetzt unseren Leitfaden „So finden Sie den passenden IT-Dienstleister“ herunter.
Inhalt dieses Blogbeitrags
Schön, dass Sie hier sind! Wie Ihnen vielleicht schon aufgefallen ist, verwenden wir aus Gründen der Lesbarkeit in erster Linie die männliche Form in unseren Texten. Im Sinne der Gleichbehandlung meinen wir damit selbstverständlich immer alle Geschlechter (m/w/d). Und jetzt wünschen wir Ihnen viel Spaß beim Lesen.
Was ist Incident Management?
Das Incident Management, auch IT-Störungsmanagement genannt, ist die Gesamtheit aller Reaktionen auf einen erkannten oder vermuteten IT-Incident. Dabei handelt es sich um Störfälle, die die IT-Infrastruktur oder einzelne IT-Bereiche angreifen und so den Geschäftsbetrieb eines Unternehmens gefährden. Das Ziel des Incident Managements besteht darin, den Betrieb mit den richtigen Maßnahmen aufrechtzuerhalten bzw. schnellstmöglich wiederherzustellen.
Laut ITIL (Information Technology Infrastructure Library), einem Best-Practice-Framework für ein effektives IT-Service-Management, ist das Incident Management Teil der Service-Operation-Phase. Diese bildet die vierte von fünf Phasen im ITIL-Framework.
Gut zu wissen: Der IT-Incident unterscheidet sich vom enger gefassten Security Incident Response. Letzterer stellt eine Bedrohung für die Computersicherheit dar, zum Beispiel bei einer Malware-Infektion oder einem Richtlinienverstoß. Klassische Incidents hingegen sind E-Mail-Serviceprobleme, Computerabstürze, WLAN-Verbindungsprobleme oder defekte Drucker.
Ein klar definiertes Incident Management ist für Unternehmen sehr wichtig. Denn je länger IT-Störungen einen reibungslosen Betrieb behindern oder ihn gar lahmlegen, desto kostspieliger wird es.
Das sind die Vorteile
Ein gutes Incident Management hält den Betrieb aufrecht, wirkt sich positiv auf die Produktivität Ihres Unternehmens aus und erhöht die Kundenzufriedenheit. Wie Sie sonst noch profitieren, verraten wir Ihnen in den Top-7-Vorteilen, die Ihnen das Incident Management bietet.
1. Effizient und produktiv
Wenn Sie Methoden und Prozesse als Reaktion auf Incidents etablieren, erhöhen Sie Ihre Effizienz und die Produktivität. Mithilfe von Portalen – um besonders schwere Störfälle zu beheben – und der Zuweisung von Incidents zu einzelnen Lösungsteams können Sie in kritischen Situationen schneller und zielgerichteter reagieren.
2. Sichtbar und transparent
Können Ihre Mitarbeitenden eine Störung mobil oder per Internet beim IT-Support melden, sorgt das für mehr Sicherheit und Transparenz. Incidents werden schneller erfasst und der Status ist für den jeweiligen Nutzer jederzeit einsehbar.
3. Priorisieren und managen
Mit dem Incident Management können Ihre IT-Experten Meldungen zu Störungen priorisieren. Über eine zentrale Plattform arbeiten sie vernetzt zusammen, um die verschiedenen Aufgaben besser zu managen. Machine Learning und Datenmodelle unterstützen die Prozesse, zum Beispiel bei der Kategorisierung von Incidents.
4. Service verbessern
Per Software protokollieren Sie alle Incidents, die Bearbeitungszeiten sowie die Schwere eines Störfalls. So haben Sie eine perfekte Grundlage, um die Gesamtheit aller Incidents zu analysieren und die besonders häufig auftretenden unter ihnen zu identifizieren.
5. Incidents verhindern
Mit dem Wissen über Ihre Incidents können Sie präventive Maßnahmen und notwendige Reaktionen auf einen bekannten Incident planen und umsetzen. Die Zahl der Incidents reduzieren Sie zusätzlich mit Serviceportalen, die den Mitarbeitenden offenstehen. Denn manch ein technisches Problem können diese mit den richtigen Informationen auch allein lösen. Das entlastet die IT-Abteilung, die sich auf die priorisierten Tickets konzentrieren kann.
6. Mittlere Reparaturzeit reduzieren
Wenn Sie die Prozesse und Lösungen zu Ihren Incidents dokumentieren, reduzieren Sie die MTTR (Mean Time To Repair, dt. mittlere Reparaturzeit). Denn Ihr Team lernt, mit gleichen oder ähnlichen Fällen umzugehen und sie zu lösen. Im besten Fall sinkt die Ausfallzeit auf ein Minimum.
7. Kunden- und Mitarbeiterzufriedenheit erhöhen
Ein gutes Incident Management steigert die Zufriedenheit der Mitarbeitenden. Und das wiederum hat einen positiven Einfluss auf die Kundenzufriedenheit. Denn Incidents können den Betrieb erheblich stören und so die Mitarbeitenden ablenken; für die Kunden bleibt dann weniger Aufmerksamkeit. Außerdem beeinträchtigen Incidents auch die Qualität Ihres Produktes. Ein gutes IT-Störungsmanagement beugt hier vor.
So funktioniert Incident Management
Ein strukturierter Prozess bildet die Basis für den Erfolg Ihres Incident Managements. Typischerweise handelt es sich um eine Abfolge von fünf Arbeitsschritten, die sich in der Praxis bewährt haben. Wir stellen sie Ihnen vor und erklären, warum sie wichtig sind.
1. Identifizieren
Zu Beginn des Incident Managements steht die Erfassung der IT-Störung. Der Nutzer gibt die Informationen zu seinem Incident über ein Self-Service-Portal oder Meldesystem in der Regel selbst ein. Diese Kanäle sind die Voraussetzung dafür, dass die Mitarbeitenden ihr Anliegen unkompliziert melden können. Die Eingabe erfolgt über eine Formularvorlage. Der IT-Service kann dann schnellstmöglich auf die Meldung reagieren.
2. Klassifizieren
Ordnen Sie die IT-Störungen als Nächstes in Kategorien ein. So können Sie die Tickets den jeweiligen Experten oder Experten-Gruppen innerhalb Ihres IT-Teams zuweisen. Die Zuständigkeiten müssen klar definiert sein. Dadurch werden Incidents effektiver bearbeitet. Denn nicht alle Teammitglieder verfügen über das jeweils gefragte Fachwissen und die Erfahrung zu bestimmten Störungen. Eine Klassifikation beugt diesem Problem vor.
3. Priorisieren
Beurteilen Sie nun die Wichtigkeit des neuen Incidents. Dabei ist entscheidend, in welchem Maß die Behebung der Störung relevant ist, um den Betrieb aufrechtzuerhalten. Klar ist: Geschäftskritische Probleme haben höchste Priorität. Sind von einem Incident Service-Leistungen für Ihre Kunden beeinträchtigt, sollten Sie für eine Priorisierung das Service-Level-Agreement (SLA) hinzuziehen. In ihm sind die Ziele und Dienstleistungen, die es dem Kunden gegenüber zu erfüllen gilt, festgehalten.
4. Untersuchen und beurteilen
Nachdem ein Incident erfasst und klassifiziert wurde, führen die zuständigen Mitarbeitenden Ihres IT-Teams eine Erstanalyse durch. Sie ist die Basis für den Lösungsvorschlag, die der Störungsmelder erhält. Besteht der Incident danach weiterhin, befassen sich die Experten auf den höheren Ebenen des Teams detailliert mit ihm – solange, bis eine Lösung gefunden ist.
5. Beheben und Schließen
Die genannten Schritte helfen dabei, einen Incident so schnell als möglich zu lösen. Für einen effizienten Gesamtprozess ist aber ebenso wichtig, direkt zu kommunizieren, dass ein Incident behoben wurde. Das geschieht entweder durch das Team oder der Benutzer erhält eine automatisierte Meldung über das Self-Service-Portal. Danach wird das Ticket geschlossen. Der Betrieb läuft reibungslos weiter und das IT-Team kann seine Kapazitäten weiter planen.
Incident Management und Security Incident Response
Der Security Incident Response ist ein spezifischer Prozess innerhalb des Incident Managements. Im Gegensatz zum allgemeinen IT-Störungsfall bezeichnet der Security Incident ein enger gefasstes Sicherheitsrisiko. Die Bandbreite an Security Incidents ist groß: Sie reicht von der gezielten Infektion eines Systems durch Malware bis hin zu einem Mitarbeitenden, der sich auf unsicheren Websites aufhält und so eine Sicherheitsgefahr darstellt. Tritt ein Security Incident ein, greift der Security Incident Response. Die für den Prozess zuständigen Personen definieren und realisieren die Maßnahmen, die jetzt notwendig sind, um die IT-Sicherheit wiederherzustellen.
Die 4 Phasen des Security Incident Response
Ein erfolgreicher Security Incident Response setzt sich aus vier Phasen zusammen, die allesamt zu einem optimalen Prozess beitragen.
1. Vorbereiten
Die erste Phase dient der Bestandsaufnahme von Risiken für Ihre IT-Infrastruktur sowie der Planung möglicher Maßnahmen. Wo gibt es Gefahrenstellen? Mit welchen Strategien und Aktivitäten können Sie Security Incidents entgegenwirken bzw. beheben? Technische Maßnahmen sind zum Beispiel das Implementieren von Analysetools und das Patch Management. Auf organisatorischer Ebene gilt es, die Kriterien zu definieren, anhand derer Sie Sicherheits-Incidents priorisieren. Außerdem gilt es, ein Incident-Response-Team einzurichten und dieses regelmäßig zu schulen.
2. Identifizieren und analysieren
In der zweiten Phase etablieren Sie Systeme, mit denen Sie Security Incidents mit hoher Priorität überwachen, identifizieren, priorisieren und analysieren. Das Ziel: Die Auswirkungen eines Sicherheits-Incidents so gering wie möglich zu halten. In der Praxis bewährt hat sich eine Kombination von manueller Überprüfung und Sicherheitstools, mit deren Hilfe Sie Security-Prozesse automatisieren.
3. Mindern, beseitigen und wiederherstellen
Jetzt geht es darum, einen bestehenden Sicherheits-Incident mit konkreten Maßnahmen zu beheben. Zum Beispiel bei einem Malware-Vorfall: Der befallene Server wird vom Netz genommen, Sicherheitsadministratoren entfernen die Malware und prüfen, ob weitere Stellen im System betroffen sind. Anschließend setzen die IT-Experten das System in den Zustand vor dem Vorfall zurück; der normale Betrieb kann wieder aufgenommen werden.
4. Ableiten und optimieren
In der letzten Phase steht die Analyse des Incidents im Fokus: Wie und warum ist es zu ihm gekommen? Wie können Sie gleiche oder ähnliche Vorfälle durch Prävention in Zukunft vermeiden? Wie lässt sich der gesamte Security-Incident-Response-Prozess optimieren? Wichtig: Anpassungen müssen immer im Rahmen der Compliance-Vorschriften geschehen. Und: Wie beim Incident Management sind auch beim Security Incident Response alle Schritte gleichermaßen relevant, um ein funktionierendes IT-System zu gewährleisten. Widerstehen Sie deshalb der Versuchung, den Prozess abkürzen zu wollen und Schritte zu überspringen.
5 Rollen
Ein professionelles Incident Management benötigt eine klar definierte Rollenverteilung. Die verschiedenen Personen kommen jeweils auf unterschiedlichen Eskalationsstufen zum Einsatz, bis die Störung behoben ist.
Incident Manager/Prozess-Verantwortlicher
Der Incident Manager ist für die effektive Durchführung des gesamten Prozesses verantwortlich. Er berichtet über das Incident Management an die Geschäftsleitung und nimmt sich insbesondere derjenigen Incidents an, die nicht innerhalb der drei regulären Service Levels gelöst werden konnten.
1st-Level-Support
Mitarbeitende im 1st-Level-Support registrieren eine eingehende Störungsmeldung, kategorisieren sie und nehmen einen ersten direkten Lösungsversuch vor. Das Ziel: den Betriebszustand eines Services unmittelbar wiederherzustellen. Falls dies nicht gelingt, leitet der 1st-Level-Support den Incident an die entsprechenden Experten des 2nd-Level-Supports weiter.
2nd-Level-Support
Die Mitarbeitenden im 2nd-Level-Support übernehmen die ungelösten Störungsmeldungen des 1st-Level-Supports. Das Ziel ist es auch hier, den Betriebszustand eines Services unmittelbar wiederherzustellen. Gelingt es auch dem 2nd-Level-Support nicht, die Störung zu beheben, leitet er die Meldung an den 3rd-Level-Support weiter.
3rd-Level-Support
Der 3rd Level Support übernimmt die weitergeleiteten Störungen des 2nd-Level-Supports. Er kann auch bei einem Hersteller von Hardware- oder Softwareprodukten angesiedelt sein.
Major Incident Team
Major Incidents rufen schwerwiegende Unterbrechungen im Geschäftsbetrieb hervor und müssen deswegen mit höchster Priorität gelöst werden. Für diesen Typ von Störungen ist das Major Incident Team zuständig, ein dynamisch gegründetes Team aus IT-Managern und technischen Experten. Geleitet wird die Gruppe in der Regel durch den anfangs erwähnten Incident Manager. Gemeinsam erarbeiten sie eine Lösung für den schwerwiegenden Incident.
Best Practices für ein erfolgreiches Incident Management
Erreichbarkeit, Kommunikation, Automatisierung, Standardlösungen, Motivation, Outsourcing – das sind unsere Tipps für ein erfolgreiches Incident Management.
Einfach erreichbar
Mitarbeitende können den IT-Support nur dann effizient nutzen, wenn die bereitgestellten Serviceleistungen bekannt sind. Und: Wenn das IT-Team jederzeit so einfach wie möglich erreichbar ist. Machen Sie deswegen auf die Unterstützung durch Ihr IT-Team im Unternehmen aufmerksam – per E-Mail oder, wenn vorhanden, durch eine interne App.
Stellen Sie außerdem so viele Kanäle wie möglich zur Verfügung, über die Ihre Mitarbeitenden mit dem IT-Team in Kontakt treten können – online, per Telefon oder via Zugang zu einem Self-Service-Portal. Zusammengefasst: Je einfacher die Kommunikation zwischen den beteiligten Akteuren, desto effizienter das Incident Management.
Effektiv kommunizieren
Effektive Kommunikation sollte nicht nur einfach, sondern auch schnell vonstattengehen. Geben Sie dem Urheber eines IT-Tickets deshalb direkt eine Rückmeldung, dass Sie seine Meldung gelesen haben, halten Sie ihn über den Bearbeitungsfortschritt auf dem Laufenden und informieren Sie ihn unmittelbar, wenn das Problem gelöst wurde. Das erhöht die Mitarbeiterzufriedenheit und verbessert den Betriebsablauf.
Sinnvoll automatisieren
Ein hoher Automatisierungsgrad entlastet das IT-Team. Automatisieren Sie deshalb dort, wo es sinnvoll ist. Das betrifft zum Beispiel die Benachrichtigungen zum aktuellen Status eines IT-Tickets oder wenn ein Incident behoben wurde. Die Meldung wird hier automatisch per E-Mail an den Mitarbeitenden gesendet. Das ist nur einer von vielen Prozessen, bei dem automatisierte Vorgänge mehr Kapazitäten für jene Aufgaben schaffen, bei denen eine individuelle Betreuung unabdingbar ist.
Standards nutzen
Eine Vielzahl an IT-Störungen ähnelt sich. Deswegen müssen häufig keine neuen Lösungen gefunden werden. Nutzen Sie Standardlösungen, die sich bereits bei bekannten Incidents in der Vergangenheit bewährt haben. Das spart Zeit und schafft die Gewissheit, das vorliegende Problem effektiv beheben zu können. Die Grundlage, um auf Standardlösungen zurückgreifen zu können, ist die gründliche Dokumentation und Analyse der einzelnen IT-Incidents.
Team motivieren
Definieren Sie KPIs für Ihr Incident Management, die auf die Geschäftsziele einzahlen. Das erhöht die Motivation und Produktivität des IT-Supports und ist eine weitere Grundlage für ein erfolgreiches Incident Management.
Externe Hilfe hinzuziehen
Wie die bisher vorgestellten Prozesse verdeutlichen, ist ein gutes Incident Management nicht nebenbei zu lösen. Es bindet beträchtliche Ressourcen innerhalb des Unternehmens, insbesondere was die Abstellung von IT-Fachkräften angeht. Genau diese Fachkräfte sind aber in vielen Unternehmen rar.
Hinzu kommt, dass Incidents immer Aufmerksamkeit vom nicht minder wichtigen Tagesgeschäft abziehen. Ihre Mitarbeitenden müssen sich so ständig zwischen ihren regulären Aufgaben und unerwartet eintretenden Störfällen aufteilen. Für die Implementierung von wichtigen Innovationen bleibt so kaum noch Zeit.
Einen Ausweg stellt die Zusammenarbeit mit einem Managed-Services-Provider (MSP) dar. Solche Incident-Experten übernehmen Ihr Störungsmanagement für Sie. Auf diese Weise erhalten Sie direkt Zugriff auf spezialisierte Fachkräfte und stellen gleichzeitig Ihre eigenen Mitarbeitenden für wichtige Zukunftsprojekte frei. Im Folgenden gehen wir genauer auf die Vorteile einer solchen Kooperation ein.
Vorteile des externen Incident Managements
Sie profitieren von vielen Vorteilen, falls Sie Ihr Incident Management durch einen Service-Provider durchführen lassen.
Ausfallsicherheit durch Erfahrung
Kümmert sich ein externer IT-Dienstleister um Ihr Incident Management, hat er dies in der Vergangenheit auch schon für andere Unternehmen getan. Deswegen kann er auf einen riesigen Erfahrungsschatz im Umgang mit der ganzen Bandbreite an IT-Störungen zurückgreifen. Von den passenden Lösungen profitieren Sie.
Sofortige Reaktion
Externe IT-Experten erleben häufig kritische Situationen und wissen, zeitsparend mit ihnen umzugehen. Und: Sie sind in der Dienstleisterrolle. Das erhöht die Wahrscheinlichkeit einer schnellen Reaktion. Denn davon hängt ab, ob der Provider neue Kunden gewinnen und bestehende halten kann.
Kalkulierbare Kosten
Die Kosten für die externe Betreuung Ihres Incident Managements sind sehr gut kalkulierbar. Häufig besteht die Möglichkeit eines monatlichen Festpreises, sodass Sie mit dem Budget für das Incident Management zuverlässig planen können. Aber auch bei flexiblen Abrechnungsmodellen erhalten Sie jeden Monat eine transparente Aufschlüsselung der Kosten, welche Prognosen für die Zukunft erleichtern.
Freie Kapazitäten für Ihr Kerngeschäft
Da Sie intern keine IT-Kapazitäten für das Incident Management nutzen müssen, können Sie diese für andere Aufgaben wie zum Beispiel die Prozessoptimierung einsetzen.
Unabhängigkeit von Mitarbeiterausfällen
Fallen Mitarbeitende im Unternehmen aus, wird dafür direkter Ersatz benötigt – egal ob aufgrund von Krankheit, Urlaub oder Elternzeit. Übernimmt ein externer Dienstleister, müssen Sie sich dagegen um keinen Ersatz kümmern. Ein Vorteil, der besonders bei plötzlichen Krankheitsfällen zur Geltung kommt – und den Betrieb am Laufen hält.
Individuelle Skalierbarkeit
Wichtig ist auch die Skalierbarkeit. Denn es kann vorkommen, dass der IT-Bedarf in gewissen Zeiten steigt, zum Beispiel saisonal bedingt. Wenn Sie mit einem externen Service-Provider zusammenarbeiten, können Sie dessen Leistung jederzeit nach Bedarf aufstocken. Der Vorteil: Sie müssen Ihr IT-Team bzw. Ihre Serverlandschaft nicht kurzfristig erweitern und sparen sich hohe Einstellungs- und Anschaffungskosten.
Know-how und Zertifizierungen
Die IT-Industrie entwickelt sich extrem dynamisch. Eine kontinuierliche Fortbildung und Zertifizierung von IT-Experten sind daher die Voraussetzungen dafür, dass Sie aktuelle IT-Probleme jederzeit adäquat lösen können. Übertragen Sie das Incident Management an einen externen Dienstleister, arbeiten Sie mit Spezialisten zusammen, profitieren vom neuesten Branchen-Wissen und müssen kein zusätzliches Budget für Weiterbildungsmaßnahmen aufbringen.
Verbessern Sie Ihr Incident Management mit der ahd!
Sie möchten Incident Management in Ihrem Unternehmen einführen? Oder Sie nutzen es bereits und wollen es jetzt auf ein neues Level heben? Dann sollten wir uns unterhalten. Die Experten der ahd analysieren gemeinsam mit Ihnen den Status quo, erstellen ein zukunftssicheres Incident-Konzept und übernehmen die komplette Durchführung. Auch beim Thema Change-Management unterstützen wir Sie. Kontaktieren Sie uns jetzt für eine unverbindliche Erstberatung!
KOSTENLOSER LEITFADEN
So finden Sie den passenden IT-Dienstleister
Sie möchten mehr darüber erfahren, wie Sie den richtigen Service-Provider auswählen? Dann laden Sie sich jetzt unseren Leitfaden „So finden Sie den passenden IT-Dienstleister“ herunter.