Problem Management Maßnahmenkatalog zur Behebung von Störungsursachen

Das Problem-Management ist wie das Incident-Management ein Service-Management-Prozess innerhalb von ITIL-Methodik (IT Infrastructure Library). Im Gegensatz zum Incident-Management adressiert es jedoch keine akuten Vorfälle oder Störungen, sondern bietet einen umfassenden, standardisierten Maßnahmenkatalog, um Problemquellen zu erkennen und dauerhaft zu beseitigen. Auf diese Weise lassen sich wiederholt auftretende Störungen reaktiv eliminieren, sodass diese Incidents in Produktion und Logistik (Warehousing und Manufacturing) künftig verhindert werden.

Statt Hotline-Troubleshooting – wie beim Incident-Management – steht im Rahmen des Problem-Managements die nachhaltige Analyse von Fehlerursachen im Vordergrund: Das identifizierte Problem wird nachfolgend dann durch einen Change (Change-Management) behoben. Während das Incident-Management meist unter zeitlichem Hochdruck zu erfolgen hat, sind Problem-Management-Aktivitäten in der Regel weniger zeitkritisch.

Gleichwohl erfordern sie von deren Koordinator:innen spezifisches Know-how bei der Ursachenanalyse und letztlich beim Entwickeln einer geeigneten Lösung für die grundlegende Eliminierung von Problemen. Das Anforderungsprofil ist also nicht nur technischer Natur, im Fokus steht darüber hinaus das Managen komplexer Störungssituationen auf Ebene von IT-Services.

Bewährtes Vorgehensmodell

In einem ersten Schritt wird das Problem identifiziert und detailliert aufgezeichnet. Unmittelbar im Anschluss erfolgt die Kategorisierung und Priorisierung. Besondere Berücksichtigung finden hierbei die Vereinbarungen innerhalb des Service-Level-Agreements (SLA) – auch und gerade in zeitlicher Hinsicht.

Des Weiteren wird im Diagnose-Prozess die Tragweite eines Problems festgelegt. Sofern die Auswirkungen von Brisanz für den operativen Geschäftsbetrieb sind, erfolgt eine Klassifizierung als „Major Problem“, das vorrangig zu beheben ist. Unter Umständen können bis zur endgültigen Problembehebung auch Interimslösungen in Anspruch genommen werden.

Derartige Workarounds überdecken die Spanne bis zur finalen Lösungsfindung, wenn diese einen längeren, nur schwer tolerierbaren Zeitraum in Anspruch nimmt. Sowohl die Workarounds als auch eindeutig identifizierte Probleme – sogenannte „Known Errors“ –, für die bereits Lösungsansätze umgesetzt worden sind, werden abschließend dokumentiert.

Aktives Wissensmanagement für eine beschleunigte Problemlösungsfindung

Diese Datenbasis unterstützt das Wissensmanagement, auch indem neu avisierte Incidents mit bereits erkannten und gelösten Problemen verknüpft werden können. Auf diese Weise lassen sich bereits bekannte Lösungsansätze zur Fehlerbehebung (Known Errors) und auch Umgehungsanwendungen (Workarounds) aus dem Problem-Ticket übernehmen.

Sämtliche Aktivitäten sind als Historie hinterlegt, sodass eine jederzeitige Nachvollziehbarkeit und somit auch Revisionssicherheit gewährleistet ist. Gleichzeitig impliziert dieses Verfahren, dass unter Umständen mehrere Fachabteilungen involviert sind.

Entsprechend hoch sind die Anforderungen an die Koordinationskompetenz der Problem Management-Verantwortlichen.

Über die exakte Festlegung der Service-Prozesse beim Problem-Management hinaus erfolgt zudem eine Definition von steuerungsrelevanten Kennzahlen. Eine entsprechende Auswertung dieser Kennzahlen über Prioritäten, Kategorien und auch den Zeitverlauf hinweg liefert wertvolle Hinweise auf das aktuelle Niveau des Incident-Managements. Gleichzeitig lassen sich Aussagen über die Qualität der betroffenen IT-Infrastruktur ableiten.

Service Operation Prozesse

Als ein Prozess der Service Operation gemäß ITIL konzentriert sich das Problem-Management darauf, das Auftreten von Incidents auf Grundlage eines standardisierten Maßnahmenkatalogs zur Ursachenforschung zu verhindern.

IGZ steht Ihnen gerne bei der gemeinsamen Erarbeitung eines für Sie passenden Service-Katalogs zur Verfügung: Leistungs- und kostenoptimiert sowie individuell auf Ihre Bedürfnisse zugeschnitten.