Questo articolo fa parte dalla serie “ITIL thinking“ per comprendere i benefici del framework per le aziende che si occupano della gestione dei servizi IT.
In questo articolo:
Maggior valore per il business
Quante volte ci sarà capitato di dire o sentire la frase “Houston abbiamo un problema!” Ma nella pratica di ITIL dovremmo dire “Houston abbiamo un incident!”. Infatti, nella gestione dei servizi IT, vi è una netta distinzione tra “Incident” e “Problem”.
Cos’è un Incident
Per definizione un Incident è un’interruzione non pianificata di un servizio IT o una riduzione della qualità dello stesso. È un Incident anche il guasto di un elemento della configurazione (CI – Configuration Item) che ancora non ha avuto effetti sul servizio IT.
L’obiettivo del processo di Incident Management è di ristabilire il normale servizio il più rapidamente possibile per minimizzare gli impatti negativi sul business del cliente.
Cos’è un Problem
Per contro, un Problem è la causa di uno o più Incident. Solitamente la causa non è conosciuta quando è generata la registrazione del problema ed il processo di Problem Management è responsabile di ulteriori analisi.
Gli obiettivi fondamentali del Problem Management sono prevenire gli incidenti e i problemi conseguenti, eliminare il ripetersi di incidenti e minimizzare l’effetto di quelli che non possono essere evitati preventivamente.
Maggior valore per il business
Il Problem Management include la diagnosi delle cause degli incidenti, l’individuazione delle soluzioni e l’accertamento che le soluzioni siano messe in atto. Inoltre, raccoglie le appropriate informazioni sui problemi, i workaround (soluzioni temporanee) e le soluzioni.
Gli incidenti ricorrenti vengono risolti in modo più rapido e quelli più gravi vengono affrontati in modo adeguato fornendo informazioni tempestive al cliente a supporto del proprio business.
I problemi sono categorizzati in modo simile agli incidenti, ma l’obiettivo è di capire le cause, di documentare i workaround e di chiedere cambiamenti che risolvano permanentemente i problemi. I workaround sono documentati in un Known Error Database (KEDB) la base di dati degli errori noti. Questo migliora l’efficienza e l’efficacia dell’Incident Management.
Due sono le metodologie di gestione dei Problem:
Il Problem Management reattivo,si occupa principalmente di due tipi di incidenti:
- incidenti ripetitivi: il Service Desk può innescare la creazione di un problema, evidenziando al Problem Manager una serie ricorrente e altamente visibile di determinati incidenti. Il Problem Manager avvierà così il processo di gestione di tale casistica.
- incidenti di rilievo: gli incidenti ad alto impatto o urgenti richiedono l’impiego immediato di un team di gestione del problema competente che lavorando sull’origine della causa potranno fornire al Service Desk le opportune informazioni per supportare il cliente.
Il Problem Management proattivo: identifica i possibili problemi prima che si trasformino in incidenti, di fatto prevenendoli. Per fare ciò si possono analizzare i trend degli incidenti oppure l’infrastruttura IT per identificarne i punti deboli.
Relazione con gli altri processi ITIL
Il Problem Management si relaziona con i seguenti processi/funzioni:
- Change Management: per la soluzione di alcuni problemi è necessaria l’apertura di una RFC (Request for Change). Tale richiesta viene inoltrata al Change Management che provvederà ad implementare i necessari workaround e fix.
- Configuration Management: un’accurata gestione dei dati, a cura del Service Asset and Configuration Management, sui Configuration Items (CI) permette al Problem Management di avere una maggiore precisione nell’analisi dei trend e la valutazione dell’impatto sugli asset.
- Knowledge Management: il Service Knowledge Management System (SKMS) è il database per la tracciatura degli errori noti, i workaround e le fix. Se correttamente alimentato può fornire l’adeguato supporto a coloro che si occupano di gestire il processo di Incident Management.

Conclusioni
Se correttamente implementato, il processo di Problem Management, aiuta a minimizzare il numero e l’impatto degli incidenti ripetitivi e quelli che non possono essere previsti.