[Gerenciamento de Problema] Solução definitiva, o dilema…

Acabei de responder a uma enquete muito interessante no grupo ITIL Expert Brasil. Perguntaram se, caso uma solução definitiva fosse reutilizada, isto seria devido à mesma não ter sido eficiente. Segue abaixo minha resposta:

“Bem, no meu ponto de vista, a ideia é a seguinte: Uma solução definitiva, objetiva eliminar ou mitigar a causa raiz de um ou mais incidentes.

Bem bonito na teoria. Mas na prática, de fato, muitas vezes não chegamos ao detalhe necessário para que encontremos a verdadeira causa raiz. Por isso, na maioria das vezes, a solução, dita como ‘definitiva’, pode não ser suficientemente eficaz.

Um exemplo que vivi na prática, foi bem interessante:
Tudo começou com um Incidente relacionado a usuários que não conseguiam enviar e receber e-mails. Depois da análise técnica, pudemos diagnosticar que o servidor de e-mails havia desligado, por isso os usuários não conseguiam enviar e receber seus e-mails.

Na confecção do relatório de causa raiz, inicialmente pensamos em atribuir a causa raiz ao desligamento do servidor. Se esta houvesse sido a causa diagnosticada, com certeza, não teria sido suficientemente eficaz e, portanto, teríamos tido que reutilizá-la.

Portanto, decidimos ir um pouco mais no detalhe: Por que o servidor havia desligado? Depois de maiores análises, descobrimos que o que havia causado o desligamento do servidor, fora a falha de um componente elétrico (pouparei vocês dos detalhes técnicos).

Mais uma vez no relatório, o pensamento inicial e consensual era: “Achamos a causa raiz!”. Pensávamos em atribuir a causa ao citado componente elétrico. Mas faltava algo mais: Por que o componente elétrico falhou? Mais uma vez, sem esta resposta, a causa raiz não teria sido eficiente.

Descobrimos então que o componente havia falhado devido a (em resumo) ser velho. A data recomendada para utilização do item em questão havia passado há alguns meses. Agora sim, achamos a causa raiz? Ainda não!

Decidimos ir um pouco mais fundo. Por que a data não fora observada? A resposta, em termos simples, estava portanto, relacionada a processos internos da companhia: Porque não existia um processo para substituição de equipamentos “vencidos”. Esta sim, determinada como a causa raiz.

Como ação de mitigação, definimos e rodamos o processo de substituição, e encontramos mais cerca de 80 equipamentos em condições similares, evitando portanto, incidentes da mesma natureza.

Com este caso, não quero dizer que caso uma solução apresentada como definitiva seja reutilizada, significa que esta não seja eficaz. Entretanto, creio que, na grande maioria das vezes, esta reutilização seja de fato relacionada a eficiência.

Isto se dá, devido a vários fatores, como falta de experiência dos times técnicos e de processos, e principalmente devido a, na prática, temos SLAs de resolução de problemas cada vez mais agressivos, e times cada vez mais enxutos, dificultando uma análise mais criteriosa.

Espero ter contribuído de alguma maneira. Abraços!”