Gestion des incidents informatique

La gravité des incidents peut varier considérablement, allant d’un incident important, à une erreur isolée. Quel est notre processus de gestion des incidents.
pexels-jonathan-borba-3818631 (1)

Les incidents rendent les utilisateurs frustrés, bloqués, isolés ou improductifs. Et cela se traduit le plus souvent par des commentaires dégageant une grande insatisfaction vis à vis de l’informatique. C’est pourquoi, il est important de ne pas négliger ce service aux utilisateurs finaux.

Pendant que certain étaient concentrés, tête baissée, à réparer les pannes, nous avons moderniser notre gestion des incidents pour réagir aux événements imprévus et aux interruptions de votre informatique.

Dans ce contexte, nos équipes ont besoin de s’appuyer sur des méthodes rigoureuses afin de prioriser les incidents et de pouvoir restaurer le service rapidement, dans le respect de nos engagements de service.

Ce que nous avons mis en place et consolidé

  • un ensemble de matrices complexes pour gérer les priorités et les niveaux de réponse, ce pour différents services rendus à différents types de clients ou branches d’activité.
  • une communication adaptée à chaque partie prenante
  • des environnements de production et de non-production
  • des escalades verticales et latérales
  • de la collaboration efficace au sein d’équipes centralisées et dispatchées sur plusieurs sites
  • la capacité à gérer des incidents majeurs
  • l’amélioration continue

Le processus de Gestion d’Incidents

La gestion des incidents n’est pas nécessairement un processus lourd et contraignant, il dépend plus de notre organisation et de la culture de l’entreprise. Cependant, il est vrai que certaines caractéristiques doivent être présentes pour que la pratique vous apporte une valeur ajoutée.

Point encore plus important pour que la Gestion d’Incidents révèle tout son potentiel : les rythmes et modèles de catégorisation et de priorisation, les niveaux de service et la communication doivent être définis en collaboration avec les parties prenantes ou les clients lors de la conception ou de l’introduction du service.

Identifier et consigner

Un incident peut provenir de n’importe où : un employé, un client, un fournisseur, des systèmes de surveillance. Quelle que soit la source, les deux premières étapes sont simples : l’incident est identifié, puis l’incident est enregistré.

Catégoriser et prioriser

L’affectation d’une catégorie (et d’une sous-catégorie si besoin) logique et intuitive à chaque incident nous aidera à analyser vos données par la suite.

Chaque incident doit également être classé par ordre de priorité. Cela commence par la catégorisation dont on a parlé ci-dessus, puis par l’évaluation de l’impact sur l’activité de l’entreprise et sur le nombre d’utilisateurs.

Répondre

Diagnostic initial : idéalement il faut que votre équipe de Support niveau 1 puisse voir un incident, du diagnostic jusqu’à la fermeture. Mais si elle ne peut pas, la prochaine étape consistera alors à renseigner toutes les informations pertinentes à l’analyse de l’incident dans le ticket et à les transmettre à l’équipe de Support du niveau 2.

Escalader, Investiguer, Diagnostiquer : Escalade verticale ou latérale ? Vous pouvez avoir besoin des deux pour les incidents majeurs. L’escalade latérale, qu’elle soit simple ou multiple, peut être la seule façon d’aborder un problème. Parfois, les équipes font appel à des ressources externes ou à d’autres membres du service pour obtenir de l’aide pour la résolution du problème.

Communiquer : Les parties prenantes internes et externes sont notifiées des mises à jour via les moyens les mieux adaptés selon le destinataire : e-mail, page web, WhatsApp, Teams, …

Résolution et récupération : Cela concerne toutes les mesures nécessaires à la résolution de l’incident. En cas d’incident majeur, la résolution implique seulement le temps nécessaire au rétablissement du service. Certains correctifs (comme les correctifs de bugs) peuvent nécessiter des tests et un déploiement dans un second temps après la résolution du service.

Fermeture : Elle peut prendre plusieurs formes selon le type d’incident. Pour les problèmes simples, la clôture peut suivre automatiquement la résolution. Pour les incidents majeurs, la clôture est faite après la réalisation d’un rapport post-action pour compléter l’événement.

Conclusion

La gestion d’incidents ne repose pas sur un outil, mais sur la bonne combinaison d’outils, de pratiques et de personnes.

L’automatisation, les bonnes pratique et la connaissance de nos clients, sont autant de moyens de garantir un process de gestion d’Incidents simple et efficace.