Plan du cours
Introduction à Predictive AIOps
- Aperçu de l'analyse prédictive dans les opérations IT
- Sources de données pour la prédiction (journaux, métriques, événements)
- Concepts clés de la prévision de séries temporelles et des modèles d'anomalies
Conception de Modèles de Prédiction des Incidents
- Étiquetage des incidents historiques et du comportement du système
- Sélection et entraînement des modèles (par exemple, LSTM, Random Forest, AutoML)
- Évaluation de la performance du modèle et gestion des faux positifs
Collecte de Données et Ingénierie de Caractéristiques
- Ingestion et alignement des données de journaux et métriques pour l'entrée dans le modèle
- Extraction de caractéristiques à partir de données structurées et non structurées
- Gestion du bruit et des données manquantes dans les pipelines opérationnels
Automatisation de l’Analyse des Causes Réciproques (RCA)
- Corrélation basée sur les graphes des services et de l'infrastructure
- Utilisation du ML pour inférer les causes probables à partir des chaînes d'événements
- Visualisation de la RCA avec des tableaux de bord sensibles à la topologie
Rémédiation et Workflow Automation
- Intégration avec les plateformes d'automatisation (par exemple, Ansible, Rundeck)
- Déclenchement de rollbacks, redémarrages ou redirection du trafic
- Audit et documentation des interventions automatisées
Mise à l'échelle des Pipelines Intelligents AIOps
- MLOps pour la visibilité : réentraînement et versionnement du modèle
- Exécution de prédictions en temps réel sur les nœuds distribués
- Bonnes pratiques pour déployer AIOps dans des environnements de production
Cas Pratiques et Applications Concrètes
- Analyse de données d'incidents réels à l'aide de modèles prédictifs AIOps
- Déploiement des pipelines RCA avec des données synthétiques et de production
- Revue des cas d'utilisation industrielle : pannes cloud, instabilité microservices, dégradations réseau
Résumé et Étapes Suivantes
AIOps (Intelligence Artificielle pour les Opérations IT) est de plus en plus utilisée pour prédire les incidents avant qu'ils ne se produisent et automatiser l'analyse des causes réciproques (RCA) afin de minimiser les temps d'arrêt et accélérer la résolution.
Cette formation interactive dirigée par un instructeur (en ligne ou sur site) s'adresse aux professionnels IT avancés souhaitant mettre en œuvre l'analyse prédictive, automatiser la remédiation et concevoir des flux de travail intelligents RCA à l'aide d'outils AIOps et de modèles d'apprentissage automatique.
À la fin de cette formation, les participants seront en mesure de :
- Concevoir et entraîner des modèles ML pour détecter les motifs conduisant aux pannes du système.
- Automatiser les flux de travail RCA basés sur la corrélation multi-source des journaux et des métriques.
- Intégrer les processus d'alerte et de remédiation dans les plateformes existantes.
- Déployer et mettre à l'échelle des pipelines intelligents AIOps dans des environnements de production.
Format de la Formation
- Cours interactif avec discussions.
- Nombreuses exercices pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de Personnalisation du Cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin d'en discuter.
- Expérience avec des systèmes de surveillance tels que Prometheus ou ELK
- Connaissance pratique de Python et d'apprentissage automatique de base
- Familiarité avec les flux de travail de gestion des incidents
Public Cible
- Ingenieurs en fiabilité du site (SREs)
- Architectes d'automatisation IT
- Délégués des plateformes DevOps et de visibilité
AIOps (Artificial Intelligence for IT Operations) en Action : Prédiction d’Incidents et Automatisation de l’Analyse des Causes Réciproques (RCA)
Pré requis
- Expérience avec des systèmes de surveillance tels que Prometheus ou ELK
- Connaissance pratique de Python et d'apprentissage automatique de base
- Familiarité avec les flux de travail de gestion des incidents
Audience
- Ingénieurs avancés en fiabilité du site (SRE)
- Architectes d'automatisation IT
- Délégués et dirigeants de plateformes d'observabilité DevOps