Comment EasyDMARC a accéléré l'investigation des incidents et la productivité des développeurs avec l'AI SRE
Transformer les signaux opérationnels en décisions d'ingénierie plus rapides.


La complexité opérationnelle croît rapidement à mesure que les plateformes évoluent. Notre objectif était de donner aux ingénieurs une meilleure visibilité sur ce qui se passe dans le système pour qu'ils puissent se concentrer sur la résolution des problèmes plutôt que sur leur recherche. OpsWorker nous a aidés à réduire considérablement le temps d'investigation et à améliorer la productivité des développeurs.
Résultats clés
Des améliorations mesurables dans l'ensemble des opérations d'ingénierie.
investigation des problèmes plus rapide pour les développeurs
d'identification de la cause racine plus rapide
réduction significative de l'analyse manuelle des logs et dashboards
amélioration de la détection précoce des problèmes en staging
EasyDMARC fournit une plateforme basée dans le cloud qui aide les organisations à protéger leurs domaines contre l'usurpation d'email et les attaques de phishing grâce à l'authentification DMARC et à la surveillance de la sécurité des emails.
La plateforme traite de grands volumes de données d'authentification email et opère une infrastructure cloud distribuée supportant des clients dans le monde entier. À mesure que la plateforme s'est développée et que l'utilisation par les clients a augmenté, maintenir la fiabilité et la visibilité opérationnelle entre les services est devenu de plus en plus complexe.
EasyDMARC fonctionne avec une architecture cloud-native moderne avec plusieurs services et composants d'infrastructure de support qui doivent fonctionner ensemble de manière fiable. Les équipes d'ingénierie s'appuient sur les systèmes de monitoring, les logs et la télémétrie pour identifier et résoudre les problèmes sur la plateforme.
À mesure que le nombre de services et de signaux opérationnels a augmenté, les développeurs devaient souvent naviguer sur plusieurs dashboards, logs et outils de monitoring pour comprendre les incidents et les problèmes de performance.
Pour améliorer la visibilité opérationnelle et réduire le temps d'investigation, EasyDMARC a intégré OpsWorker, une plateforme AI SRE qui corrèle la télémétrie, les signaux d'infrastructure et les événements opérationnels pour accélérer le dépannage et la compréhension du système.
Principaux cas d'usage chez EasyDMARC
Comment OpsWorker génère de la valeur dans l'organisation d'ingénierie.
Accélérer l'investigation des problèmes pour les développeurs
OpsWorker corrèle les logs, métriques et événements d'infrastructure pour aider les développeurs à identifier les problèmes beaucoup plus rapidement sans chercher manuellement dans plusieurs outils de monitoring.
- Vue unifiée des logs, métriques et événements
- Identification plus rapide de la localisation du problème
- Navigation réduite entre les outils
- Focus sur la résolution plutôt que la recherche
Détection précoce des problèmes en staging
L'analyse quotidienne des environnements de staging met en évidence les alertes et déviations, aidant les équipes à détecter les problèmes avant qu'ils n'atteignent la production.
- Digest opérationnel quotidien pour le staging
- Résumé des alertes et anomalies
- Détection précoce des problèmes de release
- Assurance qualité proactive
Diagnostic d'incidents et identification de la cause racine plus rapides
Lors des incidents de production, OpsWorker aide les ingénieurs à identifier rapidement le domaine, le composant ou la dépendance responsable du problème.
- Corrélation des signaux assistée par AI
- Analyse des dépendances inter-systèmes
- Isolation plus rapide des incidents
- Remédiation accélérée
Cas d'usage 1 : Accélérer l'investigation des problèmes pour les développeurs
Le défi : les systèmes complexes nécessitent des investigations complexes
À mesure que la plateforme d'EasyDMARC évoluait, les développeurs dépendaient de plus en plus de plusieurs outils pour investiguer les problèmes opérationnels.
Lorsque des problèmes survenaient, les ingénieurs devaient généralement examiner :
- les dashboards de monitoring
- les logs applicatifs
- les métriques d'infrastructure
- les événements de déploiement
- les récents changements de configuration
Comprendre la cause racine d'un problème nécessitait de naviguer sur plusieurs systèmes et de corréler manuellement plusieurs sources de données.
Ce processus consommait un temps d'ingénierie précieux et ralentissait le dépannage.
Les développeurs devaient souvent passer un temps considérable à déterminer où se trouvait le problème avant de pouvoir commencer à le résoudre.
La solution : investigation assistée par AI
EasyDMARC a intégré OpsWorker pour fournir aux développeurs une vue unifiée des signaux opérationnels sur l'ensemble de la plateforme.
OpsWorker analyse en continu la télémétrie, les événements d'infrastructure, les logs et les relations de services pour identifier les anomalies et fournir des insights d'investigation.
Au lieu d'explorer manuellement plusieurs dashboards, les ingénieurs peuvent compter sur OpsWorker pour mettre en évidence les signaux pertinents et guider le processus d'investigation.
Cette approche permet aux développeurs d'identifier rapidement d'où provient le problème et quels composants peuvent être impliqués.
En conséquence, les développeurs peuvent se concentrer sur la résolution des problèmes au lieu de passer du temps à chercher dans les données opérationnelles.
Cas d'usage 2 : Détection précoce des problèmes en staging
Comme beaucoup d'équipes d'ingénierie, EasyDMARC s'appuie fortement sur les environnements de staging pour valider les nouvelles releases avant de les déployer en production.
Cependant, les environnements de staging génèrent souvent de nombreuses alertes et signaux. Parce que beaucoup de ces alertes sont temporaires ou de faible priorité, les développeurs les ignorent souvent pendant les workflows de développement quotidiens.
Cela créait un défi opérationnel : des signaux d'avertissement précoces importants étaient parfois négligés.
En conséquence, certains problèmes n'étaient abordés qu'après leur apparition dans les environnements de production.
OpsWorker a introduit un digest opérationnel quotidien pour les environnements de staging qui met en évidence les alertes, déviations et anomalies opérationnelles détectées au cours de la journée précédente.
Au lieu d'examiner manuellement les logs, dashboards et événements de déploiement, les développeurs reçoivent une vue résumée des signaux pertinents.
Cela permet aux équipes d'ingénierie d'identifier rapidement les problèmes introduits par des commits ou releases récents sans avoir à examiner manuellement le comportement post-release.
En conséquence, les environnements de staging servent désormais de couche de détection précoce plus efficace pour les problèmes potentiels de production.
Cas d'usage 3 : Diagnostic d'incidents plus rapide
Les incidents de production nécessitent souvent que les ingénieurs déterminent rapidement quel domaine ou composant système est responsable du problème.
Sans corrélation automatisée entre les signaux d'infrastructure, les logs et le comportement applicatif, ce processus d'investigation peut prendre beaucoup de temps.
OpsWorker aide les équipes EasyDMARC à identifier rapidement le domaine et la cause racine des incidents en analysant les signaux opérationnels sur l'ensemble de la plateforme.
Lors d'un incident récent impliquant une requête de verrouillage de base de données post-release, OpsWorker a aidé les ingénieurs à identifier la cause racine beaucoup plus rapidement en mettant en évidence le comportement anormal de la base de données et en le corrélant avec l'activité de déploiement récente.
Cela a permis à l'équipe d'ingénierie d'isoler le problème et de commencer la remédiation beaucoup plus rapidement.
En conséquence, le temps d'investigation des incidents a été considérablement réduit, permettant une récupération de service plus rapide.
Intelligence opérationnelle continue
En intégrant des capacités d'investigation assistées par AI dans leurs workflows opérationnels, EasyDMARC a introduit un nouveau modèle pour le dépannage de systèmes complexes.
Au lieu de corréler manuellement les signaux sur plusieurs outils, les ingénieurs peuvent compter sur OpsWorker pour mettre en évidence les insights opérationnels pertinents et guider le processus d'investigation.
Cela crée un workflow d'ingénierie plus efficace où les signaux opérationnels sont continuellement analysés et exploités.
« Avec OpsWorker, EasyDMARC a considérablement amélioré la productivité des développeurs et accéléré l'investigation des incidents sur l'ensemble de sa plateforme. »
Façonnez l'avenir du
SRE piloté par l'AI
Transformez les signaux opérationnels en améliorations continues de la fiabilité. Rejoignez dès aujourd'hui les équipes d'ingénierie avant-gardistes.