- P
- E
システム障害対応自動化
障害対応は24時間待機しているオペレータに負荷がかかるだけでなく、夜間休日もエスカレーションされるエンジニアやその家族にも大きな負荷をかけます。Kompira Enterpriseで障害対応を自動化すると、オペレータが行うアラート受け、フォルスアラート確認だけでなく、エンジニアが行う深い情報取得やサービスの正常性確認、障害対応まで自動化できますので、オペレータ・エンジニア両方の負荷を軽減できる上にサービス品質も向上させられます。
また、対象システムが増加しても増員する必要がなくなりますのでコスト削減にもつながります。
ユーザーの課題
提供サービスの増加と運用のリソース不足
担当者のスキルが不平衡
変動費が増え続ける
自動化の概要
障害通知から処理実行までをノンストップで自動化する活用方法です。システム障害発生を監視サーバが検知し、Kompira Enterpriseに通知。Kompira Enterpriseが通知内容を解析し、アラートを分類します。アラートの内容ごとにアクションを設定できますので、システム担当者へのエスカレーション電話が必要なアラートなら「Kompira Pigeon」で自動電話を、直接再起動などの処理を実行する場合は監視対象システムに処理を実行します。
通知内容を解析し、アラートを分類します。
監視サーバが検知した障害をKompira Enterpriseが受信します。アラートには誤検知の可能性があるため、Kompira Enterpriseはまず本当に障害かどうかを確認します。この時点でフォルスアラートは除外されます。
分類されたアラートから、
監視対象システムへ自動で処理実行
アラートの内容が本当に障害だった場合には、対象システムに障害対応を実行します。それでも復旧しない場合は、Kompira Pigeonを介して自動でシステム担当者に電話エスカレーションします。