トラブル対応の心がけ
こんにちは。フィックスポイントの冨です。
「トラブル」といえばシステム運用とは切っても切れない関係です。
トラブルを未然に防ぐ・発生したら迅速に対応するのが、仕事の大半と言っても過言ではありません。
ハードウェアの故障など、自分たちのコントロールを越えたものや、作業ミスなどの自分たちの失敗など、規模や原因は様々です。
このトラブル対応に際しては、個人差が現れて非常に興味深いものです。
一般的には、比較的ベテランの方が慣れている分だけ、落ち着いて対処出来る事も多そうですが、長年運用マネージャをやっているCIOの知人は「毎回、心臓がバクバクする。命までは取られないと自分に言い聞かせて、まずは落ち着こうとする。」と言ってまして、トラブルのたび毎に寿命が縮んでいるようです。
その一方で、トラブルになると目をキラキラさせて「おっしゃ、やったるで!」と飛び込んでいく現場マネージャーというのもおります。
本当に性格によるところも大きいなあと感じています。
自分達が当事者に置かれた場合のトラブルシュートも段階があります。ポイントを列挙していきます。
1.気持ちの整理
トラブルが発生した際には、とかく悪い想像をしがちで冷静さを失います。
特に自分が何かをやらかしてしまった場合は、どうにかしなければと傷口を広げがちです。
まずは「トラブルの被害を最小限に留めるには?」と客観的に捉え直し、
解決を他人に任せる場合も考慮して、冷静さを取り戻す必要があります。
2.解決に向けたアクション
具体的な解決に向けての行動を起こします。
上司、顧客、社内の事業部門などの関係者に報告して指示を仰ぐ。
実際に機器の操作などを行って障害に対処するなどです。
報告する場合のポイントは「迅速に」「隠さず」「事実と感情・判断を分ける」が重要です。
また報告のタイミング・頻度も重要です。「ある程度、障害が落ち着いて進捗が見えたら報告する」としていると、顧客側はトラブル時に自分たちは放置されていると不信感が高まります。
また、逆に過度に報告を求めてくる顧客もいます。
肝心のトラブル解決の作業よりも報告そのものに時間・労力を取られてしまうという本末転倒になりがちなので、うまくコントロールするのがITマネージャの力量と言えましょう。
3.再発防止の仕組みを考える
一段落した段階で、同種のトラブルが再発しないように仕組みを見直していきます。
「**しないように気をつける」などの精神論で乗り切るのはよろしくないです。
また「仕組み」といっても「チェックの回数を増やす」が定番ですが、回数が増える事でそれぞれのチェック担当のチェックの仕方が甘くなるなど、かえって逆効果になる懸念も良く指摘されます。
チェックの方法を見直したり、手順をスクリプトなどで自動化して作業ミスが入る余地を減らすなどの対応もあります。
教訓を次に活かせる「仕組み」を上手く作って、再発防止に努めて行きましょう。