Kompira

Menu Menu

Column

2021/09/15

トラブル対応の心がけ

こんにちは。フィックスポイントの冨です。

 

「トラブル」といえばシステム運用とは切っても切れない関係です。
トラブルを未然に防ぐ・発生したら迅速に対応するのが、仕事の大半と言っても過言ではありません。
ハードウェアの故障など、自分たちのコントロールを越えたものや、作業ミスなどの自分たちの失敗など、規模や原因は様々です。

 

このトラブル対応に際しては、個人差が現れて非常に興味深いものです。
一般的には、比較的ベテランの方が慣れている分だけ、落ち着いて対処出来る事も多そうですが、長年運用マネージャをやっているCIOの知人は「毎回、心臓がバクバクする。命までは取られないと自分に言い聞かせて、まずは落ち着こうとする。」と言ってまして、トラブルのたび毎に寿命が縮んでいるようです。

 

その一方で、トラブルになると目をキラキラさせて「おっしゃ、やったるで!」と飛び込んでいく現場マネージャーというのもおります。
本当に性格によるところも大きいなあと感じています。

 

自分達が当事者に置かれた場合のトラブルシュートも段階があります。ポイントを列挙していきます。

 

1.気持ちの整理
トラブルが発生した際には、とかく悪い想像をしがちで冷静さを失います。
特に自分が何かをやらかしてしまった場合は、どうにかしなければと傷口を広げがちです。
まずは「トラブルの被害を最小限に留めるには?」と客観的に捉え直し、
解決を他人に任せる場合も考慮して、冷静さを取り戻す必要があります。

 

2.解決に向けたアクション
具体的な解決に向けての行動を起こします。
上司、顧客、社内の事業部門などの関係者に報告して指示を仰ぐ。
実際に機器の操作などを行って障害に対処するなどです。

 

報告する場合のポイントは「迅速に」「隠さず」「事実と感情・判断を分ける」が重要です。
また報告のタイミング・頻度も重要です。「ある程度、障害が落ち着いて進捗が見えたら報告する」としていると、顧客側はトラブル時に自分たちは放置されていると不信感が高まります。
また、逆に過度に報告を求めてくる顧客もいます。
肝心のトラブル解決の作業よりも報告そのものに時間・労力を取られてしまうという本末転倒になりがちなので、うまくコントロールするのがITマネージャの力量と言えましょう。

 

3.再発防止の仕組みを考える
一段落した段階で、同種のトラブルが再発しないように仕組みを見直していきます。
「**しないように気をつける」などの精神論で乗り切るのはよろしくないです。
また「仕組み」といっても「チェックの回数を増やす」が定番ですが、回数が増える事でそれぞれのチェック担当のチェックの仕方が甘くなるなど、かえって逆効果になる懸念も良く指摘されます。
チェックの方法を見直したり、手順をスクリプトなどで自動化して作業ミスが入る余地を減らすなどの対応もあります。

 

教訓を次に活かせる「仕組み」を上手く作って、再発防止に努めて行きましょう。

コラム一覧
2022年
2022.04.27
運用管理に向いているDMAICフレームワーク
2022.04.20
お勧め本「システム運用アンチパターン」
2022.04.13
IPA 「DX実践手引書」の改訂版を発表
2022.03.31
春は引継ぎのシーズン
2022.03.24
「なぜなぜ分析」の使い方
2022.03.16
マルウェアEmotet再流行
2022.03.09
省エネモードのエンジニア
2022.02.24
ヒューマンエラーを防ぐには
2022.02.16
インフラ維持と式年遷宮
2022.02.09
Web3.0とP2Pの復権
2022.01.24
JIS規格に学ぶリスクマネジメン
2022.01.19
多すぎる通知の副作用
2022.01.12
2022年のインフラ技術
2021年
2021.12.29
今年もお世話になりました
2021.12.22
品質レベルはステージごとに変わる
2021.12.15
ログ出力ライブラリLog4j脆弱性の影響
2021.12.09
リモート作業の問題点
2021.11.24
メタバースに未来はあるか
2021.11.17
インシデントとの向き合い方
2021.11.10
DXは差別化要素を作るための投資という視点
2021.10.27
監視の拡張としてのオブザーバビリティ
2021.10.20
良い自動化、イマイチな自動化
2021.10.13
みずほ銀のトラブルから学ぶ
2021.09.29
クラウドDBで時短
2021.09.22
そろそろWindows 11が到来します
2021.09.15
トラブル対応の心がけ
2021.09.08
10/10は「デジタルの日」
2021.08.25
運用なき開発を避ける
2021.08.18
日本のDXの最前線
2021.08.12
DXとアジリティ
2021.07.14
ポストコロナで会議室が足りなくなる?
2021.06.30
自動化の技術選択
2021.06.23
業務の自動化は入り口にすぎない
2021.06.16
データ入力のお作法
2021.05.26
「苦労に価値がある」という価値感
2021.05.19
「運用でカバー」する公共システム
2021.05.12
VUCAの時代を生き抜くスキル
2021.04.28
デジタル敗戦からの復興はなるか
2021.04.21
PCの「基本的人権スペック」
2021.04.14
お勧め書籍「運用改善の教科書」
2021.03.31
運用スタッフの大部分はリモートワークへ
2021.03.24
定型業務をプログラマブルに
2021.03.17
監視疲れを起こさない工夫
2021.03.08
MSの無料RPAは自動化の起爆剤となるか
2021.02.22
終わりなき開発とインフラ運用
2021.02.17
作業を自動化しても業務が効率化しない場合
2021.02.10
Cocoaのバグが4か月も発覚しなかった話
2021.01.27
「クソどうでもいい仕事」を考える
2021.01.26
「クソどうでもいい仕事」を考える
2021.01.20
自動化の次の課題としてのAIOps
2021.01.13
DXレポート2が公開されました
2020年
2020.12.21
今年もお世話になりました。
2020.12.16
どうなる? 2021年のITインフラ
2020.12.09
アドベント・カレンダーの季節です
2020.11.11
AI・業務自動展で見聞きしたツライお話
2020.11.04
「7番セカンド」な仕事
2020.10.21
システム監視とアラート地獄
2020.10.19
機械学習とシステム運用
2020.10.14
形あるものは壊れる。システムも。
2020.09.30
技術ドキュメントの課題
2020.09.23
デジタル庁に寄せる期待感
2020.09.16
ローコード開発とエンジニア不要論
2020.09.09
技術の近未来予測とニューノーマル対応
2020.08.26
“アンチフラジャイル”な考え方
2020.08.19
カオスエンジニアリングという考え方
2020.08.12
運用が稼ぐ時代
2020.07.29
AIシステムの運用
2020.07.22
新宿に宿泊でTDLにGoToは対象外?
2020.07.08
チェック回数を増やしても意味がない
2020.06.24
「時代はクラウド」発言と政府インフラ
2020.06.17
システムの標準化とスキルセット
2020.06.10
「2025年の崖」からの転落事故
2020.05.20
先端IT“非”従事者は勉強不足 from IP
2020.05.12
スペイン風邪にみるコロナ第二波へ備
2020.04.30
「運用でカバー」という魔法の言葉
2020.04.26
未然に防いだトラブルは評価されにくい
2020.04.22
リモート勤務で重要性を増す「ゼロ・トラスト」セキュリティ
2020.04.15
オンラインイベント「Ops Summit2020」開催!
2020.04.15
コンサルは「標準化しろ」とは言うけれど
2020.04.08
オンライン”Zoom”会議のセキュリティー問題
2020.03.23
ドキュメントで見かける”Day 2オペレーション”
2020.03.18
今、売れまくっているITサービス
2020.03.11
出社している場合じゃないご時世
2020.02.26
新型コロナウィルス対策に学ぶトラブル対応
2020.02.19
バレンタインデーにシステム統合の本がバカ売れ
2020.02.12
ハイパーオートメーションの時代
2020.01.29
インフラ運用リーダーが備えるべき10の能力
2020.01.22
障害発生時の夜中に叩き起こす技術
2019年
2019.12.11
RPAとRBAと運用自動化
2019.12.11
年末年始に読む運用関連本
2019.11.27
業務フローの「こんまり」のお勧め
2019.11.20
「システム運用自動化」はスモールスタートで
2019.11.13
運用事故では人を責めない
2019.01.15
話題の「クラウドネイティブ」とは何か?