Kompira

Menu Menu

Column

2020/08/26

“アンチフラジャイル”な考え方

こんにちは。フィックスポイントの冨です。

先週、カオスエンジニアリングについて書いたのですが、その元になる考え方の一つとして アンチフラジャイル(Anti-fragile)があります。

システムでも何でも、構造がシンプルで理解されているものについては、それに対する問題も 対応策が分かっており、既知の解法を適用すればOKという状態です。
運用であれば、リカバリ手順書が用意されているような環境ですね。

それに対して、複数のコンポーネントが互いに連携しあう複雑なシステムでは、そもそも解法が 存在しないどころか、問題の所在もはっきりしないという場合があるわけです。
状況を調査して、対応方法を徐々に探っていくアプローチになります。

このような「わからなさ度合い」を表すのに、Cynefin(カネヴィン)フレームワークがよく紹介されます。

  • 単純系(Simple) - 問題も解法もわかっている
  • 困難系(Complicated) - 分析すれば因果関係も構造も明確になるもの
  • 複雑系(Complex) - 因果関係が複雑で、やってみないと分からないレベル
  • カオス系(Chaotic) - 因果関係が見えず、突発的に発生した問題

と4つ(無秩序:Disorder を含めて5つという考えもある)に分類されます。

例えば、昨今の新型コロナでは、症状も感染力も未知数で、感染すると肺炎を悪化させて死に至ることもあり、 医療的な対処方法も不明。経済への影響も大きいといった初期のカオス系な段階から、 感染力は高いが多くが無症状。免疫系を制御する薬が重症化を防げるなどの知見が増えた、 複雑系な問題にに移行しつつあるといった感じでしょうか。

もう一つ、システムの堅牢性のレベル感については

  • フラジャイル(Fragile) - 大きな変化で大きな損害
  • ロバスト(Robust) - 大きな変化でも大きな損害を出さない
  • レジリエンス(Resilience) - 変化に強く、回復力が高い

などの言葉で紹介されます。最近はレジリエンスなシステムであることが良いといった感じに 運用の人も良く使っているかと思います。

そして「アンチフラジャイル」ですが、「障害は起きる」前提で、 変化や障害に対処できるシステムを作る考え方です。 事前でも事後でも、とにかく考えうる打ち手を試すといったアクションが、 カオス系の問題解決には求められるわけです。

アンチフラジャイルの実践としてのカオスエンジニアリングでは、 複雑系やカオス系のトラブルに対応するために、 意図的に限定的なトラブルを起こして、その挙動を調べます。
そして、起こりうる問題の因果関係を明らかにして、より強固にしていくといった方法論です。

まさに「失敗から学ぶ」「雨降って地固まる」を意図的に積み重ねていく考え方ですね。 状況が苦しい業界も多い昨今ですが、何とか次の飛躍の踏み台につなげようと 考えて行動していくのが、「アンチフラジャイル」な発想なのです。

コラム一覧
2022年
2022.03.31
春は引継ぎのシーズン
2022.03.24
「なぜなぜ分析」の使い方
2022.03.16
マルウェアEmotet再流行
2022.03.09
省エネモードのエンジニア
2022.02.24
ヒューマンエラーを防ぐには
2022.02.16
インフラ維持と式年遷宮
2022.02.09
Web3.0とP2Pの復権
2022.01.24
JIS規格に学ぶリスクマネジメン
2022.01.19
多すぎる通知の副作用
2022.01.12
2022年のインフラ技術
2021年
2021.12.29
今年もお世話になりました
2021.12.22
品質レベルはステージごとに変わる
2021.12.15
ログ出力ライブラリLog4j脆弱性の影響
2021.12.09
リモート作業の問題点
2021.11.24
メタバースに未来はあるか
2021.11.17
インシデントとの向き合い方
2021.11.10
DXは差別化要素を作るための投資という視点
2021.10.27
監視の拡張としてのオブザーバビリティ
2021.10.20
良い自動化、イマイチな自動化
2021.10.13
みずほ銀のトラブルから学ぶ
2021.09.29
クラウドDBで時短
2021.09.22
そろそろWindows 11が到来します
2021.09.15
トラブル対応の心がけ
2021.09.08
10/10は「デジタルの日」
2021.08.25
運用なき開発を避ける
2021.08.18
日本のDXの最前線
2021.08.12
DXとアジリティ
2021.07.14
ポストコロナで会議室が足りなくなる?
2021.06.30
自動化の技術選択
2021.06.23
業務の自動化は入り口にすぎない
2021.06.16
データ入力のお作法
2021.05.26
「苦労に価値がある」という価値感
2021.05.19
「運用でカバー」する公共システム
2021.05.12
VUCAの時代を生き抜くスキル
2021.04.28
デジタル敗戦からの復興はなるか
2021.04.21
PCの「基本的人権スペック」
2021.04.14
お勧め書籍「運用改善の教科書」
2021.03.31
運用スタッフの大部分はリモートワークへ
2021.03.24
定型業務をプログラマブルに
2021.03.17
監視疲れを起こさない工夫
2021.03.08
MSの無料RPAは自動化の起爆剤となるか
2021.02.22
終わりなき開発とインフラ運用
2021.02.17
作業を自動化しても業務が効率化しない場合
2021.02.10
Cocoaのバグが4か月も発覚しなかった話
2021.01.27
「クソどうでもいい仕事」を考える
2021.01.26
「クソどうでもいい仕事」を考える
2021.01.20
自動化の次の課題としてのAIOps
2021.01.13
DXレポート2が公開されました
2020年
2020.12.21
今年もお世話になりました。
2020.12.16
どうなる? 2021年のITインフラ
2020.12.09
アドベント・カレンダーの季節です
2020.11.11
AI・業務自動展で見聞きしたツライお話
2020.11.04
「7番セカンド」な仕事
2020.10.21
システム監視とアラート地獄
2020.10.19
機械学習とシステム運用
2020.10.14
形あるものは壊れる。システムも。
2020.09.30
技術ドキュメントの課題
2020.09.23
デジタル庁に寄せる期待感
2020.09.16
ローコード開発とエンジニア不要論
2020.09.09
技術の近未来予測とニューノーマル対応
2020.08.26
“アンチフラジャイル”な考え方
2020.08.19
カオスエンジニアリングという考え方
2020.08.12
運用が稼ぐ時代
2020.07.29
AIシステムの運用
2020.07.22
新宿に宿泊でTDLにGoToは対象外?
2020.07.08
チェック回数を増やしても意味がない
2020.06.24
「時代はクラウド」発言と政府インフラ
2020.06.17
システムの標準化とスキルセット
2020.06.10
「2025年の崖」からの転落事故
2020.05.20
先端IT“非”従事者は勉強不足 from IP
2020.05.12
スペイン風邪にみるコロナ第二波へ備
2020.04.30
「運用でカバー」という魔法の言葉
2020.04.26
未然に防いだトラブルは評価されにくい
2020.04.22
リモート勤務で重要性を増す「ゼロ・トラスト」セキュリティ
2020.04.15
オンラインイベント「Ops Summit2020」開催!
2020.04.15
コンサルは「標準化しろ」とは言うけれど
2020.04.08
オンライン”Zoom”会議のセキュリティー問題
2020.03.23
ドキュメントで見かける”Day 2オペレーション”
2020.03.18
今、売れまくっているITサービス
2020.03.11
出社している場合じゃないご時世
2020.02.26
新型コロナウィルス対策に学ぶトラブル対応
2020.02.19
バレンタインデーにシステム統合の本がバカ売れ
2020.02.12
ハイパーオートメーションの時代
2020.01.29
インフラ運用リーダーが備えるべき10の能力
2020.01.22
障害発生時の夜中に叩き起こす技術
2019年
2019.12.11
RPAとRBAと運用自動化
2019.12.11
年末年始に読む運用関連本
2019.11.27
業務フローの「こんまり」のお勧め
2019.11.20
「システム運用自動化」はスモールスタートで
2019.11.13
運用事故では人を責めない
2019.01.15
話題の「クラウドネイティブ」とは何か?