インシデント対応
Incident Management
Incident Response
障害対応
インシデント?
サービスの計画外の中断
サービスの品質の低下
チーム編成
- 指揮者: 状況把握、指揮系統を握る
- 連絡係: ステークホルダーに最新状況を共有する。窓口。
- 記録係: 事象や対応内容を時系列で記録する
- 実行担当: 解決に向けて対応する。ドメインエキスパート
軍事的な隊の組織編成が参考になると思った。
対応の優先度
- 止血
- 回復
- 証拠の保存
ポストモーテム
発生事象のフォローアップ
目的
- 発生した問題を理解する
- 原因を分析して再発を防ぐ