障害訓練

SRE実務プラクティス

カオスエンジニアリング入門|AWS FISで障害訓練を自動化する方法をSRE視点で解説

「本番環境が壊れていないのに、本当に壊れた時に対応できると言えますか?」 システムの可用性を数値で語るSREにとって、これは避けられない問いです。99.9%のSLOを掲げていても、実際に障害が起きたとき想定通りに復旧できるかどうかは、訓練な...