SRE実務プラクティス インシデント対応フローの設計|検知から復旧・振り返りまでSRE流に解説
本番環境で障害が起きたとき、「誰が何をすべきか」が曖昧なまま動いていませんか。 アラートが飛んでくる。Slackが騒ぎ始める。でも初動で5分・10分と時間を無駄にし、気づいたら「誰かが対応してると思ってた」という状況——これはフローが設計さ...
SRE実務プラクティス
SRE実務プラクティス