SLO

SRE転職

SRE技術面接で聞かれる質問と模範解答【SLO・インシデント対応編】

SRE転職の技術面接で、「SLOを設計した経験はありますか?」「インシデント対応のフローを説明してください」と聞かれて、頭が真っ白になった経験はないでしょうか。 このような質問は「知識を問う」のではなく、実際に現場で使えるかどうかを見極める...
AWS監視・オブザーバビリティ

CloudWatch SLI/SLO設計入門|Application Signalsでエラーバジェットを管理する方法

CloudWatchでアラームを設定しているのに、「どの障害が本当に重要か」「どこまで対応すれば十分か」の判断基準が曖昧なまま運用していませんか? 属人的な判断で優先度を決め続けると、軽微なアラートに深夜対応し、本当に重要なインシデントを見...
AWS監視・オブザーバビリティ

CloudWatch入門|SREが最初に設定すべき5つの機能と優先順位

CloudWatchの機能が多すぎて、何から設定すればいいかわからない——そう感じたことはないでしょうか。 「とりあえずデフォルトのアラームだけ入れた」という状態が続くと、障害が起きても検知が遅れ、深夜に手動でコンソールを確認することが常態...