オブザーバビリティ

AWS監視・オブザーバビリティ

AWS X-Rayとは?分散トレーシングの仕組みと設定手順【入門ガイド】

マイクロサービス構成で障害が起きたとき、「どのサービスでエラーが発生したのか」を特定するのに何時間もかかった経験はないでしょうか。 ログを各サービスで個別に確認し、タイムスタンプを突き合わせ、原因にたどり着く頃には深夜になっている——このよ...
AWS監視・オブザーバビリティ

CloudWatch SLI/SLO設計入門|Application Signalsでエラーバジェットを管理する方法

CloudWatchでアラームを設定しているのに、「どの障害が本当に重要か」「どこまで対応すれば十分か」の判断基準が曖昧なまま運用していませんか? 属人的な判断で優先度を決め続けると、軽微なアラートに深夜対応し、本当に重要なインシデントを見...
AWS監視・オブザーバビリティ

CloudWatchダッシュボードの作り方|SREが最初に作るべき5種類とウィジェット設定

CloudWatchにメトリクスやアラームを設定したのに、障害が起きると「どの画面を見ればいいか」を探すところから始まっていませんか? サービスごと・担当者ごとにバラバラなダッシュボードが乱立し、インシデント発生時に「あの数値はどこで確認で...
AWS監視・オブザーバビリティ

CloudWatch Logs Insightsクエリ入門|SREがよく使うパターン10選

本記事では、Amazon CloudWatch Logs Insightsのクエリ構文と、SRE実務でよく使うパターン10選を解説します。 この記事でわかること CloudWatch Logs Insightsの基本クエリ構文(fields...
AWS監視・オブザーバビリティ

CloudWatch Logsの使い方完全ガイド|SREが実務で使うログ監視・Insights分析

本記事では、Amazon CloudWatch Logsの基本設定からCloudWatch Logs Insightsを使った実務的なログ分析まで、SRE視点で解説します。 この記事でわかること CloudWatch Logsのロググループ...
AWS監視・オブザーバビリティ

CloudWatch入門|SREが最初に設定すべき5つの機能と優先順位

CloudWatchの機能が多すぎて、何から設定すればいいかわからない——そう感じたことはないでしょうか。 「とりあえずデフォルトのアラームだけ入れた」という状態が続くと、障害が起きても検知が遅れ、深夜に手動でコンソールを確認することが常態...