SRE技術

AWS監視・オブザーバビリティ

AWS X-Rayとは?分散トレーシングの仕組みと設定手順【入門ガイド】

マイクロサービス構成で障害が起きたとき、「どのサービスでエラーが発生したのか」を特定するのに何時間もかかった経験はないでしょうか。 ログを各サービスで個別に確認し、タイムスタンプを突き合わせ、原因にたどり着く頃には深夜になっている——このよ...
AWS監視・オブザーバビリティ

CloudWatch Syntheticsで死活監視を自動化する方法【SRE実践ガイド】

AWSのメトリクスやログを監視しているのに、ユーザーからの「サイトが落ちています」という報告で初めて障害に気づいた——そんな経験はないでしょうか。 CloudWatchでCPU使用率やエラー率を監視していても、実際にユーザー目線でサービスに...
AWS監視・オブザーバビリティ

CloudWatch SLI/SLO設計入門|Application Signalsでエラーバジェットを管理する方法

CloudWatchでアラームを設定しているのに、「どの障害が本当に重要か」「どこまで対応すれば十分か」の判断基準が曖昧なまま運用していませんか? 属人的な判断で優先度を決め続けると、軽微なアラートに深夜対応し、本当に重要なインシデントを見...
AWS監視・オブザーバビリティ

CloudWatchダッシュボードの作り方|SREが最初に作るべき5種類とウィジェット設定

CloudWatchにメトリクスやアラームを設定したのに、障害が起きると「どの画面を見ればいいか」を探すところから始まっていませんか? サービスごと・担当者ごとにバラバラなダッシュボードが乱立し、インシデント発生時に「あの数値はどこで確認で...
AWS監視・オブザーバビリティ

CloudWatch Logs Insightsクエリ入門|SREがよく使うパターン10選

本記事では、Amazon CloudWatch Logs Insightsのクエリ構文と、SRE実務でよく使うパターン10選を解説します。 この記事でわかること CloudWatch Logs Insightsの基本クエリ構文(fields...
AWS監視・オブザーバビリティ

CloudWatch Logsの使い方完全ガイド|SREが実務で使うログ監視・Insights分析

本記事では、Amazon CloudWatch Logsの基本設定からCloudWatch Logs Insightsを使った実務的なログ分析まで、SRE視点で解説します。 この記事でわかること CloudWatch Logsのロググループ...
AWS監視・オブザーバビリティ

CloudWatchアラートの設定方法|閾値・通知先をSRE視点で設計する手順

CloudWatchのアラームを設定したものの、誤検知が多くて通知を無視するようになっていませんか? 「とりあえずCPU使用率が80%を超えたらアラート」という設定を入れたまま放置していると、業務時間中に毎日アラートが飛んでくるようになりま...
AWS監視・オブザーバビリティ

CloudWatch入門|SREが最初に設定すべき5つの機能と優先順位

CloudWatchの機能が多すぎて、何から設定すればいいかわからない——そう感じたことはないでしょうか。 「とりあえずデフォルトのアラームだけ入れた」という状態が続くと、障害が起きても検知が遅れ、深夜に手動でコンソールを確認することが常態...
セキュリティ・コスト最適化

【IT初心者向け】AWSでできることとは【AWS学習開始前に知っておくべき】

AWS
セキュリティ・コスト最適化

【AWS初心者向け】Amazon Linux の特徴【RHELとの違いを知る】

CentOSやRedhatをAmazon Linuxに置き換えた時の影響を知りたい このような疑問にこたえます。 本記事を読むことでAmazon Linuxの業務導入を検討できるレベルを目指せる記事になっています。 Amazon Linuxの特徴がわかる Amazon Linuxの利用用途が分かる