VPS

サーバーの生存確認をしてサーバー落ちを検知しよう

サービスを運営していると重要な仕事になるのが「サーバーのダウン回避」です。今回は、サーバーの生存確認をしてサーバー落ちを検知する方法をまとめました。

外部サービスを使う

Site24x7

オフィス向けクラウドを展開するZOHOの監視サービスです。本来は有料サービスですが、無料でも使うことが可能です。

サイトごとに生存確認の周期など細かい設定をしたり、週次でレポートを送ってくれたりと、十分すぎる機能があります。生存確認方法も単純にURLアクセスして確認する方法からサーバーにインストールする方法まで様々なので、サーバーの生存確認をするのであればファーストチョイスでしょう。

Site24x7

Google Cloud Scheduler

Google Cloud Platformのcronジョブを実行できるサービスです。毎月3ジョブまで無料で使えます。無料枠以降は1ジョブあたり0.1ドルです。

Google Cloud Scheduler

オンプレミスやVPSなど自前のサーバーでも同じことはできますが、Google Cloud Platformなので「ほぼほぼ落ちない」というのが最大のメリット。安心してジョブを預けられるというのは、サーバーの生存確認においては重要です。

ただし、ジョブの実行ログについてはCloud Loggingから取得する必要があるため、メールでの通知などは他のサービスと組み合わせて構築する必要があります。

サーバーにインストールする

netdata

サーバーに生存確認機能を追加するなら、OSSのnetdataがオススメです。

netdata

netdataなら、サーバーの負荷をリアルタイムで監視ができるほか、メールを送信したりSlackなどに通知を出すことも可能です。

サーバーレスでも生存確認をしよう

一般的にサーバーの生存確認はVPSなどの専用サーバーで行うことが多いですが、サーバーが落ちることがほぼサーバーレスを使う場合も生存確認はした方がベターです。

というのも、サーバーレスでも、プログラムのミスや設定ミスなどで500番エラーを出してしまうことがあるので、意外と「サーバー自体は生きているけど、サイトとしては落ちてた」ということがおきます。

特に、ユーザー認証やユーザーデータを管理するAPIなどは、落ちると大きな問題になるので、APIごとに生存確認をすると良いでしょう。


サーバーの生存確認についてみてきました。

サイトやAPIにおいてサーバーが確実に稼働させるのは至上命題ですが、万全の準備をしていてもどうしてもサーバーが落ちるというのは起こり得ます。

サーバーダウンが長引くと大きなトラブルの原因になりますので、1秒でも早くダウンを復旧させるためにもサーバーの生存確認はしっかりするようにしましょう。


価格は記載がある場合を除き、すべて税抜きです。

この記事の関連キーワード

VPSの記事