サーバー障害はなぜ起こる?6つの原因と対策、トラブル事例も紹介
こんにちは。Wakka Inc.のWebディレクターの安藤です。
近頃、サーバー障害によって業務が滞ったりサービスが利用できなくなり、話題となるケースが増えています。この記事では、サーバーの仕組みやサーバーの種類、障害の原因、トラブル事例などを詳しくご紹介します。
「サーバー障害はなぜ起こるのか?サーバー障害を防ぐ方法はないのか?」
「自社サーバーを構築したいが、安定して運用できるか不安がある」
そのような悩みをお持ちの場合には、ぜひご参考になさってください。
Wakka.IncではヘッドレスCMSの導入を支援しています。
ヘッドレスCMSの導入においてサーバーの準備は悩みの種です。ヘッドレスCMSのインフラ環境の構築例や、サーバー調達時に必要になる情報はヘッドレスCMSのサーバー準備ガイドをご確認ください。
【おすすめ資料】10分でわかる、ラボ型開発ガイドブック
忙しい方でもサクッと読んでいただける内容にまとめた、ラボ型開発のコンパクトガイドブックです。 いまさら聞けないラボ型開発と他の開発手段の違い、それぞれのメリット・デメリットを分かりやすく説明しています。
サーバーの仕組みと種類
「そもそもサーバーとはどのようなものを定義するのだろうか?」サーバーという言葉自体は聞き慣れていても、具体的な定義や仕組みまでは理解されていない方も多いのではないでしょうか。
まずは「サーバーとはどういうものか?」「どのような働きをしているのか?」を詳しく解説します。
サーバーとは?
サーバーとは、もともとServeという英語から派生した言葉です。
Serveには提供するという意味があり、Serverは利用者の要求に応じて必要なものを提供する人(給仕人)を指します。コンピューター用語では
- ネットワーク上で、情報を必要に応じて提供する側をサーバー
- データを利用したいと要求する側をクライアント
と定義します。サーバーには扱う情報によってさまざまな種類があり、
- Webページを閲覧する
- SNSを閲覧、投稿する
- メールを送受信する
など、ありとあらゆるシステムやアプリの土台として利用されているのです。
物理サーバーと仮想サーバー
コンピューター上で使われるサーバーは、大きく分けて物理サーバーと仮想サーバーの2種類です。物理サーバーは、実際のコンピューター上にサーバーが構築されている状態を指します。
物理的に構築されているサーバーをユーザー1名で利用もできますが、他のユーザーとの共用も可能です。
単独で利用する場合は専用サーバー、共用で利用する場合は共用サーバーと呼ばれます。
仮想サーバーは、物理サーバーのなかに仮想空間を構築し、複数のユーザーで利用するサーバーです。このようなサーバーはVPS(Virtual Private Server)と呼ばれます。
クラウドサーバー
クラウドサーバーとは、インターネット上のネットワークをクラウド(雲)と捉え、ネットワーク上に構築されたサーバーのことを指します。
VPSとクラウドサーバーは似たような概念ですが、クラウドサーバーのほうが構築の自由度が高いです。クラウドサーバーでよく使われるサービスは
- IaaS(Infrastructure as a Service)
- PaaS(Platform as a Service)
といったサービスです。IaaSはインターネット経由でインフラを利用することを指します。
代表的なものとして
- 仮想サーバー
- 高速ネットワーク通信
- ストレージ
など、システムの基幹部分であるインフラを自身で所有しなくても、必要な機能だけを利用できます。建築に例えると、土地の区画整理、整地などを行なったあとで、建築を進めていく状況に似ているでしょうか。
土地の選定から始まり、区画整理も行っていくので、サービスの構築自由度が非常に高いのが特徴です。
PaaSはシステムを構築するためのプラットフォームを利用することを指します。
ソフトウェアやシステムの開発環境はすでに構築できているので、開発環境の構築に時間を割かなくても開発に注力できるのが特徴です。
建築に例えると、土地の区画整理はもうすでに終わっていて、すぐにでも建築可能な状況に類似しています。区画整理には膨大な時間がかかるので、建築をスタートする時間を短縮できるのがメリットです。
ただし土地の選定はできませんので、IaaSより自由度は低くなります。クラウドサーバーのユーザーはメンテナンスなどを業者に任せられるため、導入や運用が非常に簡単です。
そのため、昨今ではクラウドサーバーの利用が急速に広がっています。
サーバーの種類 | 物理サーバー | 仮想サーバー(VPS) | クラウドサーバー |
構築方法 | サーバー専用機に構築 | サーバー専用機の中に仮想サーバーを構築 | ネットワーク上にサーバーを構築 |
コスト | × | ◎ | ◯ |
性能 | ◎ | ◯ | ◯ |
災害発生時にリスクの軽減効果があるか | × | △ | ◎ |
サーバーとPCの違い
サーバーの実機とPCを実際に見比べてみると「見た目が似ていて、どのような違いがあるかわからない」という方も多いかもしれません。
サーバーとPCは、何が違うのでしょうか?サーバーを構成するパーツは、
- マザーボード
- CPU
- メモリ
- 電源
- HDD(SSD)
など普通のPCとあまり変わりはありません。サーバーはPCよりもはるかにハイスペックなマシンであるかのように感じますが、サーバー専用機に求められる機能はスペックだけではありません。
サーバー専用機とPCではどのような違いがあるのかを解説いたします。
安定運用が必要
PCは、使わないときには電源を切るなど、常に稼働する状況は想定していませんが、サーバー専用機は24時間の常時稼働が求められます。
例えばECサイトを運営している場合、サーバーの稼働状態によってユーザーがECサイトにアクセスできなくなるのは、売上にも直結する死活問題です。
サーバー専用機は24時間常に稼働しなければならないので、PCよりも耐久度を大幅に上げる必要があるのです。PCと同様サーバーを構成しているパーツは熱に弱い傾向があるため、十分な排熱の管理も必要でしょう。
万が一に備えてのバックアップ用のHDDなども実装されているケースが多いです。
単独サーバーとして使う場合はもちろん、共用サーバーとして用いられる場合にはより安定した稼働が求められるでしょう。
複数のユーザーがサーバーを利用している場合、同サーバーにアクセスが集中しないように、分散させる措置も必要になります。このように、サーバー専用機には高い耐久性と安定稼働が求められる点が、PCとサーバー専用機の大きな違いです。
OSの違い
サーバー専用機には、一般的にPCで使われているWindowsOSやMacOSなどのOSではなく、専用設計のOSが使われます。
一般のPCで使われるOSは、一人のユーザーが使うことを想定しているため、ユーザーの使いやすさ、見た目などを重視して設計されています。
サーバー専用のOSは一人のユーザーが利用することは想定されておらず、耐久性や安定性を重視して設計されているのです。そのためOSによっては、テキストで操作するのがメインとなるため、初心者には扱いにくいかもしれません。以下の2つが、代表的なサーバー専用OSです。
WindowsサーバーOS
PCでのOSシェア率は圧倒的なWindowsOS。
現在利用されるPCの8割近くがWindowsOSで稼働しています。WindowsサーバーOSはWindowsOSと同様の操作感で利用できるため、初心者でも無理なく操作できるのが特徴です。
マニュアルや入門書など必要な情報も得やすいため、安定的に運用できるでしょう。WindowsサーバーOSは利用するためにライセンス契約をする必要があり、システムを構築する費用が高くなるのがデメリットです。
Linux系サーバーOS
Linux系サーバーOSは、WindowsサーバーOSと違いライセンス契約をする必要がありません。オープンソースであるため、システムの構築を安価に行えるのです。
サーバーの台数が多くなればなるほどオープンソースの利点を活かせるので、PCと違いサーバーのOSはLinux系OSのシェアが高くなっています。
しかし、WindowsサーバーOSと違い、テキストベースでの操作がメインなので、初心者が運用するのは難しいかもしれません。
PCをカスタマイズしてサーバーにできるか
PCとサーバーはよく似ているとご説明しましたが、PCをサーバーとして利用することはできるのでしょうか?結論から言うと、PCをカスタマイズしてサーバー機として利用することは可能です。
PCのOSをサーバーOSに切り替えることで、サーバー機として機能します。サーバーとして利用するのは可能ですが、耐久性に不安があり、安定的に稼働できるとは限りません。
- 大規模な外部からのアクセスに耐えられる
- 24時間365日安定的に稼働できる
など、サーバーとして求められる機能を存分に果たすことはできない可能性が高いでしょう。PCをカスタマイズしてサーバーとして利用するのは、個人的な利用にとどめたほうが無難です。
サーバー障害の原因
サーバーは、安定的に運用することを主眼にハードウェアを設計し、適切なOSが組み込まれています。しかし、それでもサーバー障害は起こってしまうのです。
なぜサーバー障害は起こるのでしょうか?代表的な6つの原因について解説します。
アクセス過多
外部からのアクセスを効率的に処理できるサーバーですが、一時的にアクセスが過剰となると、リクエスト処理が追いつかなくなるケースがあります。
段々と処理が遅くなり、サーバーが落ちてしまう、いわゆるサーバーダウンが発生することもあるのです。ECサイトでは、集客施策が成功しアクセスが殺到することによる、サーバーダウンが発生するケースもあります。
チケットの予約などでは、販売開始とともにアクセスが殺到し、サイト自体にアクセスができなくなるケースも珍しくありません。
アクセスが集中すること自体は、売上の向上に貢献するため喜ばしいことです。しかし、サーバーダウンしてしまうことで機会損失やブランドの失墜にもつながる恐れがあります。
トラフィックを分析し、そこまでアクセスが増加していないのにサーバーダウンしてしまう場合は、サーバー自体のスペックに問題が潜んでいるかもしれません。場合によっては、メモリの増設などによりスペックの強化を図る必要があるでしょう。
また、レンタルサーバーなどの共用サーバーの場合、ユーザーの同時接続数(同時アクセス数)に制限を設けている場合があります。
既定の同時接続数を超えるとページに503エラーが表示され、ユーザーがサイトやサービスを利用できなくなってしまいます。共用サーバーを利用する際には特に注意したいポイントです。
サーバーの物理的障害
PCよりも高い耐久性をもつサーバーですが、パーツの劣化は避けられません。特にサーバーを構成するパーツは熱に弱く、耐久年度はおおよそ5年程度とされています。
パーツを交換すればサーバーの寿命はのばせるかもしれません。
しかし耐久年度を大幅に超えた運用は、サーバーを安定させるのが難しくなるため、計画的にサーバー本体を交換する必要があるでしょう。
サイバー攻撃
Webサーバーや自社サーバーに、大量かつ集中的にアクセスすることでサーバーダウンを狙う手口をサイバー攻撃と呼びます。サーバーにはアクセスを分散させるシステムがあり、ある程度のアクセスが集中しても耐えられます。
しかし、USB、メールなどからPCがウイルスに感染してしまうことで、外部からサーバーに攻撃を仕掛けられるケースもあるのです。
- DoS(Denial of Service attack)……PC単体でサーバーに攻撃する
- DDoS(Distributed Denial of Service attack)……複数のPCでサーバーに攻撃する
以上がサーバーに負荷をかける代表的なサイバー攻撃です。またF5アタック※など、サーバーに負荷を与える手口も、サイバー攻撃の一種とされます。
サーバーに負荷をかける手口だけがサイバー攻撃ではありません。近年ではユーザーのデータを人質にとるランサムウェアという手口が話題になっています。
データを暗号化し、解除と引き換えに身代金の支払いを要求する手法です。個人だけでなく、病院などの公益性が高い施設への攻撃も増えており、社会問題化しています。
DDoSやランサムウェアは、社外から社内の専用回線にアクセスできるVPN環境から侵入される可能性が高いです。
VPN回線の脆弱性を放置するのではなく、高いセキュリティーの状態を保つ必要があります。
※F5アタック……キーボードの「F5」キーを連打して、サーバをダウンさせる攻撃
自然災害
クラウドが主流になりつつある中でも、サーバーを自社の施設内に設置している企業は、いまだ少なくないのではないでしょうか。昨今は、水害や土砂崩れなどの自然災害が頻発しています。
また火山の噴火や地震などはいつ起こるか予想できません。自社と同時にサーバーが自然災害に巻き込まれてしまうと、データを利用できないだけでなく、データそのものを失ってしまう恐れがあります。
自社機能だけでなくサーバーもロストしてしまうと、企業として取り返しのつかない事態に発展する危険性もあるのです。そのため、
- AWSなどのクラウド技術を活用する
- サーバーをデータセンターに移設する
などの対策を取るケースが増えています。BCP(事業継続計画)の観点からも、災害やテロに強いサーバー環境の構築は重要な課題です。
ソフトウェアの不具合
サーバーでは様々なサービスを提供するために、多くのソフトウェアが稼働しています。ソフトウェアのアップデートやなんらかの不具合により、サーバーに負荷を与える可能性も捨てきれません。
高負荷によりサーバーの処理能力を超えてしまうことで、サーバーダウンが発生するケースもあるのです。
ソフトウェアのアップデートやバグは実装前のテストやデバッグなどである程度回避できますが、完全に防ぐのは難しいでしょう。
人為的ミス
自社でサーバーをメンテナンスしているような場合に多いのが、人為的ミスによるサーバー障害です。
必要なファイルを誤って削除してしまいデータを利用できるだけでなく、ときにはサーバーそのものが動かなくなる場合もあります。
【おすすめ資料】10分でわかる、ラボ型開発ガイドブック
忙しい方でもサクッと読んでいただける内容にまとめた、ラボ型開発のコンパクトガイドブックです。 いまさら聞けないラボ型開発と他の開発手段の違い、それぞれのメリット・デメリットを分かりやすく説明しています。
サーバー障害のトラブル事例
サーバー障害により、実際どのようなトラブルが発生しているのでしょうか。近年発生した障害の中で代表的なものをご紹介いたします。
金融システム
2021年3月末、地方銀行の数行でATMやネットバンキングが使えなくなるなどのシステムトラブルが発生しました。トラブルの原因は、サーバーに電力を供給する電源の不具合。
データセンターに設置しているバックアップ用の電源への切り替え装置が停止したことで、10時間にわたるシステム障害につながりました。
金融業界では経費削減のため、サーバーを共同利用するケースが進んでいます。しかし、データバンク*を利用するリスクが浮き彫りとなり、リスクの回避は各銀行の課題となっています。
※データバンク……種々のデータを収集・保管し、必要に応じて検索・利用できるシステム
AWS
AWS(Amazon Web Service)はクラウド型の仮想サーバーを作成、利用できるサービスです。
ほとんど初期費用をかけずに柔軟なクラウド型サーバーを構築できるため、近年多くの企業が利用しています。クラウドサーバーは物理サーバーと比べ、電源喪失や自然災害のリスクが低いです。
このため、物理サーバーよりクラウドサーバーのほうがサーバー障害が起きにくいとされています。しかし、AWSは過去に何度かサーバー障害を起こしています。
- 冷却装置の故障
- 人為的ミス
- ユーザーの急激な利用増加によるサーバー負荷増
物理サーバーと同じような原因でサーバー障害が発生しているのです。
AWSは低価格で高性能なサーバーを利用できます。しかし障害がまったくないわけでないので、安定的な運用をめざすならばサーバー障害の対応を講じる必要があるでしょう。
サーバー障害の対策
さまざまな原因でおこるサーバー障害は、どのように回避すれば良いのでしょうか。代表的な手法を4つご紹介いたします。
予備サーバーの設置
障害が発生した際に即時復旧できる予備用のサーバーを設置すれば、サーバー障害のリスクを大きく下げられます。
メインサーバーで動いている基幹システムが障害によって利用できなくなると、企業にとって致命的なダメージを負いかねません。予備サーバーで基幹システムを動かしながら、メインサーバーの復旧作業もできるはずです。
メイン、予備同時に使えなくなるケースも想定されますが、1台構成の場合よりもリスクははるかに軽減されるでしょう。サーバー1台構成の場合は、まず予備サーバーの設置を検討しましょう。
クラウドサーバーの利用
予備サーバーの設置と同時にクラウドサーバーの導入も検討しましょう。予備サーバーの設置は費用が高額となるケースもあるため、企業によっては設置が難しい場合もあるでしょう。
その場合はクラウドサーバーの利用がおすすめです。
高性能なサーバーを必要な容量に応じて利用できるため、予備サーバーを設置するよりも低コストでサーバー障害対策ができるのです。
また、自然災害対策(BCP対策)になることも、クラウドを活用する企業が増えている理由のひとつです。クラウドサーバーは一般的に、自社と離れている場所にデータセンターを配置します。
そのため、「自社サーバーが災害で大きな被害を受けたが、クラウドサーバーにバックアップされたデータは無事だった」といったケースもあるでしょう。
監視システムの導入
外部要因や物理サーバーの故障などでサーバー障害が起きやすい場合は、監視システムの導入をおすすめします。
サーバーは24時間の稼働が求められるため、サーバーの異常状態の検知を人力で監視すると相当な負担がかかるでしょう。アクセス過多やサーバー負荷増などの異常があれば、メールで担当者に伝えてくれます。
またサーバーの物理的な故障や、サイバー攻撃の形跡や侵入経路などもログ管理できるため、より安定的にサーバーを運用できるのです。
ロードバランサーの導入
サーバーを複数導入している企業の場合は、ロードバランサーの導入も検討しましょう。ロードバランサーとは、負荷分散装置とも呼ばれ、外部からの通信を複数のサーバーに分散できるシステムです。
ロードバランサーを導入すれば、Webサイトへのアクセスが急増した場合も、一部のサーバーに負荷がかかるのではなく、複数のサーバーに負荷を分散してくれます。
クライアントからの要求が過多になると、サイトの表示スピードが遅くなる恐れがあります。
Webサイトを訪問したユーザーは使いにくさを感じ、ページから離脱してしまうかもしれません。ロードバランサーの導入は、サーバー障害を防ぐだけでなく、サーバーを効率的に使用するにも役立つのです。
まとめ:自社でのサーバー構築にこだわりたい場合は、経験豊富なベンダーに相談を
今回は、サーバーの仕組みやサーバー障害の種類、障害への対策についてご紹介しました。現在、利用されるサーバーの種類は、クラウドサーバーが主流となってきています。
しかし、自社の基幹システムを外部に公開せずに、オンプレミス型で構築したいという需要もあるのは確かです。サーバーの安定的な運用、管理は経験豊富なベンダーに相談するのが近道でしょう。
また現在あるサーバーを安定的に運用したい場合も、一度ご相談いただくとトラブル解決のヒントを得られるかもしれません。サーバー障害を防ぐためにも、まずは専門家に相談されてみてはいかがでしょうか。
【おすすめ資料】10分でわかる、ラボ型開発ガイドブック
忙しい方でもサクッと読んでいただける内容にまとめた、ラボ型開発のコンパクトガイドブックです。 いまさら聞けないラボ型開発と他の開発手段の違い、それぞれのメリット・デメリットを分かりやすく説明しています。
学生時代にWebサイトを自作したことがきっかけでWebの世界に。制作会社でデザイン、WordPressテーマ開発の実務を経て、テクニカル・ディレクターとして大規模サイト構築のディレクションを経験。2021年からWakka Inc.の日本拠点でWebディレクターとして参画。最近はブロックエディタになったWordPressをもう一度、勉強しています。