クラウドPCにおける可用性ってなに?
という方もいるかも知れません。
SLAについても漠然と不安に感じているという方もいるかもしれません。
今回は「クラウドPCにおける可用性とSLAの基礎知識」についてお伝えします。
クラウドPCにおける可用性とSLAについて知っておきたいという方は記事を読んでみてくださいね。
クラウドPCにおける可用性とSLAを理解しよう。
クラウドPCにおける可用性とSLAの基礎をわかりやすく整理します。
SLAとはサービスレベルアグリーメントの略で、サービス提供者が保証する可用性や応答時間などの約束事です。
SLAは単なる数値ではなく、障害時の対応や補償の基準にも直結します。
可用性は一般に「稼働している時間の割合」で示されますが、どの計測方法を使うかで実際の意味合いが変わる点に注意が必要です。
可用性の基本概念
可用性の定義とSLAがどのように結びつくかを説明します。
可用性は一般に稼働時間を総時間で割った割合として表され、例えば99.9%という表記は年間での許容ダウンタイムを示唆します。
SLAは可用性以外にも応答時間や復旧時間の目標を含むことが多く、契約書に明記されます。
SLAが定量的であるほど評価やトラブル時の処理が明確になります。
SLAの重要用語
SLAでよく出る用語を解説しておきますね。
SLA(サービスレベルアグリーメント):提供者と利用者の合意書類のこと。
RPO:復旧時点の目標(データのどの時点まで戻すか)のこと。
RTO:復旧に要する時間の目標のこと。
可用性を左右する要因
可用性に影響する設計要素や運用要素を整理します。
- ネットワークの冗長化
- データセンターの分散
- ソフトウェアのフェイルオーバー設計
- 監視と運用体制
などが主要な要因になります。
これらが組み合わさって初めて高い可用性が実現されます。
可用性とSLAのチェックポイント
以下は、契約時に確認すべき主要項目になります。
- SLAが数値で明確に示されているか。
- ダウンタイムの計算方法が明記されているか。
- 補償の条件や手続きが具体的かどうか。
- 保守ウィンドウや予定停止の扱いが明確か。
- 監視と通知の仕組みが整備されているか。
可用性の測定方法
可用性の測り方と実務上の注意点を説明します。
可用性を測定する際は、観測ポイントや計測対象を明確にすることが重要です。
ネットワーク到達性、仮想デスクトップの応答、ログイン成功率など、何をもって「稼働」と判断するかを契約前に定めておくと認識齟齬を防げます。
指標の種類と意味
可用性を評価する代表的な指標の意味を解説します。
- 稼働率(アップタイム)
- 平均修復時間(MTTR)
- 平均故障間隔(MTBF)
などがあり、それぞれが異なる観点から運用状態を示します。
これらの指標は組み合わせて評価することで、より実態に即した可用性の把握が可能になります。
| 項目 | 意味 | 提示例 |
|---|---|---|
| 稼働率 | 期間中の正常稼働割合 | 99.95%(月間) |
| MTTR | 障害から復旧までの平均時間 | 30分 |
| MTBF | 故障間の平均稼働時間 | 720時間 |
計測で注意すべき落とし穴
可用性を計測する際の誤解や測定方法の違いによる影響を解説します。
監視間隔やタイムゾーン、保守予定が除外されるかどうかによって稼働率は大きく変わります。
また、エンドユーザーの体感と監視データが一致しない場合もあり、合意した計測ポイントを正しく運用することが重要です。
冗長化設計
クラウドPCの冗長化設計と可用性向上の方法を解説します。
冗長化は単に複製を作るだけでなく、障害発生時の切り替え手順やデータ一貫性の担保が重要です。
物理的な施設冗長、ネットワーク経路の冗長、仮想化レイヤーでの冗長など複数層での設計が求められます。
多重化の設計方針
どの層で多重化を行うか、優先順位の考え方になります。
データセンター間の冗長化は災害対策、ネットワーク冗長は通信障害対策、VMレベルの冗長は個別障害対策として機能します。
コストとリスクのバランスを取りながら、必要な可用性水準を満たす構成を選ぶことが重要です。
冗長化の比較表
以下は代表的な冗長化手法の特徴を示した表になります。
| 手法 | 利点 | 注意点 |
|---|---|---|
| リージョン冗長 | 大規模災害耐性が高い | データ同期遅延とコスト |
| アベイラビリティゾーン | 運用コスト控えめで可用性向上 | リージョン障害時は影響を受ける |
| VMフェイルオーバー | 個別障害に即対応可能 | 設定とテストが必要 |
運用面での冗長化運用
冗長化を維持するための日常運用のポイントを説明します。
※冗長化:障害時でもサービスが停止しないように、あらかじめ同じ機能を持つ予備設備などを準備して運用しておくこと。
- フェイルオーバーテストの定期実施
- 監視設定の整備
- 運用手順の文書化と担当者教育
などが重要になります。
設計どおりに切り替えられるかを保証するために、定期的な検証が必要になります。
障害対応計画
障害発生時の手順とSLAに基づく対応体制についてお伝えします。
障害対応計画は
発見→影響範囲の特定→復旧→報告
の流れを明確にしておく必要があります。
障害時の混乱を抑えるために、関係者の連絡網やエスカレーションルール、復旧手順を文書化しておくことが重要になります。
初動対応の流れ
障害検知から一次対応までの具体的な手順を示します。
監視アラートの優先度付け、インシデントチケットの発行、暫定対応と恒久対応の切り分けがポイントです。
初動を的確に行うことで被害の拡大を防ぎ、SLA違反のリスクを下げられます。
SLA違反時の補償例
SLAが破られた場合に想定される補償の例や算定方法を提示します。
※レンタルサーバーサービスでは、返金対応が一般的です。
- 可用性が保証値を下回った場合の料金返金。
- プロレート(比例配分)での返金計算。
- 追加の技術支援や改善計画の提供。
インシデント報告書の書き方
SLAに基づく報告書で押さえるべきポイントとして、
発生日時、影響範囲、原因分析、実施した対応、再発防止策、補償の有無とその根拠を明確に記載することが求められます。
透明性のある報告は利用者の信頼回復にもつながります。
契約と補償
SLAを契約書でどう表現し交渉するかについて解説します。
契約書に明記されるSLA条項は、曖昧さを避けるために定義や計測方法、報告頻度、補償方法を具体的にすることが重要です。
また、免責事項や天災などの不可抗力の扱いも確認しておきましょう。
契約時の交渉ポイント
サービス提供者に対して確認・交渉すべき具体的項目を示します。
可用性目標、除外条件、ペナルティの計算式、定期レポートの内容、オンコール体制の有無などを明文化することが重要です。
交渉時には自社の利用パターンや業務への影響度を伝え、現実的なSLAを設定しましょう。
補償の種類と考え方
補償の形態には返金、サービスクレジット、追加サポートなどがあります。
返金は直接的ですが限定的な場合が多く、サービスクレジットは将来利用と相殺できるため実務的です。
補償の実効性を確保するには条件や申請手続きの明確化が必要です。
契約チェックリスト
契約前に確認すべき項目を一覧で示します。
| 項目 | 確認ポイント |
|---|---|
| 可用性数値 | 測定方法と期間が明確か |
| 補償条件 | 計算方法と申請手順が明確か |
| 除外項目 | 保守や不可抗力の扱いが定義されているか |
品質保証の例
レンタルサーバーサービスを例に挙げると、
GMOインターネットグループ株式会社では、提供するサービスで以下のようにサービス品質保証制度(SLA)を導入しています。
お名前ドットコムデスクトップクラウドの場合
前述してますが、GMOインターネットグループの提供するFX専用VPSである「お名前.com デスクトップクラウド」もサービス品質保証制度(SLA)を導入しています。
お名前ドットコムデスクトップクラウドでは、各プランにおいて以下のように保証しています。
●品質保証値
サーバーの月間稼働率が99.99%以上であること。
●品質保証内容
稼働率が99.99%を下回った場合、サーバーの月額利用料金を規定の割合(以下参照)で返金または充当する、としています。
●返金率
稼働率が99.99%未満99.50%以上の場合:月額料金の10%
稼働率が99.50%未満の場合:月額料金の30%
月間稼働率 = (月間総稼働時間 – 累計障害発生時間) ÷ 月間総稼働時間 × 100お名前ドットコムデスクトップクラウド公式サイトより引用
もし障害などで稼働率が品質保証値を下回った時は、SLA適用申請書(PDF)に必要事項を記入してお客様センターにメールまたはFAXすることでSLAの適用を申請することができます。
適用となればサービスの利用料金が既定の返金率で返金または充当されるということになります。
クラウドVPS by GMOの場合
クラウドVPS by GMOの場合も、サービス品質の保証値は月間サーバー稼働率99.99%となっています。
サービス品質の水準:月間サーバー稼働率:99.99%
クラウドVPS by GMOの場合、
「サーバー稼働率が99.99%未満になった場合に、その事実を弊社に通知したお客様に対して、当月分の月間利用料金10%に相当する金額を返金」
するとなっています。
適用範囲は
(1) 基盤システムに障害が発生し、これにより仮想サーバーが稼働しなかった場合
(2) 当社で管理しているネットワークに障害が発生した場合クラウドVPS by GMO公式サイトより引用
としています。
※通知期限:障害復旧日から翌月の20日まで
ConoHa の場合
ConoHa by GMOは
- レンタルサーバー(ConoHa WING)
- VPS(ConoHa VPS)
- Windows Server(ConoHa for Windows Server)
- Game(ConoHa for GAME)
などのサービスを提供しているホスティングサービスになります。
ConoHaにもサービス品質保証制度(SLA)が導入されています。
●品質保証値:サーバーの月間稼働率99.99%
品質保証内容はサーバーの月間稼働率が99.99%を下回った場合に、既定の割合に相当する金額を、サービス利用権として付与する内容になっています。
●月額利用料金に対するサービス利用権付与率
稼働率が99.99%未満99.9%以上の場合:月額料金の10%
稼働率が99.9%未満の場合:月額料金の30%
※SLA適用申請はSLA適用申請書(PDF)に必要事項を記入しお客様センターまでメールまたはFAXで送信
関連記事
今回の記事の関連記事になります。
- クラウドPCで安全にリモートワークをするためのVPN活用ガイド
- GoogleドライブとクラウドPCの違いをやさしく解説
- クラウドPCで変わるリモートワークとオンライン会議のはじめ方
- VPSとクラウドの違いとレンタルサーバー選びのポイント
- クラウドPCで安心テレワークを実現するセキュリティ対策
- Xserver VPSが法人利用におすすめな理由
- クラウドPCで実現!快適テレワーク&コスト削減&効率化の裏技
- クラウドPCのテレワーク活用法 在宅勤務のコツ
- クラウドPCで実現する新しいテレワークの形
- Xserver VPSの障害対策で安心運用を実現するための5つのポイント
クラウドPCにおける可用性とSLAの基礎知識 まとめ
というわけで今回は「クラウドPCにおける可用性とSLAの基礎知識」についてお伝えしました。
SLAは単なる数値目標ではなく、可用性の定義、計測方法、補償、運用体制まで含めた包括的な合意である点を押さえましょう。
設計と運用を両輪で整備することで初めて実効性のある可用性が実現します。
というわけで、今回は以上になります。
最後までお読みいただきありがとうございました。
