A不正解
その箇所のログ出力を増やす
ログ出力を増やすと障害の調査はしやすくなりますが、その箇所が壊れれば全体が止まる構造自体は変わりません。
停止リスクそのものを取り除けないため不正解です。
システム内に「そこが壊れるとシステム全体が停止してしまう箇所」が 1 つだけ存在します。信頼性を高めるために、この箇所に対して取るべき最も適切な対策はどれですか。
単一障害点(SPOF)に対する正しい信頼性対策を選ぶ問題。
その箇所のログ出力を増やす
ログ出力を増やすと障害の調査はしやすくなりますが、その箇所が壊れれば全体が止まる構造自体は変わりません。
停止リスクそのものを取り除けないため不正解です。
その箇所のインスタンスを大きくする
インスタンスを大きくすると処理能力は上がりますが、台数は 1 つのままです。
その 1 台が壊れれば全体が止まるため、単一障害点は解消されず不正解です。
その箇所の利用を一時的に停止する
必須コンポーネントの利用を止めれば、その機能自体が使えなくなります。
信頼性を高めるどころかサービスが成立しなくなるため不正解です。
その箇所を冗長化し、複数台・複数 AZ に配置する
正解。単一障害点(SPOF)は、その箇所を冗長化して複数台・複数 AZ に分散することで排除します。1 台が壊れても残りが処理を引き継ぐため、システム全体の停止を防げます。これが信頼性設計の基本です。
『そこが壊れると全停止』=単一障害点(SPOF)。対策は 冗長化(複数台・複数 AZ) が定石。大型化・ログ強化は SPOF を解消しない点に注意。