ニュース

クラスメソッド システムの耐障害性を高める カオスエンジニアリングの手法を駆使

2020/05/22 09:00

週刊BCN 2020年05月18日vol.1825掲載

 クラスメソッド(横田聡社長)は、「カオスエンジニアリング」と呼ばれる手法で情報システムの耐障害性を高める提案に注力している。本番環境に意図的に運用操作の失敗や異常負荷などの障害を起こし、システムの回復力を測定。ユーザーの操作性や快適さを極力損なわないようシステムの回復力を高め、安定的な運用が可能なサービス開発に取り組んでいく。

佐伯恭平 ソリューションアーキテクト

 カオスエンジニアリングでは、障害から回復する仕組みを構築しつつ、ある範囲に限定して意図的な障害を起こすことで、システムの回復力を試す。問題が発生するようであれば、問題点を見つけ出し改善につなげる。ただし実際は、意図的な障害を起こした結果、システム的には止まっていなくてもユーザーから見ると使い物にならないほどパフォーマンスが落ちていたり、反対にシステムに問題が起きてるにもかかわらずユーザーがそれに気づかないといったギャップが生じるケースも多かった。そのため、企業の基幹業務システムなど重要性が高い分野であればあるほど「本番環境に負荷をかけられないジレンマ」(佐伯恭平・AWS事業本部コンサルティング部ソリューションアーキテクト)があり、カオスエンジニアリングの手法を導入しづらいという課題があった。

 そこで同社はこのギャップを埋めるべく、システムの稼働環境をエンド・トゥ・エンドで観測してボトルネックを可視化するとともにパフォーマンスを管理できる米New Relicのツールを活用することにした。New Relicは「カオスエンジニアリングによって発生するユーザー体験を、エンドユーザーの視点に立って観測・可視化するプラットフォームの部分を担う」(New Relic日本法人の宮本義敬副社長)構図だ。これにより、システム障害がエンドユーザーに及ぼす影響を測定しつつ、業務の円滑な遂行を損ねない範囲でカオスエンジニアリングを行うことが可能になったという。

 昨年起こったAWSの大規模障害では、障害からの回復機能が正常に動作したサービスは継続でき、そうでないシステムは停止に追い込まれた。その差が明確になったことで、特にパブリッククラウドを使っているシステムの回復力に注目が集まっている。「システムの回復力を高め、仕事の中断や生産性の低下を未然に防ぐサービスを一段と拡充する」(武田信夫・AWS事業本部パートナーアライアンス部マネージャー)ことでクラスメソッドはビジネスを伸ばす。(安藤章司)
  • 1

外部リンク

クラスメソッド=https://classmethod.jp/