※1 Site Reliability Engineering(サイト信頼性エンジニアリング)
――皆さんの担当業務と本プロジェクトの起点となった業務課題について教えてください。
中川
私は現在、ある大手製造業のお客さまで稼働中の複数のクラウドシステムの運用管理を担っています。今回HARCのコンサルティングを受けたのはそのうちの1つで、製品に組み込まれたソフトウェアを遠隔で更新するためのシステムです。
松本
私も同じ大手製造業のお客さまに対して、特定の情報コンテンツを配信するシステムの運用を担当しています。担当システムこそ違いますが、中川さんと立ち位置は同じです。
白井
私は2023年の6月末にリリースされたHARCの立ち上げに参画しました。HARCはクラウドシステムの運用変革を支援するサービスで、そのベースとなっているのが現在欧米において主流となりつつある「SRE」という新しい方法論です。現在はHARCのソリューションアーキテクトとして、各種サービスの設計開発やデリバリーなどを担当しています。
個別最適化から全体最適化へ運用改善スコープの遷移
松本
中川さんと私が担当するお客さまではすでに複数のクラウドシステムが稼働しており、今後も新しいシステムが順次追加される見通しですが、各システム単位での個々の運用改善はもう限界を迎えつつあるという危機感が私たちにはありました。そこで、例えばセキュリティパッチの適用やテスト環境での検証作業といったそれぞれのシステム運用業務に関するプロセスやルールを統合していきたいと考え、私たちはチームを組むことにしました。複数システム間の共通解を踏まえた運用に関するベースを統一しておけば、将来、対象システムが増加してもより効率化できるからです。
中川
システムごとに開発者も運用担当者も違う場合、どうしても個別最適化が進んでしまい、結果的に業務の属人性が高まります。IT業界でも人手不足が深刻化している昨今、人に依存するシステム運用はリスクとなるため、運用から属人的業務を極力排除し、人員が変わっても対応できる仕組みにしていく重要性は理解していました。しかし、その方法論を自分たちだけで考えるには限界を感じていたのです。加えてコストの問題もありました。一般にシステムが稼働して安定期に入ると、お客さまから「コストを抑えてほしい」と求められる。しかし、すでに安定状態に入ったシステムの運用をあえて改善して求められる効果を上げるには手間と時間がかかってしまうものです。そこで今回もお客さまからコスト削減を要求される前に先手を打っておきたいと私たちは考えました。
意外と身近にあった課題克服への最適解
――HARCに着目された経緯を教えてください。
松本
当初は複数システムの運用統合を前提に各システムに共通する解を求めて模索している状況でした。中川さんと2人でさまざまなアイデアをぶつけ合って議論したり悩んだりしていたのですが、そんな時に見つけたのがHARCだったのです。
中川
複数のベンダーが既存システムの運用改善サービスや運用統合管理ツールなどを提供していますが、なかなかこれというものを見つけられません。そんな時、何気なくアクセスした日立のナレッジ共有サイトに紹介されていたのがHARCでした。そしてそこには、複数のクラウドシステムの運用を統合した成功事例が掲載されていた。同じ日立にこんなサービスがあることすら知らなかったのですが、HARCの詳細資料は具体性に富んだ共感できる内容だったのです。当初探していた外部ではなく、こんな身近なところに有望なアイデアがあったことは驚きでした。
懸念を解いたHARCの精緻なアプローチ
――HARCによる運用改善プロジェクトはどのように進められましたか。
白井
まず、計5週間にわたって「マチュリティ・アセスメントサービス」と呼ばれる、クラウド運用のあるべき姿とお客さまの現状とのギャップ分析を行うアセスメントから提供しました。共有いただいた設計資料を事前にチェックして疑問点を洗い出し、深堀りする事項を選定したうえで、計6日間のインタビューを通して詳細を聞きました。
松本
同じ日立ではありますが、最初はHARCもよくあるごく表面的なことをなぞるだけのサービスかもしれないという疑念が私にはありました。
中川
私も、もし安易なサービスなら見送ろうと考えていました。けれど、渡した設計資料を白井さんはかなり深く細かいところまで精読してインタビューに臨まれていると感じました。いい加減な姿勢でないことが伝わり、最初から具体的な話を進めることができたのです。
白井
6日間のインタビューでは、初日に対象システムの概要をヒアリングします。以降「可観測性(オブザーバビリティ)」「インシデント管理」「リリース管理」「継続性/回復性(レジリエンス)」「拡張性(スケーラビリティ)」の5つの評価観点に関して、それぞれ1日2時間をかけてクラウド運用の成熟度を評価し、その後インタビュー結果をもとに計38項目の運用課題を抽出しました。
「【第1回 後編】価値ある気づきを与え合った互恵的プロジェクト」はこちら>
お問い合わせ先・情報提供サイト
株式会社 日立製作所 クラウドサービス事業企画本部
・あなたの知らないクラウド運用へ Hitachi Application Reliability Centers (HARC)
・詳細はこちらから