この記事では、SREチームを組織する際どのように進行すればスムーズにいくのかを解説します。

SREチームの作り方と5つの導入ステップを理解する

nwiizo

2022.1.17

「SREに興味はあるが、どのように取り組めばよいか」と悩んでいる企業の方は多いかと思います。社内にいる人材を駆使して取り組むのか、それとも新しくSREの知識に富んだ人材を雇えばよいのか、またどのように組織を作ればよいかなども悩む点でしょう。

そこで本記事では、どのようにしてSREの組織を形成すればよいのか、解説していきます。SREチームの編成や取り組み方に興味がある方は参考にしてください。

理想的なSREチームのあり方を考える

SREはGoogleが提唱した信頼性向上のための施策です。理想的なSREのあり方についてGoogleが提唱している考えを参考として紹介します。Googleのやり方をすべて真似する必要はありませんが、概念として知っておくと参考になるはずです。

Googleが提唱する理想的なSREの組織

GoogleではSREの組織形成として、以下のメンバーで構成されることが理想的であると述べています。

  • 50~60%:Googleの正規のソフトウェアエンジニア
  • 40~50%:正規のエンジニア『予備軍』で他のメンバーが持っていないスキルを持っているエンジニア

複数の異なるスキルが合わさることではじめて、信頼性を担保したハイクオリティなサービス運営が可能なSRE組織になります。SREを導入する際に、一人ひとりに高いコーディングスキルや運用スキル、インフラ知識を求めるのではなく、メンバー全員で不足しているスキルを補うことを意識すると良いでしょう。

正規のエンジニア『予備軍』という表現の意味するところとしては、「アプリケーションに対する技術力だけでなく、インフラやDBなどの広い知識を持つメンバー」ということが表現されているのではないかと考えられます。具体的なスキルとしては、「UNIXシステムの内部構造」や「ネットワーク(レイヤー1からレイヤー3)」の専門知識であることが多いようです。

しかし、上記のスキルはあくまでGoogleが唱えているものであり、現実的な話としては自社のサービスや環境で使用される「アプリケーション開発スキルや知見」「インフラに関する知識や技術力」といったスキルであることが多いのが現状です。

自社にあった組織を形成

先に紹介した「Googleが提唱する理想的なSREの組織」はあくまでGoogleが良しとする考えのため、サービスの成長フェーズや企業規模によって取り組み方は変える必要があります。

SREの導入で大切なのは、信頼性向上のための自動化や効率化に向けて、常に結果を振り返り改善し続けることです。中長期的な目線を持ち、自社にあった組織ないし取り組み方を模索することを意識すると良いでしょう。

またメンバーも最初に決めたメンバーにこだわらず、SREを進めていくうちに発覚した必要なスキルを持つメンバーを途中で入れる柔軟性も持っておきましょう。

もしSREの人材を雇う場合はインフラエンジニアとしての技術とスキル、アプリケーション開発スキル、SRE導入実績などを見たうえで選びます。ただ、これらのスキルを全て有する人材は非常に希少で、年収などの面でも優遇する必要があるため、採用はタイミングなどを含め慎重に行う必要があります。

SREチームの初期発足時は、なるべく社内メンバーを探して構成することをおすすめします。もしSREに関する知見があるメンバーが社内にいない場合や、スキル面で不安があるという場合は、新規でSRE人材を採用するのではなく、SREの導入支援を行うサービスを利用するのもひとつの手です。新規でSRE人材を雇っても「結局SREがうまく機能しなかった」「実はSREチームは必要なかった」といったケースも考えられるので、SRE導入の初期フェーズはより慎重に進めると良いでしょう。

SREの導入ステップを理解する

SRE業界で有名な本である「SREの探求」の8章の2では、以下の5つの導入ステップを踏むことでスムーズなSRE導入ができると示しています。内容を要約し、わかりやすく解説いたします。

①現状の定義・組織構造の理解

SREが組織の将来に占める立ち位置やビジネスケースを提示するために現状を把握し、組織構造を理解します。現状の把握とは、企業内で存在する組織構造や責任者の把握、SREを導入する際にステークホルダーとなりうる人物の把握などです。

②ステークホルダーの特定と教育

SRE導入のカギとなるステークホルダーと会話を重ね、組織内でのSREチームの立ち位置や影響しうるストーリーの構築を行います。ここで指すステークホルダーの例としては、CIO(Chief Information Officer)や運用担当責任者、サポート担当責任者、エンジニアリング担当責任者など、各チームのリーダーを指します。

③ビジネスケースの作成と提示

現状の課題やコスト、SRE導入における好影響などを含め、ビジネスケースを提示し社内での理解を得ます。ビジネスケースを作成する際は、直面している課題や現状かかっているコスト、運用や信頼性に及ぼす潜在的な影響、費用対効果といった点をなるべく具体的につめることがポイントとなります。

④SREチームの編成

SREのビジネスケースを決定し、目標達成に向けて最適な人材をSREチームとして招集しチームを編成します。SREチーム編成における最適な人材は、サービスの成長フェーズや改善したい業務内容によりますが、「アプリケーション開発を行う技術力や知見」「インフラに関する知識や技術力」「サービスの運用スキル」などが必要となります。ただし、これらの必要スキルを全て有する人材は稀であるため、チーム全体でスキルを補うことを考えてチーム編成を行うと良いでしょう。

⑤結果の計測

結果を計測し、振り返りを行い改善し続けます。

あらかじめTrelloやAsanaといった工数管理ツールとTableauやLookerといったBIツールを連携させておけば、SRE導入前と導入後の工数削減率は容易に把握できます。

中でも特に、現状の定義・組織構造の理解に時間をかけると良いでしょう。SREを導入するにふさわしい場所を模索し、ビジネスケースに落とし込むことでSREの導入効果を最大化できます。SREはチームだけでなく、周りのメンバーや上層部からの理解を得てはじめてうまくいくものです。

導入の初期フェーズでは小さいスケールから始め、徐々に様々なプロダクトに広げていくことで社内の信頼を得られるでしょう。

SREのチーム編成から導入まで弊社にお任せください

「明日からSREチームを作って、Webサービスの信頼性を向上してください」といきなり言われても、まず機能しません。SREによって信頼性を向上させるためには、導入する目的を明確にし、適切な人材を組織し、施策を講じる必要があるからです。

弊社はSREをサービスとして提供していますが、その一環でSRE組織の立ち上げも支援しております。SREチームが機能するための基盤づくりはもちろん、戦略策定から設計・構築・運用、監視製品の導入までSREに必要な要素を統合的に提供可能です。

ぜひ一度貴社サービスの課題に感じている点を含め、お話を聞かせていただければと思います。

ブログ一覧へ戻る

お気軽にお問い合わせください

SREの設計・技術支援から、
SRE運用内で使用する
ツールの導入など、
SRE全般についてご支援しています。

資料請求・お問い合わせ