【株式会社バベル様】長期に渡るインフラの運用改善支援でコスト効率と信頼性の向上を実現 | 活用事例

2024.7.3

※写真左から
株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小島徹也様
株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小山奏汰様
株式会社スリーシェイク エンジニア 岩﨑勇生
株式会社スリーシェイク エンジニア 金子雄

課題
・クラウドコスト管理
・運用監視
・Google Cloudに関する技術的なリソースの強化
【決め手】
・伴走していく中で、技術の意思決定に関する質とスピードが高まり、信頼感が持てた。
効果
・クラウドコストの効率化
・安定した運用監視の実現
・技術的意思決定の質とスピードの向上

商談解析SaaS「ailead(エーアイリード)」を開発・提供する株式会社バベル(以下、バベル)。 aileadを使うことで商談データを自動で取得・解析・可視化し、営業組織の業務効率化や営業人材の育成につなげることができるサービスである。今回は同社の基盤開発チームの小山様と小島様に担当エンジニアである金子、岩崎と共にプロジェクトの経緯や成果についてお話しを伺った。

目次

  1. コスト管理、運用監視に対する支援、技術的な意思決定を早めるための施策
  2. 長期支援の決め手は意思決定の質やスピードの向上
  3. 効果の高い課題を優先的に解消し多角的にご支援
  4. 「SRE」の理想を押し付けない
  5. 効率的なコスト構造、安定的な運用監視体制を実現
  6. 短期でのボトルネック解消を目指し、能動的な提案も積極的に実施
  7. 長期を見据えたサービスの改善に注力

コスト管理、運用監視に対する支援、技術的な意思決定を早めるための施策

-aileadについて、同サービスはどういった構成で実現されているのでしょうか?

小山

aileadは主にGoogle Cloudを使っています。一部Azureも利用してはいますが、構成するコンポーネントの大部分はGoogle CloudのGoogle Kubernetes Engine上(以下、GKE)に構築しております。SRE領域でいうとCloud Monitoringや、Cloud Loggingなどを用いた監視環境、GitHubActions、ArgoCDを用いたCI/CD環境等を利用しています。インフラやSRE領域に関してはこうした構成でサービスを運用をしております。

-同サービスの利用トランザクションはどの程度発生していますでしょうか?

小山

ユーザー数は順調に推移しており、平日の日中帯を中心に多くのユーザーにご利用いただいております。Webサーバーへのアクセスの他に、ミーティングの録画や文字起こしリクエストも捌いているのですが、こちらはおよそaileadユーザーがミーティングを開催した分だけ処理が実行されています。

株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小山奏汰様

-ご支援当時抱えていたビジネス上の課題などをお聞かせください。

小山

参画いただいた当時の課題としては、大きく2つありまして、1つがGoogle Cloudの利用コストについてです。サービス開始当初からコストについては常に気を使っていました。3-shakeさんのご支援をいただくと同時期に会社としてサービスの継続的な成長と収益性の向上を目指していこうという目標を掲げ、更なるクラウドコストの最適化に力を入れておりました。

もう一つが障害監視です。 主要機能である録画機能を中心に、障害発生時に早い段階で検知できる体制の強化に力を入れておりました。

-その他に組織面・体制面での課題等はあったのでしょうか?

小山

社内のナレッジとしてGoogle Cloudの知見は溜まっていたのですが、更なるプロダクトの発展のために専門家をアサインし、より強固な体制を作っていこうという決定をしました。現在では3-shakeさんとの連携も図りながら、迅速かつ適切な意思決定を行える体制の構築が行えていると感じています。

長期支援の決め手は意思決定の質やスピードの向上

-長期でご支援させていただいてますが、スリーシェイクに決めた要因などはどういった点が挙げられますでしょうか?

小山

SRE支援に強みを持つ企業様を探していていくつか候補はあったのですが、3-shakeさんは実績もあり、GCPの支援に長けているとのことだったので契約に至りました。最初は小さく入っていただき、徐々に依頼を増やしていったと記憶しています。その後は3-shakeさんとの協業を通じて、当社の技術的な意思決定プロセスの改善と高度化を図ることができました。その際の経験から3-shakeさんと良い関係を築いていくことでより強固な開発体制を作っていけるのではないかと考えました。

株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小山奏汰様
株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小島徹也様

効果の高い課題を優先的に解消し多角的にご支援

-(To:スリーシェイク)ご支援する際にバベル様にどんな配慮や気持ちを持っていたのでしょうか?

金子

案件開始当初に小山さんにヒアリングさせていただいた時に「お客様に更なる価値を与えていくために強固な基盤を作っていきたい」といったことをお聞きして、我々としてそれに対してどのように関わり、価値を提供できるか考えました。そこからバベルさんと一緒になってaileadの価値を高めるにはどうすればいいかSREとしての視点から考えてきました。aileadのお客様のためにバベルさんと一緒になって考えるというスタンスは今も変わりません。お客様のために会社やサービスをさらに成長させていきたいといった強い想いをお持ちの小山さんや小島さんが、如何に、より生産的な活動に時間を割くことができるようにするか日々考えながらご支援を続けています。

(To:スリーシェイク)具体的にはどんな対応をしてきたのでしょうか?

金子

参画当時は、まず課題としてお話を頂いた、障害検知の部分について手を打ちました。基本的な監視環境を整備するべく、Cloud Monitoring、Cloud Loggingといったマネージドなサービスをベースにユーザ影響を検知可能な環境、例えばUptime Checksを用いた外形監視、レイテンシー監視が行える環境を整備しました。とはいえ、その対応で完璧になったかというとそうではなく、継続して、アラートのノイズ削減や、よりユーザーに寄り添った監視の実現に向けて、今も継続してオブザーバビリティの高度化に取り組んでいます。

また、同じく課題として上がっていたコストカットについても支援させていただきました。小山さんにクラウドの利用料をどの程度に抑えたいかといった目標と、実際の利用料を共有していただいたのでCloud Billingを元に、サービス毎に料金をグルーピングして、利用料が大きいリソースから低減余地を検討、提案するような形でコストの低減を進めました。例えば、アプリケーションのパフォーマンスを効率化させつつ、GKE ノードのスペックを最適化するといった形で、信頼性とコストとのバランスを鑑みながら、コスト低減施策を推進しました。

後はその他にも、インフラの構成管理に関する改善や、セキュリティ関連のご支援も行いました。元々インフラはTerraformで構築されていたのですが、コード管理と実体との間の差分が生じにくくなるよう見直しを行いました。これによりTerraformによるIaCのメリットを最大限に活用し、効率的なインフラ管理を実現しました。

セキュリティ関連の対応としては、脆弱性対策等、aileadをお客様に導入頂く上で求められるセキュリティ対策を支援しています。お客様のセキュリティ基準を満たすことは、サービス提供における重要な責務と認識しております。現在aileadでは、セキュリティ対策の更なる強化に全社的に取り組んでおり、3-shakeとしてもお客様に安心してご利用いただける環境の整備を進めています。そのため、GKE上のワークロードに対してスキャンをかけて脆弱性がないかを確認したり、事前に防ぐという観点でTrivyを使って脆弱性をCI/CDプロセスの中で検知可能にしたりなどの対応を行っています。

(To:スリーシェイク)機能開発の方々が開発に専念できる状況を作っていきたというお話しも上がっていたかと思いますが、そこに影響するところとしてはどのような対応がありましたでしょうか?

金子

そうですね、Trivyの導入などがそこに関連する部分かと思います。機能開発する人には脆弱性といった非機能部分をできるだけ考えず、ただ自身の開発タスクに集中して欲しいと思っていますので、そういった領域を基盤開発のチームである程度カバーできるような仕組み・体制整備を進めています。Trivyを導入したことで 最初の一歩は踏み出せたと思います。

「SRE」の理想を押し付けない

-ご支援させていただく中でスリーシェイクに対して頼もしいと感じていただけた点ありましたでしょうか?

小山

インフラやSRE領域について、3-shakeさんの知識をご共有いただくことがあるのですが、「このドキュメントにはこう記載があるので、このように進めるといいです」といったような形で技術的なナレッジを一次情報ベースで提示しながらアドバイスしてくださるところはすごく頼もしいですね。また、その際にもSREやエンジニアの理想を押し付けず、弊社のプロダクトチームの人員や技術スタックなどを鑑みて再現性のある提案をいただける点は特に有難いです。小島さんはいかがでしょうか?

小島

私は元々アプリケーションのエンジニアをやっており、バベルに入社してからSRE領域にもチャレンジさせていただいているのですが、SRE・インフラ領域に関しては日々学んでいるところであります。そんな中で新規機能を開発する際にインフラ構成に悩む場面があったのですが、3-shakeさんに相談したところ解決するためのアイデアをわかりやすく丁寧に教えてくださったことがあり、そこで3-shakeさんのことをとても頼もしいと感じました。

(To:スリーシェイク)小山さんや小島さんにこうしたことを言っていただけるように支援の中で意識したことはあったのでしょうか?

金子

そうですね。SREをやっていきたいというお客様に対して、「SREの理想」を押し付けるようなことは絶対しないように意識していました。折角、SRE組織を立ち上げようとしているのに、理想だけを追求した結果、効果が得られず組織が無くなってしまうといった状況は避けたいと思っていましたので、SREの原則がいくつかある中で、小山さんからいただく情報を元に、原則に結びつけながらも、バベルさんにとって最も効果的な対応は何か?を強く意識して支援していますね。もう1点は技術選定に関してです。バベルさん自身で継続して運用していただくことがゴールなので、むやみに新技術の提案・導入はしないように心がけています。

株式会社スリーシェイク エンジニア 金子 雄
株式会社スリーシェイク エンジニア 岩﨑 勇生

効率的なコスト構造、安定的な運用監視体制を実現

-ご支援の中でコストや運用監視面での課題があったかと思いますが、我々のご支援によって効果などはありましたでしょうか?

小山

Google Cloudの利用料に関しては、サービス品質を保ちつつもコスト効率をチームで決めた水準まであげることができたというのが分かりやすい効果だと思います。また、監視に関しては、不具合などの発生時に早い段階で検知できる事例も増えており、運用・監視の負荷自体も減ってきていることを実感しています。

-ありがとうございます。アプリケーション開発側の方々が集中できるような環境を構築するといった面ではご支援によってどのような変化がありましたでしょうか?

小島

これまでの話には上がってない部分ですが、エンジニアの開発ベロシティを上げるための環境整備などにもかかわっていただいています。我々の開発プロセスの中で3-shakeさんの専門的知見を活用することで、開発プロセスの効率化と品質向上を図っています。今後も3-shakeさんのような専門家の知見を積極的に取り入れながら、社内の開発体制をさらに強化しお客様に早く高品質なものを届けられるようにしてまいります。

-技術的な意思決定のスピードが早くなっている感覚はありますでしょうか?

小島

はい、とても早くなっていることを実感しております。金子さんや岩崎さんからは能動的に仕事をしていただけており、自ら課題を発見し解決の提案をしていただけるので、そうした面でも助かっております。

短期でのボトルネック解消を目指し、能動的な提案も積極的に実施

(To:スリーシェイク)能動的に提案した具体的なエピソードがありますか?

岩崎

直近だと分散トレーシングを取り入れることを提案させていただきました。それによって各APIリクエストの流れが分かりやすくなって監視に応用できたり、パフォーマンス面でもどこにボトルネックがあるかという事が視覚的に把握できるので、PoCに向けて整理を始めております。

金子

実は1年程支援させていただいたタイミングで、今まで取り組んできたことや、今後取り組むべき内容を一緒に整理させていただきました。基盤開発チームのOKRを踏まえ協議させていただく中で、監視の高度化といったテーマが上がったので、その流れで分散トレーシングの提案をさせていただいたのが背景となります。

長期を見据えたサービスの改善に注力

株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小山奏汰様
株式会社バベル ailead事業部 エリアプロダクトオーナー兼エンジニア 小島徹也様

-今後のサービスに関しての展望などをお聞かせください。

小島

スリーシェイクさんのおかげでSREやインフラ領域は万全な体制が整いつつあると思っております。また、機能開発の面では、お客様からの要望に迅速かつ的確にお応えできるよう、開発体制の強化と効率化に注力しています。そのために優秀な開発人材の確保と育成、開発プロセスの改善などを通じて、機能開発のスピードアップと品質向上に取り組んでいきたいです。

-ありがとうございます。インフラ面は万全ということですが、小山さんいかがでしょうか?

小山

はい。これまで障害監視やコスト効率をはじめとして、主にインフラ面において十分ご貢献いただいたかなと思っています。今後も、安定的かつ継続的に価値を提供するためにより包括的・長期的な視点が必要になってくると思うので、色々な課題・領域において3-shakeさんとともにプロダクト改善に取り組んで行きたいと思っています。

(To:スリーシェイク)スリーシェイク側としては、今後の改善や注力していきたいところなどはありますか?

岩崎

はい。継続してバベルさんが課題として捉えているところを支援できればと考えています。バベルさんは、お客様に安定的かつ継続的に価値を提供できるよう、長期的な視点で事業基盤の強化に取り組んでおられますので、更なるセキュリティ対策やコスト最適化などの重要課題についても、専門家としての知見をご提供しながら、着実に改善していきたいと考えています。セキュリティ面では弊社のSecurifyもご検討いただいているので、それも含めて脆弱性の対応フローを一緒に整理していきたいですね。

あとは、オブザーバビリティ強化に取り組んでいきたいです。Google CloudにはCloud TraceやGoogle Cloud Managed Service for Prometheusといった数々のテレメトリ収集 / 可視化サービスがあるので、それらを駆使してより良い監視運用を実現していきたいです。

-本日はみなさまありがとうございました。

活用事例一覧へ戻る