こんにちは。DRAWER SRE(Site Reliability Engineer) の廣岡です。最近は DRAWER サービスを運営する上での SLI/SLO 、エラーバジェットポリシーの策定や、モニタリングの整備などを進めています。
DRAWER SRE チームでは、リライアビリティの推進事例やプラクティスへの理解を深めるため、SRE NEXT 2023 というイベントに参加・聴講しました。本ブログはこの参加レポートになります。少しでもイベントの雰囲気を感じていただけると幸いです。
SRE NEXT とは
SRE NEXT は、SRE などのサービスの信頼性構築やその維持・改善に関心を持つエンジニア向けに開催されているカンファレンスです。2020年から開催されており、今回が3回目の開催とのことでした。
スピーカーやスポンサーもさまざまな業種、規模の企業が務めており、信頼性改善に対する熱量の高さが窺えました。セッション内容は動画で公開されており、非常にありがたいです。
CADDi DRAWER SRE とイベント参加の経緯
キャディが提供する図面活用 SaaS である DRAWER では、サービスの成長とともにユーザーの期待するサービスレベルを維持することの重要性が増しています。DRAWER SRE チームはこうしたサービスと事業状況に対応するため、日々信頼性改善のためのキャッチアップと社内適用に取り組んでいます。
SRE に関するプラクティスは、例えばオライリーの「Site Reliability Engineering」など、さまざまな書籍や資料を通じて公開されています。一方でそれらのプラクティスを実際に組織やサービスに適用する際には、サービスの性質やチームの規模などに応じたチューニングが必要になります。今回は実際のさまざまな企業の信頼性構築、改善事例紹介を聴くことで、より現実的かつ実践的なノウハウや障壁について理解が得られると考え、SRE NEXT に参加しました。
会場の様子
SRE NEXT 2023 はオフライン・オンラインのハイブリッド開催であり、オフライン会場は九段テラスとなっていました。スピーカーセッションは3つのトラックがそれぞれのホールで並行して開催されていました。
オフラインでの参加者はかなり多く、イベントの熱量の高さが窺えました。また運営の方々は丁寧かつスムーズに会場案内やイベント進行を実施してくださっており、快適に参加することができました。
スピーカーセッションの他には、スポンサーブースやアンケートなどのイベントブースもありました。スポンサーブースでは、スポンサー企業のメンバーの方々と間近でお話することができ、各社が提供するサービスの詳細や、信頼性改善に関してより密なディスカッションができたと感じます。
アンケートボードには、組織における SRE のタイプや、SLO の導入度合い、SRE 関連書籍の読書具合などのアンケートが掲示されており、個人的に非常に興味深く感じました。
実は DRAWER SRE は厳密には Enabling SRE という形で DRAWER サービスのエンジニアリングに関わっています。このアンケートを通じて、SRE とサービスの関わり方を俯瞰することができました。
SRE 関連書籍の読書具合も興味深いと感じました。代表的な書籍であるオライリーの「サイトリライアビリティエンジニアリング」や「入門 監視」はやはり広く読まれており、業界におけるバイブル的位置づけであることがわかります。次いで「サイトリライアビリティワークブック」もかなり読まれていることがわかります。「サイトリライアビリティエンジニアリング」が Google が提供する SRE の基本原則やプラクティスを掲載しているのに対して、「サイトリライアビリティワークブック」では Google 以外も含めたより実践的なプラクティスや事例が紹介されています。DRAWER SRE チームでもちょうど先日「サイトリライアビリティワークブック」の輪読会を終えたところであり、実践的な理解を深める上で非常に有意義だったと感じました。
「セキュアで信頼性のあるシステム構築」は、私はこのイベントで初めて存在を知りました。信頼性とセキュリティの関係性を解説した本は貴重に思います。また「カオスエンジニアリング」に関しては、DRAWER で実践するにはまだ先かもしれませんが、SRE の代表的な役割の一つであるキャパシティプランニングの一貫として確かに大事だと感じます。
総じてスピーカーセッション、スポンサーブース、イベントブースどれも発見があり、非常に楽しむことができました。
会場では広島のワキヤコーヒーさんがコーヒーを提供してくださっていました。とても美味しく、長いイベントでしたが集中して参加することができました!
イベントへの感想
個別のスピーカーセッションに対する感想は割愛しますが、オブザーバビリティやインシデント対応、SLO の浸透などといった SRE の役割について実践的な事例を聞くことができました。また Generative AI の活用例などといったリサーチレベルの内容まであり、非常に面白く聴講できたと感じます。
イベント開始と終了時のキーノートセッションでは、経営の柱の一つとしての信頼性の重要性や、成長していくサービスにおいてどのように信頼性目標を実現していくかなどが話されていました。どちらもキーノートにふさわしく、信頼性に関わる多くの人に刺さる内容だったと感じます。
参加メンバーコメント(廣岡)
全体の感想として、参加者のレベルがとても高いと感じました。特にスピーカーセッションでは、「このプラクティスは〇〇の本に書かれてて、」と言うような話が多くあり、基本的な知識やプラクティスを抑えることの重要性を感じました。私は SRE として動き始めたのが比較的最近のため、引き続きイベントブースで紹介されていたような書籍のキャッチアップ&実践を進めていこうと感じました。
また、どのスピーカーセッションでも周囲のチームやステークホルダーとうまく連携しながら信頼性活動の取り組みを進めているように感じました。これは信頼性改善の取り組みが潜在的にサービスおよびユーザーの広い範囲に影響を与えるからであり、どの組織も開発チームやプロダクトマネージャーを巻き込むことで、効果的に信頼性改善を推進しているのだと考えています。CADDi DRAWER でもここ最近でプロダクトにおける信頼性の重要性が認識され始めており、このまま強度高く活動を進めていきたいと思います。
参加メンバーコメント(矢野)
まず初めのスピーカーセッションがとても印象的でした。SREはプロダクト開発する組織にとって必要な機能であるという認識を新たにすることができて、今進もうとしている方向性の自信となりました。
私自身はSWEとしての経験がメインで、SREとしての経験を積んでいるのはここ最近の話なので、各社のリアルなSREの事例を聞くことができてどのセッションも非常に興味深く面白かったです。2000年初期に生まれたSREというエンジニアリングのプラクティスが今まさに各社で活発に実践されていることを肌で感じることができて、CADDiのSaaSでも信頼性高く提供し続けられるようにやっていこというモチベーションが高まるとても良い一日でした。
終わりに
SRE など、サービスの信頼性改善に関心のある方向けのイベントである、SRE NEXT 2023 に参加させていただきました。
スピーカーセッションやイベントブースなど、どれもためになる情報やお話が多く、非常に参考になりました。また信頼性改善という共通の目標に向かって邁進している方々のお話を聞くことで、DRAWER SRE としても大いに今後のモチベーションに繋がるところがあり、参加して良かったと感じています。今回は聴講側の参加でしたが、次回は是非スピーカー側としてもプラクティスをお話しできるように頑張りたいと思います。
また運営の皆様の配慮により、快適に聴講や各イベントを楽しむことができました。改めてお礼を申し上げます。
本イベントで得られた知識や洞察をもとに、キャディでは引き続き製造業の変革に貢献するようなプロダクト開発を進めていきます。ご興味のある方は是非お気軽にご連絡いただけると幸いです。