kariaの日記 @ Alice::Diary

ノリツッコミの鳩子がはてなブログ書いちゃうよ

SRE NEXT 2024に参加してきた

会場入ってすぐ横にあったフォトパネル

夏のSRE関連イベントオフライン参加するぞ祭り(自主開催)の最終回。2日間通しチケットに加えて、なぜか懇親会参加券も有りのフルセットを買ってしまいました。ぼっち参戦なのに懇親会どうするの……?

以下感想を書いていくのですが、行動順時系列で書くとかなりまとまりが無い感じになるので「印象に残ったセッション」「見られなかったけどチェックした発表資料」「懇親会」「スポンサーブース」の順にまとめて書いていこうと思います。

印象に残ったセッション

登壇資料まとめは以下の記事にまとまっています。2日目寝坊したりスポンサーブース回ったりした影響で、見ることができたセッション自体がかなり少なかったです。もっと見たかったなあ。

zenn.dev

工学としてのSRE再訪

speakerdeck.com

セッションの中で一番面白かった。すごく印象に残ったスライドが多いので一部引用させていただきながら感想書いていこうと思う。

SRE文脈における工学性

一番印象に残ってるのがこれ。いわゆる「運用に溺れてる状態」が左側で、技芸的というのは決して悪いことではない(と発表者の方も仰っていた)けれど、やはり長期的・持続的改善を考えていく上で目指すべき状態というのは右側でしょう。そう考えていくとSREというのはもっと工学的に解決ができるはずだよね?という風に自分の中で解釈しました。

そこから「工学思考に基づく(と思われる)代表的貢献の一部」としてチームトポロジーの紹介があったりとか(この後ほかのセッションでも触れられていたので買いました)。

あとは、「99.99%のトレースデータはゴミ」というアグレッシブすぎるタイトルの論文の紹介があったりとか(障害の発生前後のトレースデータだけ取ってあればいいよねという発想らしく、それはなるほど感)。

「Metastable Failure」もすごく納得感あった。「障害の根本原因はもう治したはずなのに、なーんか挙動不安定なままだよねえ?なんで?」ってなるあの現象のことね。

このように普段肌感で感じてることに名前が付くことの快感が詰まってて非常に面白かったです。もっと面白い論文いっぱいあるんだろうなあ。読んでみたいな。

巨大インフラ産業で戦うSRE

speakerdeck.com

オープンロジ、よくVTuberのグッズ買ったときに発送メールが来るのでお名前は存じ上げているけれど何のサービスかよくわかってないというところからセッション視聴。事業内容も興味深かったけど、それ以上にSREの一事例として興味深かったです。SREチームとしての取り組みが具体的かつ改善を実感できる内容なのがとてもよかった。

すごくよくある話。でも最近は「SRE」とか「Platform Engineering」とかセクションごとに名前がついてきたおかげで、いわゆる「インフラなんでも屋さん」のお仕事内容が分類しやすくなってきたこと自体は、いい時代になってきたよねと思うよ。

オープンロジラムネもらった

スポンサーブース行ったらラムネをいただいたのですが、開け方を完全に忘れててあたふたしました。

Enabling Client-side SLO

speakerdeck.com

Client-side SLOってなんだ?と思ったら、iOS/AndroidアプリへのDatadog SDK導入をSREが直接コーディングしたらしい。確かにClient-sideだわ。

LCPの75パーセンタイルという閾値、参考にしていきたいよね~~わかる~~という気持ち。

An Efficient Incident Response Training with AI

speakerdeck.com

AIが障害対応訓練のゲームマスターしてくれるんだって。なるほどね、これはもうGMレスのTRPGだな。

セッション翌日にスポンサーブースでツールのデモを見学させていただいたのだけれど、Slackでポコポコと障害対応指示が現れて(ランブックと呼ぶらしい)、あとからそのログを拾って時系列ドキュメント(ポストモーテム)を自動生成したり、それを共同編集したりできるそうで、インシデント管理ツールとしてかなり面白そうでした。インシデント管理していきたい。

見られなかったけどチェックした発表資料

このセクションは現在進行形で発表資料をチェックしている最中なので、後で増えていくかも。

プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践

speakerdeck.com

イシューの見極め方の実例紹介。優先順位の付け方がこれだけ体型的に説明できると良いね。しかし、2019年に半年間新規開発をストップとか、Struts2のリプレースとか、事例がなかなかハードそうだ。

FourKeysを導入したが生産性向上には至らなかった理由

speakerdeck.com

「FourKeysはソフトウェアエンジニアのパフォーマンスを測る指標」「開発生産性を測るものではない」というところになるほど。LTのためあまり多くが語られていないのだけれど、(開発チーム自身ではなく)SREチームが主体となって開発チームの生産性を可視化したかった理由が気になるところでした。セッション参加して聞くべきだったなあ。

懇親会

1日目の終わりに会場を地下のクラブへ移動し、Cloudebaseさんの「CTOが趣味で作った」という佐渡島産のオリジナルクラフトビールで乾杯。アルコール度数7%と少し強めなIPA、かなり好みな味でした。

さすがに懇親会で話した内容は書けないけど、テーブル囲んでたまたま近くになった方とワイワイ話して、思ったよりかは楽しめました。「発表してくださいよ~」って言われたけど、ど、どうしようかな……。

スポンサーブース

今回スポンサーブースがかなり充実しており、全部回ってきました。

無料配布うちわの裏側がスタンプ帳のようになってて、スポンサーブースを回ってここにシールを集めると最後に抽選に参加できるよという仕組みがあってですね。特に知り合いもいないと「ブース行ったとて何話せばいいんだろう……」ってなりがちなのが、とりあえずシールを集めるという動機で話しかけることができるので良い仕組みだなと。

そもそもスポンサーブースって採用目的なんじゃ?という先入観があったのですが、ブースによってかなり趣向を凝らしていたし、結構話せるSREの方が多くて面白かったですね。ということで、印象に残ったブースのことを2つほど載せておきます。

CyberAgent

今回の会場提供もしているサイバーエージェントさんは、ただゲームの紹介とシステム構成図を展示しているだけという硬派なブースながら、「他所のシステム構成図ほと面白いモノはないじゃん!」と興味深く見させていただきました。帰ってから調べたら一部はこのスライドやブログなどに出ている内容で、一部は出ていない内容みたい(時期未定だけどそのうちブログに出るとか)。

speakerdeck.com

Aurora Serverless v2、ノーメンテでDBのスケールアップ/ダウンができるのすごい魅力的だな。スケールするときの瞬断はあるけどv1より時間も短くなっており、深夜帯なんかは勝手にスケールダウンしていくのでコストもそこまででもないらしい。最初大きめのスペックにしておいて、アクセスが落ちついて来たら徐々に最適化をかけていく流れがすごく理想的だなあ。

SMS

私「すいません~事業内容とか全然存じ上げてなくて……」
「いえいえ!ところで今『SREあるある缶バッジ』をお配りしてまして」
私「へえそうなんですね」
「好きなの1個選んでください!人気なのは『オブザーバビリティ』ですね」
私「うーん……じゃあこれで」

SREあるある缶バッジ

まとめ

最初は面白いセッションに何個か当たればいいや、ぐらいのつもりで申し込んでみたけど、蓋を開けてみればスポンサーブースも懇親会も思ったより楽しめたなという印象だし、セッションは分身して見に行きたいぐらい重複していた裏枠も見たい気持ちでいっぱいでした。

個人的反省点を挙げるとしたら英語のセッションが全然聞き取れず(同時翻訳があるものだと思い込んでいた)、スライドが日本語だったのでかろうじて雰囲気は掴めたが、やはり英語のリスニングが出来ないのは大きなマイナスだなあと痛感した次第でした。リスニングの勉強するか……?