tjinjin's blog

インフラ要素多めの個人メモ

SREグループのマネージャとして意識してきたこと

About

この記事は LITALICO Engineers Advent Calendar 2021 2つ目 25日目の記事です。

株式会社LITALICOでSREグループのマネージャをしております、 tjinjinです。 ここまでいくつかSREグループでやってきたことを書かせていただいたので、今年一年やってきたこと振り返ろうと思います。

時系列データ

  • 〜2020.10 業務委託メンバー + CTO
  • 2020.10 正社員2人入社(私含む) + 業務委託メンバー1人 + CTO
    • 基本途中からリードとして任された(CTOは本来業務に)
  • 2021.05 SREグループに昇格
  • 現在6名規模

これまで取り組んできたこと(技術面)

  • B向けサービスのビッグバン?リリース対応 * 2
  • CloudformationのTerraform化
  • ローカル環境・開発環境の見直し
    • 各開発者がwinやmacを使っている中でいい感じに使ってもらうのがめちゃくちゃ大変
  • 各種障害対応(いろいろあったな〜)
  • AWS Organizationによるマルチアカウント設計
  • コストマネジメント方針策定
  • 監視SaaSの移行対応サポート
  • その他サービスのもろもろ(たくさん)

細かい改善は引き続きやっていますが、人数も考えるとそれなりの対応はし続けられたのかな…?とも思っています。

もっと面白いことはやっていきたいし、そういう環境を用意していかねばというのは私の課題と思っているところ。

これまでやってきたこと(マネジメント視点)

  • オンボーディングの改善
  • ドキュメント化の推進
  • 所在が不明確になっていたものの可視化
    • 設計が残っていないものの立て直し
    • 構成図作ったり、責任の所在を関係者間で調整したり
  • タスク管理
  • 振り返りの取り入れ

意識してやってきたこと

マネージャーとしていろいろあると思いますが、私の中では下記を特に意識しております。

  • SREグループが開発者や他のグループなどから信頼されている状態を作ること
  • SREグループにいる各メンバーのモチベーションが高い状態を保てること
  • SREグループが成果を出しつつ、成長もしていること
  • SREグループは横断組織なので、プロダクト間のコミュニケーションハブとしての役割を一部担いエンジニアリング組織全体の活性化につながるアクションをすること

SREグループのメンバーは優秀なメンバーが揃ってましたが、全員がベテランではなかったので(私が技術的にベテランか?と言われるとまだまだできないことが多すぎると個人的には思っていますが)、どのように動けばいいのかのお手本になることを当初は意識しました。具体的には下記のようなことを背中で見せることを意識しています。

  • プログレッシブなアクション
  • レスポンスの速さ
  • アウトプットを出す

それぞれ見ていきます。

プログレッシブなアクション

仕事の仕方によっては言われたことをやる、ということが求められるケースがあるかと思います。言われたことをきっちりやることはとても大切です。ただ、言われたことをやるだけでは受動的な組織になってしまいます。ましてや我々は少なくともSREを名乗っています。名に負けぬようにアクションを起こす必要があると考え、情報は多角的に拾いつつサービスの信頼性に関わることにはどんなレイヤーだろうが首を突っ込むことを意識しました(これがうまく回ったかは別途検証が必要)。私の背中を見て各メンバーのコンフォートゾーンが少しでも外れていればいいのですが。

こちらに関しては一部うまくいきつつ、一部失敗したと思っていて、情報が私に集まりすぎてしまうことと障害対応の経験を各メンバーに味わってもらうケースが減ってしまいました。当時の状況を考えると致し方無いとも思っているので、今後は各メンバーが自律的にアクションを起こせるようにEmbedded SREのような形でプロダクトにコミットしてもらうように変更しています。

レスポンスの速さ

もともと開発者とSREとの距離はこれまで社員がSRE側にいなかったこともあっててか、開発者とSREは若干距離が遠い様に感じてました(個人の主観です)。SRE側が開発者からの依頼を受けて順番に捌いていくスタイルになっており、開発者が思ったように手を動かすことができずDXを損ねていると考えました。当時の状況を考えると権限移譲に寄せるのは難しかったので、とにかくレスポンスの速さは意識しました。 レスポンスの速さは信頼につながると考えています。まず、信頼され困ったら相談してもらえるようになる状態を目指しました。 元々他のメンバーもそういう意識を持つメンバーが多かったので、概ねうまく言ったとは思っています。

アウトプットを出す

他のメンバーに信頼いただくにはとにかくアウトプットを出すことを初期は意識しました。頭の中で考えるだけではなく、こういうことが起きたときにはこういうように考えてこのように対応した、という部分も可能な限り共有してきたつもりです。 また、特にドキュメントが全然揃ってなかったため情報の置き場の整理を実施し、どこに何を置けばいいかがある程度わかるように整備をしました。

これからどうするのか

上記でやってきたことはこれまでの会社での経験だったり、その場で学んできたことの積み重ねです。理論的にマネジメントというものを学んでこなかったので来年は少なくとも基礎理論を抑えたいと思っています。

これまでやってきたことは、どちらかというとマネジメントではなく、リーダーシップなのかなと思っています。しっかりマネジメントができるように脱皮していきたい所存です。 私がマネージャーになったからチームが伸び悩んでいると言われないように、最強のチームを作っていきたいと思います。また、マネージャになったからって技術力がないよねと言われないようにいろいろやっていきます。

チームとしては会社のビジョン達成に向けて目の前の課題を倒しつつ、チームの拡充と全体の底上げをしていきます。まだまだSREとしてやるべきことはたくさんあるので、適切な課題設定をし一歩一歩進んでいきます。

まとめ

ということで2021年のアドカレはこちらで終了です。過去記事でも面白い記事がありますので、気になる方はぜひご覧ください。