SREチームの金澤です。
2018年度より、SREチームを発足しました。
その経緯をお話ししたいと思います。
インフラエンジニアとして
私は、2013年11月にランサーズに入社しました。
ランサーズ5年目にして、サービスが本格的に伸び始めた時期で、アプリエンジニアが運用を兼務するには荷が重くなり始めており、専任のインフラエンジニアが必要でした。
入社後、4年半にわたり、サービスの安定化や負荷対策、最新の技術やサービスへの追従など、様々な施策を実行してきました。
スタートアップのインフラエンジニアに求められる仕事は多岐にわたります。
時には、サービスのソースコードに手を入れることも度々ありました。
また、この時期のランサーズは、開発環境の支援や、社内インフラの整備もできる人材が不足しており、そのような業務もインフラエンジニアである私が担っていました。
インフラエンジニア採用の難しさ
2017年度のインフラチームは、新卒、インターン含めて4人でしたが、来年度の体制変更に伴い、再び1人になることがほぼ確定していました。
そのため、経験豊富なインフラエンジニアを採用することが急務になりました。
しかしながら、スタートアップにマッチするインフラエンジニアは採用が非常に難しいです。
今までも採用活動を継続的に行ってきましたが、なかなか採用までに至らず、苦戦していました。
スタートアップでは、特定の分野に精通するだけでなく、複数の分野の業務をこなす必要があります。
今思えば、インフラエンジニアという枠組みで採用を試みた結果、書類選考の過程で多くのミスマッチが生じていたと思います。
スタートアップとSRE
ここ数年で、SRE(Site Reliability Engineering)という言葉が浸透してきました。
Googleが提唱した言葉で、オライリーから書籍が出版されて、日本でもより認知度が広まってきたと思います。
私自身、SREという言葉は最近認知したのですが、この書籍を読み、スタートアップ企業に必要なエッセンスがたくさん含まれていると感じました。
そして、ランサーズのインフラチームが担ってきた
- 新サービスのローンチ支援
- リリースシステムの構築
- 定型作業の自動化
- 開発環境の構築
- 分析基盤の運用
- セキュリティの強化
などは、ランサーズが成長する過程で積み重ねてきた施策であり、SREそのものでした。
SRE(Site Reliability Engineer)の採用
ランサーズに必要なエンジニア像として、SREはとても腑に落ちるものであることに気づき、今後はSRE(Site Reliability Engineer)というキーワードで採用を行おうと決意しました。
これまでの集大成として、2月にTECH PLAYでSREをテーマにしたイベントを行わせていただきました。
その時のスライドがこちらになります。
また、採用方法もエージェントに頼らず、ダイレクトリクルーティングによる採用に切り替えました。
エンジニアが自ら採用活動を行うため、エンジニアの負担が大きくなるのですが、採用の初期段階からエンジニアが参画するため、ミスマッチが大幅に減り、精度の高い採用ができるようになったと思います。
SREチームの発足
その結果、2018年度より新規に優秀なSREメンバーが3名加わり、正式にSREチームが発足しました。
当初、1人採用できればと思っていたので、大変嬉しく思います。
今年度のSREチームは、PHPバージョンアップやCRE(Customer Reliability Engineering)チームとの連携も含め、幅広いミッションが与えられましたが、未来につながる施策も含めて、今後進めていきたいと思います。
※次回は、SREチームの新メンバーにブログを書いてもらいます。
お知らせ
7/3に行われるSRE Lounge #4に登壇させていただくことになりました。
https://sre-lounge.connpass.com/event/91566/
おかげさまで満員御礼となりました。
皆さんに少しでも有益な情報が提供できるように頑張りたいと思います。