fnwiya's quine

自分自身を出力するブログ

「Site Reliability Engineering」を読んだ

社内で開発環境の整備や監視周りなどSRE的な活動を行っており、
前から読もうと思っていて年末年始で取り組みました。

日本語訳も出ていますがなんとなく今回はWebで公開されている英語版で。

Google - Site Reliability Engineering

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

すでにいろいろなところでSREとは何か等の議論はされていますが
改めて

  • かならず測定する
  • Postmortem:タダでは転ばない
  • 組織として取り組むこと。SREだけでなく会社全体でサービスの信頼性向上に取り組む

などは大事だなと思いました。

英語で読むのはなかなか大変でしたが、
1章で考えれば一気に読み切れる量なので、
毎日少しずつ時間をとって取り組めました。

英語を読んだあとに日本語も読むとより理解が深まる気がするので
布教もかねて社内で読書会ができれば良いなと思っています。

やっていくぞ。