具体的な業務内容
主にGoogleが提唱するSREプラクティス を参考にし以下のような領域に取り組んでいただきます。■Emergency Response: 緊急対応の品質担保のための仕組みづくりと訓練、実際のトラブル対処から再発防止までのリード
■Metrics & Monitoring: オブザーバビリティの導入推進、プロダクト方針に基づくSLI/SLOの実装〜運用■Capacity Planning: サービスの成長に伴う負荷の予測、負荷テストの設計や実施、インフラだけでなくアプリケーションにも踏み込んだボトルネックの改善■Change Management: 漸進的デリバリーなどの普及を含めたリリースエンジニアリング