具体的な業務内容
【渋谷】SREエンジニア◆利用社数52万社・国内トップクラス「LINE WORKS」運営/在宅可
〜7年連続国内トップクラスのシェアを誇るビジネス版LINE「LINE WORKS」運営/9年連続右肩上がり/柔軟な働き方を実現・裁量のある環境/インセンティブあり〜
当社が提供する法人向けSaaSプロダクト群において、信頼性・可用性・パフォーマンスの向上を担うポジションです。クラウド環境での運用を基盤に、プロダクト横断でのSREプラクティス展開、運用自動化、障害対応体制の強化をリードします。
24x365の障害一次切り分け体制を外部委託で構築・マネジメントし、安定稼働を支えることも含みます。
■業務内容:
◇24x365障害一次切り分け体制の構築・運用管理
・外部委託チームの選定・契約・育成
・障害初動手順・エスカレーションルール策定
・パフォーマンス・品質のモニタリングと改善
◇クラウドインフラ運用・改善の施策立案及び実施
◇SLI/SLO/SLAの設計・モニタリング・改善サイクルの推進
◇自動化、AIOps、監視基盤強化などの技術導入・PoC推進
◇障害対応プロセスの整備(原因分析、再発防止策策定、ポストモーテム文化醸成)
◇DevOps文化推進、CI/CDパイプライン最適化による安定稼働とデリバリー速度向上
◇開発・CS・プロダクトなど他部門との連携による運用改善と顧客対応プロセスの仕組み化
◇運用に関する技術的課題の発見・提案・実装のリード
■歓迎条件:別枠記載の必須条件と併せて下記に該当する方を歓迎
・マルチクラウド運用・ハイブリッド構成の設計・運用経験
・外部委託チームやオフショアチームのマネジメント経験
・SREプラクティスの社内展開・文化浸透経験
・機械学習や自動化ツールによる運用高度化経験(AIOps)
・CI/CDパイプラインの設計・運用経験
・ITILやプロジェクトマネジメントスキル(PMP等)
・英語での技術コミュニケーション能力(ドキュメント作成や海外チームとの協働)
変更の範囲:会社の定める業務
チーム/組織構成
その他プロジェクト事例
開発環境