具体的な業務内容
【東京/リモート可】SREエンジニア(データプラットフォーム) 世界市場規模2,000兆円の産業DX
日本を代表する大手製造企業が続々導入/AI×特許技術活用のプラットフォーム展開
期待する役割:
Data Platform本部のSREエンジニアとして、AIデータプラットフォームの信頼性向上と効率的な運用を推進していただきます。
お客様の重要なデータを安心してお預けいただくために、「どこに解決すべき課題があり、それをどのような手段で解決していくか」といった大局的な視点に立ってステークホルダーと議論・協働しながら、お客様に継続的に価値提供を行い、信頼を獲得することがミッションです。
業務例:
信頼性の向上
・サービスのパフォーマンス、可用性、スケーラビリティの改善
・インシデント発生時の緊急対応、根本原因分析(RCA)、再発防止策の策定と実施
モニタリングとオブザーバビリティ
・サービスレベル指標(SLI)とサービスレベル目標(SLO)の定義と運用
・ログ、メトリクス、トレースを活用したサービスの可視化(オブザーバビリティ)の推進と改善
自動化と効率化
・手作業の運用タスク(Toil)を削減するための自動化ツールの開発と導入
・CI/CDパイプラインを含むリリースプロセスの構築・運用・改善を通じて、デプロイメントの効率化と安全性の確保
アーキテクチャとインフラ
・クラウドネイティブなアーキテクチャの設計、構築、運用
・Kubernetesをはじめとするコンテナ技術の運用と管理
・Infrastructure as Code(IaC)の実践と普及
チームコラボレーション
・開発チームと連携し、開発プロセス全体にSREの観点を組み込むための活動
・他チームへの啓蒙や教育を通じて、組織全体のSRE文化を浸透させる
魅力:
サービスのスケーラビリティや信頼性に関する難易度の高い課題に、情熱的なメンバーと共にチームで向き合い、解決していく経験を積むことができます。
全社データ戦略を担うコア基盤における安定稼働を技術力で支えることで、プロダクトが進化していく過程に不可欠な存在として貢献できます。
グローバル展開を加速するプロダクトの信頼性向上に携わることで、多様なバックグラウンドを持つチームメンバーと共に、国際的な舞台でのサービス運用経験が得られます。
チーム/組織構成
その他プロジェクト事例
開発環境