具体的な業務内容
【AI領域】サイトリライアビリティエンジニア(SRE)/自社開発プロダクト基盤の構築と運用
プロダクト基盤の構築と運用を担うSREチームにて、サイトリライアビリティエンジニア(SRE)業務をお任せします。
信頼性の高いサービスを提供できるように、「自動化」「可用性」「セキュリティ」「パフォーマンス」「耐障害性」など主にクラウドインフラ基盤の構築・運用とでサービスを支える必要があります。
そのため、システムの改善や提案などエンジニアドリブンで主体的に取り組む事が期待されます。
■採用背景:
プロダクト開発のサービスは急速に増加しており、その背後にあるインフラストラクチャの安定性と拡張性、高い品質が求められています。この成長を支えるため、SREチームの強化のために採用を行っております。
■業務内容:
・サービス監視業務設計/運用
・セキュリティ関連業務設計/運用
・Infrastructure as Code および CI/CD による構築、デプロイ自動化
・パフォーマンスチューニングを含むSite Reliability向上のための実装
・サービス監視設計・設定 ・可観測性の担保
・システムアーキテクチャ設計
■開発環境・技術スタックなど:
AWS/Terraform/Datadog
■本ポジションの魅力:
Product SREとしてプロダクトの信頼性向上や成熟度評価のみならず、AI Product SREとしてAI Productの信頼性の定義にも参画いただく可能性がございます。
開発チームやSREチームでAI Productにおける信頼性とは何かを議論し実際に測定していきます
その中で AI Product特有の考え方や見方を身につけることができます。
今後もAI Productは世の中に大量に出回っていく中で、その信頼性の開拓者として業務を行えます。
変更の範囲:会社の定める範囲
チーム/組織構成
その他プロジェクト事例
開発環境