具体的な業務内容
SRE〜リモートワーク可/平均残業20時間以下/インフラストラクチャーの全体の構築・運用・改善〜
■業務概要
エムスリーのインフラストラクチャーの全体の構築/運用/改善を担当します。
・各種サービスの監視などObservabilityの改善
・各マイクロサービスの可視化・安定化のための改善
・AWS / GCP / オンプレミス 全体のネットワークの可用性・コストパフォーマンス改善
・RDBMS の可用性・運用課題への対処および根本解決
・各プロダクトの設計、機能実装、リファクタリングなど
・各プロダクトの設計に対するレビュー・助言
・オンプレミス → クラウド 移行の支援
・クラウド 移行に伴い発生する技術的諸課題の解決
・共通インフラ機能 (メール送信 / SAML / 専用線ネットワーク 等) の運用、改善
・権限付与・ACL 設定といった運用作業とその自動化・効率化
■技術スタック:
環境: AWS / オンプレミス / GCP
OS: Linux
仮想化・コンテナ技術: ECS / Docker Swarm / KVM / Kubernetes
DB: 主に PostgreSQL / 一部で Oracle / MySQL
KVS: Redis / Memcached
監視: CloudWatch / Grafana / Datadog / Prometheus / Nagios / Kibana / Fluentd
構成管理: Terraform / Ansible / CDK
■組織について:
・コアSRE:
SREチーム (2022/07 現在 6 名) のメンバーはコアSREと呼ばれ全社的にそれらの開発・構築・運用を支える存在です。垂直分業はしておらず、各自が自走するプロフェッショナルとして本質的な課題を解決することが期待されます。構築・運用フェーズといったロールでの分離はなく、課題に対するアプローチの考案から実装・実現まで各自が担います。
・チームSRE:
各サービス開発チームのメンバーとして参画し、そのサービスに特化したSREとして、サービスの信頼性に責任を持ちます。チームの他のメンバーと協力し、バックエンド、インフラを中心にObservabilityの改善や、応答速度向上のためのボトルネックの発見 / 解消、既存サービスのクラウド化など、非機能全般の改善に取り組みます。
変更の範囲:会社の定める業務
チーム/組織構成
その他プロジェクト事例
開発環境