具体的な業務内容
【東京/リモート可】SREエンジニア(リーダー候補)◇自社製品・サービス/アルプスアルパインG
■ポジション概要:
2022年度から組織化され、2023年度から本格的に活動を開始した新しい部署となります。まだまだ成長過程の為、業務拡大に伴い増員を予定しています。現在は運用業務の改善を中心に、IaCやオブザーバビリティ環境の刷新、自動化ツールの作成に取り組んでいます。将来的には自社製品・サービスのパフォーマンスや信頼性、スケーラビリティを向上させるために、CI/CD環境の構築やマイクロサービスプラットフォームの実現を担っていただく予定です。
■業務内容:【変更の範囲:会社の定める業務】
◇クラウド上で稼働する既存サービスのインフラ環境のコード化(IaC)
◇障害復旧のオペレーションを自動化するためのツールの開発、運用
◇障害検知やキャパシティプランニングのためのモニタリング環境の構築、運用
【主なプロジェクト】
◇運用業務の自動化(省力化)…定型作業の効率化やオペミス撲滅の為に、手動作業やToil(トイル)の削減をterraformやansibleを使って実施しています。
◇監視ツールの統合リプレース…障害の予測、早期発見、早期解決の為に、Datadogを使って監視ツールを統合してオブザーバビリティ基盤の確立を進めています。
◇運用自動化/システム化…KompiraとRedmineを活用して、障害通知と管理の実現を進めています。障害発生時の自動復旧にも取り組む予定です。
◇運用技術の調査検証…技術の深耕や業務への利活用の為に、コンテナやオーケストレーション技術、クラウド技術、CI/CD、カオスエンジニアリングなどの習得を行っています。
■使用する技術スタックの一例:
Linux、Python、JavaScript、Bash、クラウド(AWS、Sakuraなど)、GitHub、Redmine、Datadog、Kompira
■働く環境:
20代の若手を中心としたチーム構成になっています。新しい技術にも積極的にトライして業務へ取り入れる風土があります。
運用チームと連携して、各プロジェクトを2〜3名で掛け持ちながら進めています。月平均残業時間は20時間前後となっており、土日祝に勤務する事はありません。
変更の範囲:本文参照
チーム/組織構成