具体的な業務内容
【フルリモート可】シニア機械学習エンジニア◆数億件規模の配信データ/自然言語処理領域AI×SaaS
■業務内容:
シニア機械学習エンジニアとして組織をリードすることを期待しています。
・機械学習や自然言語処理を用いた配信パイプラインの検証・実装・運用
・顧客フィードバックと利用データをもとに配信精度の課題を探索し、精度向上やデータ拡充の施策につなげる
・顧客に配信するニュース、論文、特許、レポートといった情報ソースの拡充戦略の策定と実行
【変更の範囲:開発関連業務】
■魅力:
・数億件規模の配信データを対象とした機械学習パイプラインの開発と運用を経験できる
・Customer SuccessチームやSalesチームとコミュニケーションしながら、顧客の定性課題を直に体感しつつ改善策の提案・実行を経験できる
■現状の課題:
私たちが目指すのは、Web上のあらゆるビジネス情報を再整理し、ビジネスシーンでのデータ活用業務を自然言語処理AIで総置換することです。そのために、世界中のニュース、企業情報、論文、特許などをWebから収集、抽出、加工して顧客に提供し、企業の製品化・事業化を加速させられるような「オープンデータリサーチサービス」を開発しています。
しかし、顧客が「欲しい情報」を配信するための機械学習モデルやアルゴリズムの設計において以下のような複数の課題を抱えています。
・配信コンテンツ決定処理(text-preprocessing, deduplication, filtering, classification, etc)の精度の問題で、顧客が本当に欲しい記事を配信できずUXを下げている
・利用率向上に寄与しうるデータ拡充や精度向上施策を決めづらい
・機械学習にフォーカスするチームのリーダーが不在
■チーム構成:
<SaaS事業チーム>
・バックエンドエンジニア2名
・機械学習エンジニア2名
・DRE 2名
<構造化/PaaS事業チーム(別チームだが随時協業)>
・機械学習エンジニア2名
・MLOpsエンジニア1名
■開発環境:
・開発言語
データ/機械学習パイプライン: Python
Webクローラー: TypeScript(Node.js)
文字列処理: Rust
・コンテナ
Docker
・IaC
Terraform
・クラウド
AWS
チーム/組織構成