具体的な業務内容
【フルリモート/フレックス】データサイエンティスト◆膨大な437億データ/BigData×SaaS
【大手をはじめとした700社以上の導入実績/雑務工数を大幅削減し、商談獲得・売上アップを実現/法人営業の効率化を叶える「SalesNow」を展開 500万社以上の企業データベースを持つB2B顧客開拓プラットフォーム】
■お任せしたい業務内容:【変更の範囲:会社の定める業務】
・SalesNowのビジネス課題を分析可能な課題へ分解し、適切な分析アプローチ・モデリング手法を設計・PJの推進を実施する
→現在、SalesNowには日本全国の企業の属性データ(従業員数, 本社所在地, 設立年月日など)・行動データ(採用情報, ニュース情報など)が収集されています。その中で、「いまある情報」から、「価値のあるデータ」へと変換する機能・仕組みの提案やPJのリードを担って頂きます。それらを通じてSalesNowを、より付加価値の高いプロダクトへ昇華させるサポートをして頂きます。
・ビッグデータを利用した仮説検証・意思決定の支援
・ビッグデータを活用したモデル構築、及び、サービスのコア機能の開発
・継続的なモデルの品質評価と改善
・Databricksを用いたデータクレンジング処理の設計/実装
・グラウンドトルゥースデータ作成プロセスの効率化と改善
■開発の進め方 / フロー:
・Asana / Notion を利用したアジャイル開発
・フロントエンド/バックエンド/データチーム/インフラチームなど各領域のスクラムチーム (4〜8人)
・タスクはAsana上のバックログに溜まっているものから優先度と重要度順に対応
■利用するツール・技術:
◇進捗管理
AsanaとNotion を利用したアジャイル開発 (週1回 30 分の定例mtg)
週1回のメンターとの1on1による技術相談
データベース技術勉強会(週1回60分)
◇利用ツール:Google Workspace、Notion、Slack、Asana
◇利用言語:Python、Scala、SQL
◇利用技術:React、FastAPI、Scrapy、Databricks(Apache Spark)、Terraform
◇利用データベース:Aurora(PostgreSQL)、Cloud Spanner、BigQuery、Lakehouse
チーム/組織構成