具体的な業務内容
【ビッグデータエンジニア/リーダー候補】医療×AI◇内閣府認定事業◇上場企業子会社◇フルフレックス
〜プライム上場企業(TOPPAN)子会社/内閣府認定の医療ビックデータ事業展開/フルフレックスで働き方も◎〜
■ポジションのミッション
医療データは、仕様が統一されていないことが多い為、データの内容を確認し、不正確・無関係なデータを特定し、データに対して正確な意味を付与していくこと(標準化・クレンジング)、またデータに混入している個人情報に類する情報を抽出・秘匿すること(マスキング)がメインミッションとなります。
<参考>
内閣府 次世代医療基盤法制度の解説動画
https://wwwc.cao.go.jp/lib_023/jisedaiiryo_animation.html
■具体的な業務内容:
・医療ビッグデータから特定のデータを検出するロジックの設計、開発、テスト
・医療ビッグデータの中にあるフリーテキストから医療情報に資する情報を抽出し、分析可能な形へ構造化する業務
・医療ビッグデータのETL処理、処理改善業務(Python・SQL)
・AIの学習データ作成・管理、精度検証、推論結果の修正
・その他、上記関連業務
※データ分析を主体とした業務ではございません
■本ポジションのやりがい
弊社は、病院以外に地方自治体からも医療データを収集し 分散されているデータの統合を行なっております。 また、数値データだけではなく、電子カルテ内にある医者のコメント内から 症状などを抽出しデータに取り込んでおります。 このような医療データや電子カルテの情報は、世の中にまだ出回っていないため、 希少性の高いデータを扱うことができ、新しいビジネスに挑戦することができます。
■作業環境:
言語:Python(Pandas、Transformersなど)、SQL、R、Shell、バッチ
OS:Windows、Linux
DB:Amazon Redshift、PostgreSQL、DuckDB
IDE:Visual Studio Code、Jupyterなど
ソースコード管理:Git
課題管理:Backlog
変更の範囲:会社の定める業務
チーム/組織構成