具体的な業務内容
【ビッグデータエンジニア|医療×AI】内閣府認定事業/上場企業子会社/フルフレックス
〜プライム上場企業(TOPPAN)子会社/内閣府認定の医療ビックデータ事業展開/フルフレックスで働き方も◎〜
全国の医療機関、地方公共団体、介護事業者等から収集する医療データの内容を確認し、不正確・無関係なデータを特定し、医療データに対して正確な意味を見出す業務と、医療データに混入している個人情報に類するデータをマスキングする業務をAI等の最新技術や医療知識を使ってご担当いただきます。
【変更の範囲:会社の定める業務】
■業務イメージ:
当社は、全国の医療機関や地方公共団体から医療データを収集いたします。
医療データは、仕様が統一されていないことが多く、また、医療機関によって入力・管理方法が異なることから、そのままでは利活用することができません。
すなわち、医療データの内容を確認し、不正確・無関係なデータを特定し、医療データに対して正確な意味を付与していくこと(標準化・クレンジング)が必要です。
また、医療データに混入している個人情報に類する情報を抽出・秘匿すること(マスキング)も必要となります。
今回募集する方には、こうした標準化・クレンジングやマスキングといった医療データの加工をAI等の技術や医療知識を使って実施する業務をご担当いただきます。
■具体的な業務内容:
・医療データに含まれる個人情報等に関連する情報を検出しマスキングする業務
・医療データの整合性を確認し、不整合があれば是正する業務
・医療データの中にあるフリーテキストから医療情報に資する情報を抽出し、分析可能な形へ構造化する業務
・上記の業務に活用するAIの学習データ作成・管理、精度検証、推論結果の修正
・上記の業務に活用する医療データの抽出業務(Python・R・SQL)
・その他、上記関連業務
■作業環境:
言語:Python(Pandas、Transformersなど)、SQL、R、Shell、バッチ
OS:Windows、Linux
DB:Amazon Redshift、PostgreSQL、DuckDB
IDE:Visual Studio Code、Jupyterなど
ソースコード管理:Git
課題管理:Backlog
変更の範囲:本文参照
チーム/組織構成