具体的な業務内容
【東京】データエンジニア※データ入力およびシステム開発/無形資産可視化データで未来を予測する企業
アスタミューゼの根幹であるデータ基盤を各サービスに活用できるように構築・整備していくチームとなります。エンジニアも全事業領域をまたいで業務に取り組んでいただけるため、事業拡大とともに個人の成長も実現できる環境となっています。
◆概要
●圧倒的な量と質を誇る世界最大級の無形資産可視化データベース
●傑出したデータ統合基盤が戦略的に構造化、的確な未来予測から社会課題の解決
アスタミューゼでは、世界193カ国、39言語、7億件を超える世界最大級の無形資産可視化データベースを構築しており、世界中のテクノロジー・無形資産(特許・論文・グラント(研究開発資金))や社会課題(炭素、地球環境など)、クラウドファンディングの調達金額データ、ベンチャー企業への投資金額データなどの膨大なデータで成り立っています。
今後の数十年に大きな影響を与える未来の姿を分析するために、ビジネス、テクノロジー、サイエンスの視点から世界の投資、イノベーションデータの収集、統合、整備を行っています。また、自然言語や論文・特許などのグラフ・表、画像、動画などの非構造化データが多いことがデータの特徴です。
データチームではグラントや特許などのデータの収集からデータサイエンティストやアナリストが分析しやすい形への整備までを一貫して行っており、世界中のデータを分析するための英語翻訳や、データ処理の高速化や自動化なども行っています。
例えば、各国の特許庁データの更新を検知、自動で取得する機能の開発など新しい試みや、データの取得から分析、翻訳、名寄せ、統合までの自動化も進めており、決められたものを作るのではなく自分たちでどうしていくべきか、何を作りたいかを決めていけるチャンスがある環境です。
◆具体的な業務内容
・投資データ、特許など様々な種類のデータのデータベース設計
・GCPを用いたデータパイプラインの開発運用
・各種データソースとデータパイプラインの連携のためのツール開発運用
・ETL処理基盤の開発運用
・大規模データ分析における処理基盤において、高速なデータ処理の実現 など
チーム/組織構成