データサイエンティストになるには
ビッグデータが身近になるにしたがって、「データサイエンティスト」という言葉も耳にするようになりました。データをビジネス活用する際に欠かせない職種ですが、その仕事については「データを分析するだけ」と思われがち。比較的新しい職種のため、まだ理解は進んでいないのが実情です。データサイエンティストという仕事について、考えてみましょう。
データサイエンティストの仕事
実際、データサイエンティストはどのような仕事をしているのでしょうか? 具体的には、大きく以下の3つの仕事が挙げられるでしょう。
- データを分析してビジネスに繋げる
- 分析基盤環境の構築、運用を行う
- 分析結果や結果に基づく解決、改善策をレポートする
具体的には、レジのPOSから得られた顧客データを商品開発に活用したり、ウェブ広告のクリック数や反応したユーザーを分析して新たな広告戦略を立案したりといったことが挙げられます。またその分析・検討・活用のための効果的なデータベースを設計・構築・運用することもデータサイエンティストの役割です。
データサイエンティストに求められるスキル
1. ログやAPIからのデータ収集スキル
データを収集するために、システムのログやWebAPIなどを用いたバッチ処理を構築できる必要があります。また、さまざまなシステムからデータを集めてくることになるため、出力フォーマットを効果的に統一できるスキルも求められるでしょう。
2. 収集データを蓄積するDB関連スキル
データを蓄積するためにデータベース関連のスキルは欠かせません。HadoopやNoSQLも台頭してきていますが、従来からのMySQLなどのRDBMSも使われています。データの粒度やリアルタイム分析、長期的な分析を考慮して、どのようなDBにすればもっとも自社製品・サービスにまっちした設計ができるか、複数の技術を組み合わせて利用できるとよいでしょう。
3. 蓄積したデータを活用するための環境構築
大量のデータを蓄積できたとしても、その分析・検討に時間がかかっていては、ビジネスに活用するのは難しいでしょう。蓄積したデータを活用するために、各種ツールやデータ操作環境の構築も求められます。適切な負荷分散や、適切なツールの選定が求められるでしょう。
4. 統計学などを用いて矛盾や改善ポイントを探す能力
統計学を学んでいても、データから状況を分析できなければ意味がありません。実際のデータを見て考える必要があるため、機械的に判断することができないのも特徴です。経験ももちろん大切ですが、いかに客観的にデータを捉えるかが重要になります。
5. 分析結果を分かりやすく伝える能力
分析結果をもとに、ビジネスの改善をおこなうことがデータサイエンティストの最重要目標です。そのためには、経営層や責任者が事業の目標などに対しどういう状況かを知る必要があります。判断材料とするためには、データから見える現状を分かりやすく伝える能力が求められるでしょう。
分析能力だけではなくDB関連のスキルや資料作成、プレゼンテーション能力が必要だということがわかるでしょう。データ活用の提言をするにあたっては、経営者的な目線も必要かもしれません。ITエンジニアとして、さまざまな能力をバランスよく備えている必要があります。現在、データサイエンティストを採用する求人数は多くありませんが、ビッグデータがより深くビジネスに浸透する時代になれば、その需要もさらに増えていくでしょう。(ライター:ナレッジ・リンクス/原 進)