データサイエンティストへのロードマップ【スキル向上の4ステップ】

データサイエンティストへの学習ロードマップデータサイエンス

AIやデータの発展に伴い社会的ニーズがどんどん高まっている、『データサイエンティスト』。

きっかけは何であれ興味をお持ちの方は多いのではないでしょうか。

その一方、何を学べばいいのか、悩んでいる方も少なくないと思います。

そのような方向けに「ゼロからデータサイエンティストを目指すためのロードマップ」をご紹介します。

私自身、データサイエンスの経験やスキルが無いところからAI・データ分析に興味を持ち、データ分析コンサルティングを行うまでに至っているため、本ロードマップは自身の経験を踏まえたものにもなっています。
スポンサーリンク

目指すべきゴールを明確にする

データサイエンティストの定義

まず、「データサイエンティスト」とはどういった人物を指すのでしょうか。

データサイエンティスト協会では、データサイエンティストを下記のように定義しています。

データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル
さらに、この人物像を満たすために必要とされる3つの力を以下のように定義しています。
 
  1. ビジネス力:課題背景を理解した上で、ビジネス課題を整理し、解決する力
  2. データサイエンス力:情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力
  3. データエンジニアリング力:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力

(引用元:データサイエンティスト協会)

データサイエンティストに必要なスキル

データサイエンティストに必要とされる3つの力を満たすために必要なスキルについては、人により定義が異なりますが、本サイトでは以下と定義としています。

  1. ビジネス力 → コンサルティングスキル
  2. データサイエンス力 → 統計スキル
  3. データエンジニア力 → ITスキル

 

つまり、データサイエンスに関する「コンサルティングスキル」、「統計スキル」、「ITスキル」をバランスよく高めることで「データサイエンティスト」に近づくことができるといえます。

データサイエンティストに必要な資格

データサイエンティスト」となるために、資格は必要ありません。

また、一定以上の水準にあるデータサイエンティストであることを証明する、いわゆる「データサイエンス資格」も存在しません。

しかし、ご自身がデータサイエンティストを目指すにあたり、下記の理由から、データサイエンティストに必要な3つのスキルに紐づく資格を利用するのは、とても有効なロードマップと考えています。

  • スキルを客観的に証明することができる
  • 学習のマイルストーンにすることができる

なお、データサイエンスに関する「コンサルティングスキル」、「統計スキル」、「ITスキル」を証明することができる資格は以下のようになっています。

コンサルティングスキルJDLA試験G検定
E検定
統計スキル統計検定統計検定2級
統計検定準1級
統計検定1級
ITスキルPythonエンジニア認定試験認定基礎試験
データ分析試験

※他にも、統計系試験やデータベース系試験などありますが、ここでは代表的なものを掲載しています。

ご自身の現在のレベル次第ですが、ゼロから学習をスタートするのであれば、学べるスキルのレベルや資格取得に必要な時間・費用などを考慮すると「G検定」、「統計検定2級」、「データ分析試験」の3つがオススメです。

データサイエンスをゼロから学んだ際に目指すべき最初のゴール

ここまで見てきたデータサイエンティストの定義・必要なスキル・必要な資格から、データサイエンスをゼロから学び始める皆さんが目指すべき最初のゴールは、以下の3資格を取得している状態とするとよいかと思います。

  1. G検定データサイエンスビジネス力の証明)
  2. 統計検定2級データサイエンス力の証明)
  3. Python3エンジニア認定データ分析試験データエンジニアリング力の証明)

最初のゴールを達成するための期間は、標準で5カ月、早い方であれば2.5か月が目安です。

本サイトでは以下の4ステップを5カ月で進めるプランを紹介します。

  1. データサイエンスの世界を知る (目安:0.5カ月)
  2. 統計検定2級の取得 (目安:1.5カ月)
  3. Pythonの習得 (目安:2カ月)
  4. G検定の取得 (目安:1カ月)

それぞれのステップについて簡単に紹介していますが、各ステップの詳細(資格取得のための勉強など)は他の記事にまとめていますので、そちらも必要に応じてご参照ください。

データサイエンス関連資格取得の順番について

資格取得の順番については、取り扱う範囲の広さから以下がオススメです。

統計検定2級
Python3エンジニア認定データ分析試験
G検定
G検定では、Pythonによるデータ分析で取り扱う機械学習が試験範囲のひとつとなること、またPythonによるデータ分析の前提として一定の統計知識が必要となるためです。
 
注意点として、統計検定2級およびPython3エンジニア認定データ分析試験はCBT試験(コンピュータを利用して実施する試験)のため、年中受験可能である一方、G検定は受験日程が年3回(3月、7月、11月)と限られていますので学習計画にご留意ください。
スポンサーリンク

データサイエンスの世界を知る (目安:0.5カ月)

いきなり細部に入らず、まずは「データサイエンスの世界」を知ることから始めましょう。

データサイエンスの世界の入口として、下記の2冊の本を読まれることをオススメします。

0からはじめる入門データ・サイエンティスト

 

「“0″からはじめる入門データ・サイエンティスト」はタイトルの通り、データサイエンティストを目指す方のための1冊目にふさわしい入門本です。

データサイエンティストとは何か?どのような知識が必要か?からデータサイエンティストに必要なマネジメント論、必須スキルである統計学の基礎とビジネス応用、さらに統計ツール活用まで幅広く学ぶことができる良書です。

人工知能は人間を超えるか

「人工知能は人間を超えるか ディープラーニングの先にあるもの」は、日本トップクラスの人工知能研究者である松尾豊先生が執筆されたAI(人工知能)の可能性についてまとめられているベストセラーです。

本著はデータサイエンスそのものをテーマとした一冊ではなく、人工知能・AIをテーマとした一冊ですが、データサイエンスを勉強する最初の段階でマクロの視点を身に着けるために読んでいただきたい一冊です。

本著は、『G検定』の学習参考書としても使用できます。
 

それぞれ、じっくり読んでも1週間ずつで読むことができるボリュームです。

 

データサイエンスのはじめの一歩」については下記に詳しく纏めていますので、合わせてお読みください。

スポンサーリンク

データサイエンス力を高める:統計検定2級の取得 (目安:1.5カ月)

まずは、データサイエンス力である統計スキルを高めるために、統計検定2級を資格習得しましょう。

統計検定2級は「大学基礎科目レベルの統計に関する知識や活用力を評価」する試験です。

平均値・中央値・最頻値、期待値・分散・標準偏差といった基本的なデータ統計量から、統計の核となる推定・検定まで幅広く習得することができます。

統計学を初歩から統計検定2級レベルまで学べる「統計WEB」という無料のWebサイトで統計を学び、「統計検定 2級 公式問題集」で知識の棚卸をすることで合格にたどり着くことができます。

 

統計検定2級」については下記に詳しく纏めていますので、合わせてお読みください。

スポンサーリンク

データエンジニアリング力を高める:Pythonの習得 (目安:2カ月)

次に、データエンジニアリング力であるITスキルを高めるために、Pythonを習得しましょう。

本ステップでは、「Python3エンジニア認定データ分析試験」の資格取得を目指しますが、特にプログラミングやPythonが初めての方はその前段の学習が必要です。

また、資格取得だけでは実践のデータ分析の場で活用するレベルには達しないため、実践力を身につける学習をするのがベターです。

本ステップが最も個人差が生じるステップです。
プログラミングが全くの初めての方であれば2~3カ月程度かけて学びましょう。

Pythonプログラミングスキル基礎力の習得

Pythonのはじめの一歩を安く独学で学べる手段として、『Progate』や『Udemy』があります。

これらを学ぶことで、プログラミング及びPythonのゼロから基礎まで、効率的に身につけるが出来ます。

Progate』はアプリ形式で、環境構築を行う必要なく、Web上の紙芝居で実際のケースを通してPythonの基本を学ぶことができるアプリです。

Progate

 

Udemy』は、Web講義形式で、そもそものデータ分析の考え方の理解から  始まり、Progateでは行わなかったJupyter-Notebookを使用したPython実環境の構築手順まで丁寧に教えてくれます(オススメは、『【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門』)。

Python学習のはじめの一歩」については下記に詳しく纏めていますので、合わせてお読みください。

Pythonの学習を始めよう!今は安く独学で学べる手段があります
データサイエンスに興味を持ち勉強を始めた方、データサイエンスに必要なスキルを理解し統計学の考え方もわかってきた。さらに一歩踏み込んだデータ分析を行えるようになるにはデータ分析に強いプログラミング、『Python』を学ぶ必要があるという考えに至ったかと思います。ではいざPythonの学習を始めるにあたって何から手を付けたらよいのか。そういった方向けに最初の第一歩を踏み出すきっかけになればと思います。現在のご自身のレベル、さらにどれだけお金や時間をかけられるかによるところが大きいので、自分の場合はどうか、と考えながら読み替えていただければと思います。

Python3エンジニア認定データ分析試験の取得

Pyhon3エンジニア認定データ分析試験は、「Pythonを使ったデータ分析の基礎や方法」を問う試験、Numpy、pandas、Matplotlib、scikit-learnの四大ライブラリの活用を中心に問われます。

公式テキストである「Pythonによるあたらしいデータ分析の教科書」を実際にプログラミングしながら学び、模擬試験で知識の棚卸をすることで合格にたどり着くことができます。

Python3エンジニア認定データ分析試験」については下記に詳しく纏めていますので、合わせてお読みください。

Pythonを活用したデータ分析実践力の習得(100本ノック×2)

プログラミングができるようになっただけでは、Pythonを使いこなした、とはいえません。

実際のデータ分析の現場では、分析の前段であるデータ整形(前処理)やレポーティングによる仕組み化が最も重要となってきます。

これらを学べる手段として、、「Python実践データ分析100本ノック」および「Python実践データ分析100本ノック」という、Pythonデータ分析トレーニング本があります。

これらを一通り手を動かして学ぶことで、Pythonデータ分析の「実践力」を身につけることができます。

さらに、Python3エンジニア認定データ分析試験まで学ばなかったNetworkX、pulp、ortoolpy、seaborn、OpenPyXlまで手を広げることが出来ます。

実践力を磨くPython学習」については下記に詳しく纏めていますので、合わせてお読みください。

Pythonを実践に則した形式で活用したデータ分析を学びたい方へ
データサイエンスの学習としてデータ分析のツールとしてPythonを学びはじめ、基本的なライブラリの活用を理解した方、では実際の現場でPythonを活用したデータ分析ってどうやって行われるの?というのが気になりますよね。本記事では、Pythonの基本を勉強済の方向けに、実践形式でPythonを活用したデータ分析演習を行うステップを紹介します。
スポンサーリンク

ビジネス力を高める:G検定の取得 (目安:1カ月)

最後に、ビジネス力であるデータサイエンスのコンサルティングスキルを高めるために、G検定を資格習得しましょう。

G検定は、「ディープラーニングを事業に活かすための知識」を問う、事業活用する人材(ジェネラリスト)向けの試験です。

人工知能」、「機械学習」から「ディープラーニング」まで、AI・ディープラーニングを幅広く学ぶことができます。

公式テキストである「ディープラーニング G検定(ジェネラリスト) 公式テキスト」で学習しながら、問題集や模擬試験で知識の棚卸、さらにAIのトレンドを把握をすることで合格にたどり着くことができます。

 

G検定」については下記に詳しく纏めていますので、合わせてお読みください。

スポンサーリンク

まとめ:次のステップへ

ここまでのステップで、データサイエンスに関する一定の「コンサルティングスキル」、「統計スキル」、「ITスキル」を身につけることができ、最初のゴールを達成したと言えます。

しかし本番はここからとも言えます。

転職・独立しデータサイエンティストとして成長する、Kaggle(世界中の機械学習者・データサイエンティストが集まるコンペティションコミュニティ)へ参加する、『E資格』などさらなる上位資格を目指すなど、次のステップはいくらでもあります。

ぜひ、これまで学んだこと、身につけたスキルを活かしてデータサイエンティストとして活躍しましょう!

コメント