AIやデータの発展に伴い社会的ニーズがどんどん高まっている、『データサイエンティスト』。
きっかけは何であれ興味をお持ちの方は多いのではないでしょうか。
そのような方向けに「ゼロからデータサイエンティストを目指すためのロードマップ」をご紹介します。
目指すべきゴールを明確にする
データサイエンティストの定義
まず、「データサイエンティスト」とはどういった人物を指すのでしょうか。
データサイエンティスト協会では、データサイエンティストを下記のように定義しています。
- ビジネス力:課題背景を理解した上で、ビジネス課題を整理し、解決する力
- データサイエンス力:情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力
- データエンジニアリング力:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力
(引用元:データサイエンティスト協会)
データサイエンティストに必要なスキル
データサイエンティストに必要とされる3つの力を満たすために必要なスキルについては、人により定義が異なりますが、本サイトでは以下と定義としています。
- ビジネス力 → コンサルティングスキル
- データサイエンス力 → 統計スキル
- データエンジニア力 → ITスキル
つまり、データサイエンスに関する「コンサルティングスキル」、「統計スキル」、「ITスキル」をバランスよく高めることで「データサイエンティスト」に近づくことができるといえます。
データサイエンティストに必要な資格
「データサイエンティスト」となるために、資格は必要ありません。
また、一定以上の水準にあるデータサイエンティストであることを証明する、いわゆる「データサイエンス資格」も存在しません。
しかし、ご自身がデータサイエンティストを目指すにあたり、下記の理由から、データサイエンティストに必要な3つのスキルに紐づく資格を利用するのは、とても有効なロードマップと考えています。
- スキルを客観的に証明することができる
- 学習のマイルストーンにすることができる
なお、データサイエンスに関する「コンサルティングスキル」、「統計スキル」、「ITスキル」を証明することができる資格は以下のようになっています。
コンサルティングスキル | JDLA試験 | G検定 |
E検定 | ||
統計スキル | 統計検定 | 統計検定2級 |
統計検定準1級 | ||
統計検定1級 | ||
ITスキル | Pythonエンジニア認定試験 | 認定基礎試験 |
データ分析試験 |
※他にも、統計系試験やデータベース系試験などありますが、ここでは代表的なものを掲載しています。
ご自身の現在のレベル次第ですが、ゼロから学習をスタートするのであれば、学べるスキルのレベルや資格取得に必要な時間・費用などを考慮すると「G検定」、「統計検定2級」、「データ分析試験」の3つがオススメです。
データサイエンスをゼロから学んだ際に目指すべき最初のゴール
ここまで見てきたデータサイエンティストの定義・必要なスキル・必要な資格から、データサイエンスをゼロから学び始める皆さんが目指すべき最初のゴールは、以下の3資格を取得している状態とするとよいかと思います。
- G検定(データサイエンスビジネス力の証明)
- 統計検定2級(データサイエンス力の証明)
- Python3エンジニア認定データ分析試験(データエンジニアリング力の証明)
最初のゴールを達成するための期間は、標準で5カ月、早い方であれば2.5か月が目安です。
本サイトでは以下の4ステップを5カ月で進めるプランを紹介します。
- データサイエンスの世界を知る (目安:0.5カ月)
- 統計検定2級の取得 (目安:1.5カ月)
- Pythonの習得 (目安:2カ月)
- G検定の取得 (目安:1カ月)
それぞれのステップについて簡単に紹介していますが、各ステップの詳細(資格取得のための勉強など)は他の記事にまとめていますので、そちらも必要に応じてご参照ください。
データサイエンス関連資格取得の順番について
資格取得の順番については、取り扱う範囲の広さから以下がオススメです。
Python3エンジニア認定データ分析試験
G検定
データサイエンスの世界を知る (目安:0.5カ月)
いきなり細部に入らず、まずは「データサイエンスの世界」を知ることから始めましょう。
データサイエンスの世界の入口として、下記の2冊の本を読まれることをオススメします。
0からはじめる入門データ・サイエンティスト
「“0″からはじめる入門データ・サイエンティスト」はタイトルの通り、データサイエンティストを目指す方のための1冊目にふさわしい入門本です。
データサイエンティストとは何か?どのような知識が必要か?からデータサイエンティストに必要なマネジメント論、必須スキルである統計学の基礎とビジネス応用、さらに統計ツール活用まで幅広く学ぶことができる良書です。
人工知能は人間を超えるか
「人工知能は人間を超えるか ディープラーニングの先にあるもの」は、日本トップクラスの人工知能研究者である松尾豊先生が執筆されたAI(人工知能)の可能性についてまとめられているベストセラーです。
本著はデータサイエンスそのものをテーマとした一冊ではなく、人工知能・AIをテーマとした一冊ですが、データサイエンスを勉強する最初の段階でマクロの視点を身に着けるために読んでいただきたい一冊です。
それぞれ、じっくり読んでも1週間ずつで読むことができるボリュームです。
「データサイエンスのはじめの一歩」については下記に詳しく纏めていますので、合わせてお読みください。
データサイエンス力を高める:統計検定2級の取得 (目安:1.5カ月)
まずは、データサイエンス力である統計スキルを高めるために、統計検定2級を資格習得しましょう。
統計検定2級は「大学基礎科目レベルの統計に関する知識や活用力を評価」する試験です。
平均値・中央値・最頻値、期待値・分散・標準偏差といった基本的なデータ統計量から、統計の核となる推定・検定まで幅広く習得することができます。
「統計検定2級」については下記に詳しく纏めていますので、合わせてお読みください。
データエンジニアリング力を高める:Pythonの習得 (目安:2カ月)
次に、データエンジニアリング力であるITスキルを高めるために、Pythonを習得しましょう。
本ステップでは、「Python3エンジニア認定データ分析試験」の資格取得を目指しますが、特にプログラミングやPythonが初めての方はその前段の学習が必要です。
また、資格取得だけでは実践のデータ分析の場で活用するレベルには達しないため、実践力を身につける学習をするのがベターです。
プログラミングが全くの初めての方であれば2~3カ月程度かけて学びましょう。
Pythonプログラミングスキル基礎力の習得
Pythonのはじめの一歩を安く独学で学べる手段として、『Progate』や『Udemy』があります。
これらを学ぶことで、プログラミング及びPythonのゼロから基礎まで、効率的に身につけるが出来ます。
『Progate』はアプリ形式で、環境構築を行う必要なく、Web上の紙芝居で実際のケースを通してPythonの基本を学ぶことができるアプリです。
『Udemy』は、Web講義形式で、そもそものデータ分析の考え方の理解から 始まり、Progateでは行わなかったJupyter-Notebookを使用したPython実環境の構築手順まで丁寧に教えてくれます(オススメは、『【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門』)。
「Python学習のはじめの一歩」については下記に詳しく纏めていますので、合わせてお読みください。
Python3エンジニア認定データ分析試験の取得
Pyhon3エンジニア認定データ分析試験は、「Pythonを使ったデータ分析の基礎や方法」を問う試験、Numpy、pandas、Matplotlib、scikit-learnの四大ライブラリの活用を中心に問われます。
「Python3エンジニア認定データ分析試験」については下記に詳しく纏めていますので、合わせてお読みください。
Pythonを活用したデータ分析実践力の習得(100本ノック×2)
プログラミングができるようになっただけでは、Pythonを使いこなした、とはいえません。
実際のデータ分析の現場では、分析の前段であるデータ整形(前処理)やレポーティングによる仕組み化が最も重要となってきます。
これらを学べる手段として、、「Python実践データ分析100本ノック」および「Python実践データ分析100本ノック」という、Pythonデータ分析トレーニング本があります。
これらを一通り手を動かして学ぶことで、Pythonデータ分析の「実践力」を身につけることができます。
「実践力を磨くPython学習」については下記に詳しく纏めていますので、合わせてお読みください。
ビジネス力を高める:G検定の取得 (目安:1カ月)
最後に、ビジネス力であるデータサイエンスのコンサルティングスキルを高めるために、G検定を資格習得しましょう。
G検定は、「ディープラーニングを事業に活かすための知識」を問う、事業活用する人材(ジェネラリスト)向けの試験です。
「人工知能」、「機械学習」から「ディープラーニング」まで、AI・ディープラーニングを幅広く学ぶことができます。
「G検定」については下記に詳しく纏めていますので、合わせてお読みください。
まとめ:次のステップへ
ここまでのステップで、データサイエンスに関する一定の「コンサルティングスキル」、「統計スキル」、「ITスキル」を身につけることができ、最初のゴールを達成したと言えます。
しかし本番はここからとも言えます。
転職・独立しデータサイエンティストとして成長する、Kaggle(世界中の機械学習者・データサイエンティストが集まるコンペティションコミュニティ)へ参加する、『E資格』などさらなる上位資格を目指すなど、次のステップはいくらでもあります。
ぜひ、これまで学んだこと、身につけたスキルを活かしてデータサイエンティストとして活躍しましょう!
コメント