Excelで実践するデータ分析!Excelでここまで分析できる!

Excelでできるデータ分析データサイエンス

データサイエンスの学習を進めていく中で、統計学・Pythonなどのプログラミングツールを活用したデータ分析を行いたいという思いは共通と思います。

しかし、中にはデータ分析のためにプログラミングを始めたくないという方もいるのではないでしょうか。実際データ分析を行うのに必ずしもPythonなどのプログラミングツールは必須ではありません。

皆さんが普段から使用しているであろうExcel、実は立派なデータ分析ツールとして活用ができるのです。

本記事ではExcelでできるデータ分析、またPythonでデータ分析を行う意義について紹介します。

スポンサーリンク

簡単なデータ分析はExcelでできる

前述の通り、皆さんが普段使用しているExcelを活用して一般的なデータ分析を行うことができます。

実際、データサイエンスの入門書籍や研修では、まずPythonやRなどのプログラミングツールを使わずにExcelを活用したデータ分析から実施するのがスタンダードです。

データサイエンスの世界ではそのくらいExcelの活用を重要視しているということです。

スポンサーリンク

高度なデータ分析はPythonを活用したい

Excel or Python?の結論として、簡単なデータ分析はExcelでできるが、高度なデータ分析・活用を行いたい場合はPythonの活用がベターです。

「お勉強」としてデータ分析を学び始めるとどうしても、統計学を活かして、Pythonを駆使してデータ分析のアプトプットを出したくなるものです。しかし統計学やPythonはあくまでツールであり手段です。

重要なのはまず「何をデータ分析したいのか」です。この目的を達成するために適切なツール(手段)を活用することがあるべき姿です。そのため、データサイエンスを学ぶのであればExcel、Python両方を使えるようになり、それぞれの強みや弱みを理解して必要に応じてこれらを使いこなしましょう!

スポンサーリンク

Excelでできるデータ分析

まず、Excelを活用したデータ分析について学ぶ場合、「問題解決のためのデータ分析基礎講座」および「問題解決のためのデータ分析応用講座」の2冊がオススメです。

 

Excelでできるデータ分析はもちろんのこと、前段としてデータ分析そのものに対する考え方や、データ分析を実際の課題ベースで行っていくため「使えるデータ分析」が身に付きます。(普段からExcelを使う方であれば「問題解決のためのデータ分析応用講座」からスタートして問題ありません)

 

話は戻り、Excelの活用でざっと挙げるだけでも下記のようなデータ分析が実現できます。

  • 基本統計量(平均値、中央値、最大値・最小値、分散、標準偏差など)
  • データの可視化
  • データの相関
  • 検定(t検定、z検定、F検定など)
  • 回帰分析
  • 分散分析

基本統計量・データの可視化・データ相関

平均値、中央値、最大値・最小値、分散、標準偏差などの基本統計量や、様々なグラフによるデータの可視化などはExcelで実際に使われている方がほとんどではないでしょうか。

相関や共分散といったデータの相関を含め、これらは関数やグラフの挿入で簡単に行うことができるため、これらのデータ分析が目的であればExcelで十分と言えます。

特にデータの可視化については、Pythonは人間が表示するグラフを選択するため勘所が必要になる一方で、Excelは「おすすめグラフ」の一覧から適切なグラフを表示してくれることを考慮するとExcelのほうが便利と言えます。

検定・回帰分析・分散分析

Excelを活用すれば検定・回帰分析・分散分析といった応用編のデータ分析も可能です。

これらのデータ分析を実行するためにはExcel上でアドインが必要となります。Excelの「ファイル」→「オプション」→「アドイン」からソルバー分析ツールを有効化してください。

検定・回帰分析・分散分析を実施できる形式にデータ整形を行えば、このExcelアドインでデータ分析を実施できます。どうでしょうか、Excel活用でかなりのデータ分析ができることが理解できたのではないでしょうか。

なお、Excel活用による検定・回帰分析・分散分析では、出力結果をもとにデータ分析の結果が有意であるかを判断する必要があります。そのためこれらのデータ分析を行うには統計的仮説検定について理解している必要があります。

また、データ分析において最重要要素となるデータ整形が大変という一面を持ちます。

例えば回帰分析を行うにあたりデータ整形で実施する質的データ(カテゴリカルデータ)のダミー変数化(0-1データ化)は、Excelでは手動で各ダミー変数を作成する必要がありますが、Pythonではそれが一つの関数で実現できます。

これらのデータ分析はPythonでよりその力を発揮すると言えます。

スポンサーリンク

Pythonで実施すべきデータ分析

ここまではExcelで実施できるデータ分析を紹介してきました。ではPythonで実施すべきデータ分析は何でしょうか。

いわゆる機械学習と言われる領域全般についてはPythonで実施することが最大のメリットになります。前述の回帰分析のようにExcelで実施できることもあるのですが基本的には再現が困難です。

一方でPythonの場合ライブラリが優秀なので一度「型」を覚えてしまえば大量のデータをインプットに一瞬で学習と評価を行い最適解を出すことができます。

今後データ分析が必要、でもこれからPythonを学ぶのに尻込みしてしまう、という方は一度Pythonで機械学習のプログラミングをしてみてください。Pythonを覚えたほうが圧倒的に効率が良い、という結論に至るはずです。
スポンサーリンク

まとめ

本記事でご紹介したように、Excelは非常に強力なデータ分析ツールです。

基本的なデータ分析はExcelで実施することが可能ですので統計やプログラミングに長けてないとデータ分析ができないということはありません。一般的なグラフによるデータ可視化においてはむしろExcelのほうが便利と言えます。

しかし機械学習をはじめとした本格的なデータ分析に直面すると、Pythonの便利さに圧倒されるはずです。

どちらが良いということではなくデータ分析の目的に応じて必要なツール(手段)としてExcelやPythonを使えるようになると立派なデータサイエンティストに近づくことができます!

コメント