近年、データサイエンティストの需要が高まってきていますが、データサイエンティスト必須能力として、
- プログラミング言語
- 統計学
が挙げられています
統計検定を行うことができるプログラミング言語にはRやPythonなどがありますが、より最適なのはPythonだと考えられます
Pythonで統計学を扱えれば、データサイエンティストとしての道も開けるでしょう
今回はPythonで統計学を学ぶメリットや実際にどのように学習していくべきかを解説していきたいと思います
Contents
Pythonで統計学を学ぶメリット
Pythonで統計学を学ぶメリットは、科学計算処理に必要なライブラリが充実している点です
Pythonのライブラリには、統計学に必要な専門的な計算式が含まれており、基本的なデータの扱い方がわかっていれば、統計検定を自由に扱うことができます
特にAnacondaはデータサイエンティスト向けと言えます
Anacondaについては以下の記事を参考にしてください
Pythonで統計学を学ぶには、書籍で学ぶ方法もありますが、時間を短縮したい場合には下記のスクールや学習コンテンツを使用するのも一つの方法です
Pythonによる統計学を学ぶ手順
私はPythonで統計学を学んでいるので、実際にPythonで統計学を学ぶ手順について解説したいと思います
環境構築
まずはPythonを扱えるように環境構築を行う必要があります
統計学を学ぶのであれば、Anacondaを使用するのがおすすめです
Anacondaの環境構築が完了したら、syderを起動させます
基礎文法と用語の理解
まずは統計学の勉強を進める前に、Pythonの基礎文法と用語の理解を進めましょう
あくまでもPythonという言語で統計学を学んでいくため、Pythonの基礎文法がわからなければ、統計学の学習に進むことができません
Pythonのライブラリやモジュール、変数、if文などについては知っておいたほうがいいと思います
ある程度の理解が得られたら、以下の順に進めていきましょう
- 【pythonで統計学】帰無仮説と対立仮説について
- 【pythonで統計学】背理法の基本について
- 【pythonで統計学】ヒストグラムとpythonでの作成方法
- 【pythonで統計学】統計分析におけるデータの種類と扱い方
- 【pythonで統計学】データの代表値を算出する
- 【pythonで統計学】データのばらつきを表す散布度について(四分位数を中心に)
- 【pythonで統計学】統計解析に必須の分散と標準偏差・平均偏差について
- 【pythonで統計学】データのばらつきを示す変動係数の求め方
- 【pythonで統計学】ノンパラメトリックとパラメトリック検定について
- 【pythonで統計学】pandasを使って要約統計量を算出する方法
- 【pythonで統計学】正規性の検定(シャピロウィルク検定etc)のかけ方
- 【pythonで統計学】マンホイットニーのU検定を実施する
- 【pythonで統計学】ウィルコクソン符号付き順位検定
- 【pythonで統計学】等分散性の検定について(ルビーン検定・バートレット検定)
- 【pythonで統計学】t検定のかけ方
- 【pythonで統計学】相関係数を算出する
- 【pythonで統計学】95%信頼区間の求め方
上記のリンクから統計学に関する情報は概ね網羅することができるようになっています
2群の比較までならこれでOKです
ここまで学習することができたら、求人を確認しておきましょう
求人の「応募資格」を確認することで、自分に足りない部分を把握することができます
Pythonで統計学を学ぶ上で必須書籍
Pythonを独学で学ぶ
Pythonを独学で学ぶにはそれなりの時間と根気が必要だと思いますが、一番安く済みます
ただし、挫折もしやすいかと思います
挫折をしやすい理由は、
- エラーが出たときに、解決方法がわからない
- 何から学べばいいかわからない
- 自分のやる気で左右されてしまう
といった理由が挙げられます
しかし、上記の理由をクリアすることができる場合には、Pythonを独学で学ぶのがおすすめです
もし難しそうであれば、スクールなどを利用しましょう
求人を見ていると、スクールに通ったとしてもすぐにペイできそうなので、スクールに通うメリットもあるかと思います
Pythonを独学で学ぼうと思っている方は、以下の記事も参考にしてみてください
Pythonや統計学を無料で学ぶことができる学習コンテンツ
Pythonや統計学は書籍でも学ぶことができますが、現在では無料で学ぶことができる学習コンテンツも増えてきました
ここからはPythonや統計学を無料で学ぶことができる学習コンテンツスクールを紹介していきます
Aidemy
株式会社アイデミーが提供する「Python入門【アイデミー】」では、プログラミング基礎と組み込み関数などを学ぶことができます
文字の出力、変数の概要、条件分岐、ループなど、Pythonの基本的な使い方をマスターすることが可能
受講対象者は「プログラミング未経験の人」や「Pythonを体系立てて復習したい人」
前提知識は特になく、標準受講時間は4時間となっています
アイデミーの詳細はこちらの記事をご覧ください
gacco
オンライン講座サイト「gacco(ガッコ)」では、データ分析の基礎を学習できる「統計学Ⅰ:データ分析の基礎」が開講されており、無料で受講することができます
本講座では、身近なデータの具体的な例をあげながら、その種類の違いを理解し、それぞれに適した処理法やグラフ・表による整理の方法を学ぶことができます
それと合わせて、データが持つ特徴やデータ間の関連性を説明するために、数値を用いたデータの要約の方法も学ぶことができます
RUNTEQ
RUNTEQは
- 修了生のポートフォリオがとてもハイレベル
- 充実した転職・就職サポートと挫折させないバディ制度、活発なコミュニティ
というかなりハイレベルなスクールです
プログラミングスクールRUNTEQ(@_RUNTEQ_ )さん受講しているんだけど、すごくよい!
一般的なスクールのようにただチュートリアルを写経するのではなくて、
・仕様書を読み解いて新規実装
・プルリクエストを通して自動テストで課題解決って感じだから、考えて実装できるようになるな。 pic.twitter.com/z17XdBfVDV
— DAI (@never_be_a_pm) July 25, 2020
テックジム
テックジムは無料でPython学習を進めることができます
いきなり有料会員になるのはハードルが高いため、無料でPythonの講座を受けてみて、自分に合う合わないを判断することもできます
無料カウンセリングもあるので、まずはカウンセリングを受けてみて、どうするかを決めましょう
まとめ
Pythonで統計学を学び、統計手法を扱うことができるようになれば、データサイエンティストとしての道も開けるようになります
データサイエンティストは今後も需要が高まっていきますし、Pythonを学んでおけば、AIなどに分野についても学び進めることができます
「Python「統計学」と両者を扱うことができれば、それだけで、自身の付加価値を高めることができるため、今後の就職などにも有利になります
ぜひこの機会に学習を進めてみてはいかがでしょうか