python-manブログ

【pythonで統計学】データのばらつきを示す変動係数の求め方〜サンプルコード付き〜

syou0445 2021年10月15日 / 2022年2月11日

python 統計学データのばらつき変動係数

記事内に商品プロモーションを含む場合があります

これまで四分位数を使った散布度や分散・標準偏差を使った散布度を求めてきました

しかし、実際のデータでは平均値同士が異なる場合があります

そういった場合には、「変動係数」という散布度を用いることで、異なるデータ同士を比較することができます

今回は変動係数をpythonで求める方法について解説していきたいと思います

pythonで統計学を順序立てて学びたい方は、こちらの記事を参考に進めてみてください

pythonで統計学を学ぶメリット〜実際の学習手順を紹介〜近年、データサイエンティストの需要が高まってきていますが、データサイエンティスト必須能力として、「プログラミング言語」「統計学」が挙げられています。pythonで統計学を扱えれば、データサイエンティストとしての道も開けるでしょう。今回はpythonで統計学を学ぶメリットや実際にどのように学習していくべきかを解説していきたいと思います。...

Contents

1 変動係数とは
- 1.1 変動係数の求め方
- 1.2 pythonで変動係数を求める方法
2 まとめ
- 2.1 pythonで統計学を学ぶ上で必須書籍
- 2.2 Pythonの独学をスムーズに行うために

変動係数とは

変動係数とは、標準偏差を平均値で割った値を指します

単位の異なるデータのばらつきや、平均値に対するデータとばらつきの関係を相対的に評価する際に使用する数値となります

データのばらつきが大きければ、変動係数は大きくなり、

データのばらつきが小さければ、変動係数は小さくなります

変動係数の求め方

例えば、2010年の1人あたり県民所得の平均が16.3万円、標準偏差は5.5万円だったのに対して、

2020年の1人あたり県民所得の平均は113.3万円、標準偏差は25.8万円だったとします

どちらも同じ県民所得というデータですが、明らかに両者のデータは異なるということがわかります

単純に標準偏差だけで比較すれば約5倍、大きくなっています

さらに平均値で言えば、約7倍、大きくなっています

このような時に、変動係数を求めます

変動係数は標準偏差/平均値で求めることができるので、

5.5/16.3=0.33(33%)

25.8/113.3=0.22(22%)

このようにみると、2010年の県民所得の方がばらつきが大きいことがわかります

分散や標準偏差は、元のデータに左右されます

そのため、元データの大きさが2群間で異なる場合には、標準偏差などで比較してしまうと、誤った解釈になりかねません

そういった場合、変動係数を用います

pythonで変動係数を求める方法

では実際にpythonで変動係数を求めていきたいと思います

変動係数は標準偏差/平均なので、標準偏差を求めていきます

import numpy as np

sample=[17,18,8,5,1,9]

#平均値を算出
mean=np.mean(sample)
print("平均値は",mean)
#標準偏差
std=np.std(sample)
print("標準偏差は",std)
#変動係数
variation=std/mean
print("変動係数は",variation)

また、spicy.statsのvariationを使用することでも変動係数を求めることができます

from scipy import stats
sample=[17,18,8,5,1,9]

variation=stats.variation(sample)
print("変動係数は",variation)

どちらの方法でも同じ結果になることがわかります

使いやすいのはscipy.statsを使った方法です

まとめ

変動係数はデータ間が異なる場合に用いる
変動係数は1を超えるとばらつきが非常に大きい
変動係数を求めるにはscipy.statsのvariationを用いる

pythonで統計学を学ぶ上で必須書籍

Pythonで学ぶあたらしい統計学の教科書

posted with ヨメレバ

馬場真哉翔泳社 2018年04月19日頃

楽天ブックス

完全独習統計学入門

posted with ヨメレバ

小島寛之ダイヤモンド社 2006年09月

楽天ブックス

統計学入門

posted with ヨメレバ

東京大学東京大学出版会 1991年07月01日頃

楽天ブックス

現場で使える！pandasデータ前処理入門機械学習・データサイエンスで役立つ前処理手法

posted with ヨメレバ

株式会社ロンバート翔泳社 2020年04月20日頃

楽天ブックス

はじめてのPython & seaborn

posted with ヨメレバ

十河宏行朝倉書店 2019年01月30日頃

楽天ブックス

Pythonの独学をスムーズに行うために

Pythonを独学で学んでいると、

「何このエラー」

「何が悪いのかよくわからない」

「この文法どうすればいいんだっけ？」

という場面に何度も遭遇します

そういう時に便利なのが、kindleとテラテイルです

Kindleはご存知の通り、電子書籍ですが、

Kindleには多くのpython学習本が用意されており、無料で読むことができます。

(たまに有料もあります)

ひとまずどういった書籍があるのか？

もしものために、書籍に目を通しておこう

という場合には、kindleの利用がおすすめです。

kindleでpythonの書籍を無料で読んでみる
また、webで調べて、試行錯誤しても全くわからない…

っていう状況を打破してくれる、手助けしてくれるのが、テラテイルです。

実現したいこと・エラーメッセージ・コードなどを記載すれば、プロのエンジニアの方々が手助けをしてくれます。

どちらも登録しておいて損はないサイトです。

Python初心者はぜひ利用してみてください。

python 統計学データのばらつき変動係数

おすすめプログラミングスクール

DMMWEBCAMP

WEBCAMPはコスパ最強
WEBCAMPは初心者に優しい充実したサポート付き
16週間プランを選択して、返金してもらおう

WEBCAMPの公式ページはこちら WEBCAMPの口コミ・評価はこちら

テックアカデミー 　

テックアカデミーは費用対効果抜群
テックアカデミーのサポートは個人の能力に応じつつ、python初心者に優しい
まずは無料体験でテックアカデミーを知ってから受講を決める

テックアカデミーの公式ページはこちらテックアカデミーの口コミ・評価はこちら

キカガク

多種多様なスキルコース
初心者から専門家まで対象
給付金利用で費用を抑えられる

キカガクの公式ページはこちらキカガクの口コミ・評価はこちら

Aidemy Premium

完全オンラインで、時間や場所に縛られず学習したい
マンツーマン学習サポートにより実践に近い経験をしたい
未経験から機械学習エンジニアになりたい

Aidemy Premiumの公式ページはこちら Aidemy Premiumの口コミ・評価はこちら

相関係数を求める方法〜サンプルコード+可視化付き〜【Pythonで統計学...

【pythonで統計学】不偏標準偏差とは？標準偏差との違いについて

python 統計学不偏標準偏差

My Agile Privacy

This website uses technical and profiling cookies. Clicking on "Accept" authorises all profiling cookies. Clicking on "Refuse" or the X will refuse all profiling cookies. By clicking on "Customise" you can select which profiling cookies to activate.

Accept Refuse Customize