分布の特性

取得したデータについて全体の特性を見たいときは、まずグラフにして確認することです。泥臭いようですが、まずは自分でデータを見ておく、ということは結構重要だったりします。

統計学的には、分布の特性をあらわす統計量がいくつか提案されています。統計量は、大きく分けて分布の中心を表す代表値と、分布のバラツキを表す散布度があります。

代表値

算術平均

幾何平均

調和平均

最頻値

中央値

散布度

標準偏差

分散

歪度

尖度

平均偏差

四分位

変動係数

モーメント

統計学におけるモーメントの概念について少し。元々は力学用語で(?)を回転させたときの力を表しているようですが、統計学的にはある点を中心とした*1分布のばらつき具合を表します。一般的に、平均をμとしたときk次のモーメントは

で表されます*2。また、2次〜4次のモーメントについては

に相当する値になっています。実際の式は上の「散布度」をご覧ください。

*1 大抵は平均値ですが
*2 これを特に「平均値周りのモーメント」といいます