経営のための直感的統計学 吉田 耕作(日経BP社)
1.全体を一言で表すには
(1)中央値(メディアン):ランク付けして並べた時の真ん中の値
①長所
(平均値と違い)アウトライヤー(外れ値、例外値、極端値)の影響を受けない
常に中央値が唯一存在
煩雑な計算不要
②短所
大量データの序列付けが大変
(2)最頻値(モード):頻度が最大のデータ
①長所
(平均値と違い)アウトライヤー(外れ値、例外値、極端値)の影響を受けない
②短所
存在しない/複数存在する場合あり
2.ばらつき度の諸指標
(1)概算の平均値
データの両端(最大値と最小値)の中間点近くの端数のない値
(2)概算の標準偏差
データ数が非常に多いときは範囲(最大値−最小値)の1/6
データ数が少ないときは範囲(最大値−最小値)の1/4
→ほとんどの場合、1/4〜1/6の間にあると見てよい
3.未知のものに当たりを付ける方法(推定)
(1)(同じ信頼区間で)正確性を倍にしたい場合、サンプル数は4倍必要となる
4.仮説検定
(1)二重の過ち
①正常と判断した中に間違い(異常)があった場合
②異常と判断した中に間違い(正常)があった場合