Smily Books Blog 2023年7月更新中

経営のための直感的統計学 吉田 耕作(日経BP社)

1.全体を一言で表すには
(1)中央値(メディアン):ランク付けして並べた時の真ん中の値
 ①長所
  (平均値と違い)アウトライヤー(外れ値、例外値、極端値)の影響を受けない
  常に中央値が唯一存在
  煩雑な計算不要
 ②短所
  大量データの序列付けが大変
(2)最頻値(モード):頻度が最大のデータ
 ①長所
  (平均値と違い)アウトライヤー(外れ値、例外値、極端値)の影響を受けない
 ②短所
  存在しない/複数存在する場合あり

2.ばらつき度の諸指標
(1)概算の平均値
 データの両端(最大値と最小値)の中間点近くの端数のない値
(2)概算の標準偏差
 データ数が非常に多いときは範囲(最大値−最小値)の1/6
 データ数が少ないときは範囲(最大値−最小値)の1/4
 →ほとんどの場合、1/4〜1/6の間にあると見てよい

3.未知のものに当たりを付ける方法(推定)
(1)(同じ信頼区間で)正確性を倍にしたい場合、サンプル数は4倍必要となる

4.仮説検定
(1)二重の過ち
 ①正常と判断した中に間違い(異常)があった場合
 ②異常と判断した中に間違い(正常)があった場合