結城浩のはてなブログ

ふと思いついたことをパタパタと書いてます。

分散の定義が絶対値を使わず二乗を使う理由(?)

  • 1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。
  • 2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。
  • 3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの(として定義したい)。
  • 4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。
  • 5. 二乗しておけばどっちに転んでも大丈夫。
  • 6. でも、絶対値を取ることにしてもいいよね。
  • 7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。

…と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか?

  • A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。
    • 《分散は、平方の期待値から期待値の平方を引いた値になる》
  • B. 確率変数Xが期待値からずれる確率が、分散で押さえられる。
    • 《任意のa > 0に対して、Pr( (X - E(X))^2 >= a) <= V(X) / a が成り立つ》

※上記のA,Bは『コンピュータの数学』で読みました。

コンピュータの数学

コンピュータの数学