結城浩のはてなブログ

ふと思いついたことをパタパタと書いてます。

分散の定義が絶対値を使わず二乗を使う理由（？）

1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。
2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。
3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの（として定義したい）。
4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。
5. 二乗しておけばどっちに転んでも大丈夫。
6. でも、絶対値を取ることにしてもいいよね。
7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。

…と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか？

A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。
- 《分散は、平方の期待値から期待値の平方を引いた値になる》
B. 確率変数Xが期待値からずれる確率が、分散で押さえられる。
- 《任意のa > 0に対して、Pr( (X - E(X))^2 >= a) <= V(X) / a が成り立つ》

※上記のA,Bは『コンピュータの数学』で読みました。

コンピュータの数学

コンピュータの数学

作者: ロナルド・L.グレアム,オーレンパタシュニク,ドナルド・E.クヌース,Ronald L. Graham,Oren Patashnik,Donald E. Knuth,有沢誠,萩野達也,安村通晃,石畑清
出版社/メーカー: 共立出版
発売日: 1993/08
メディア: 単行本
購入: 5人クリック: 224回
この商品を含むブログ (38件) を見る

追記：いろんな方からコメントいただいたことのリンクなど。みなさんありがとうございます。
- 微分可能性
- 内積はその平方根と違って微分可能になるのが大きいです。概念として自然なのだと思います。
- 分散の加法則：確率変数XとYが独立な場合、V(X + Y) = V(X) + V(Y) が成り立つから、ではないでしょうか？
- Fisherが最初に言ったのは「２つの要因が合わさっている時、それぞれの標準偏差の2乗の和の根をとるとその標準偏差になる」
- 二乗でなくて、絶対値を使った「平均偏差」ってのもありますよね、一応。使われているのを見たことがありませんが。
- 歴史的には先にGaussによる標準偏差があって、Fisher(1918)で定義されたので、何故かというと標準偏差の2乗がいい性質あるよ！ってFisherが言ったからではないかと。
- 分散というのは、期待値まわりの2次のモーメントだから二乗するのです。また、正規分布では、分散は母数の片割れであり、(N-1)で割る標本分散はその不偏推定量になります。
- 野崎先生から(!)：「クヌースに出てくる性質Ａ，Ｂは理由というよりも結果で、Ｂは「絶対値に基づく一種の分散」に対しても（類似の結果が）成り立ちます。ガウスはいくつかの仮定から微分方程式を立てて、そこからガウス分布を導いていますが、そこに現れる定数が「２乗に基づく分散」になることが本質的、のような気がします（ガウス「誤差論」飛田訳、紀伊国屋書店、９６ページ以下に出てきます）。」