(i) 全データが存在する場合
例1 : 40人クラスにおいてテスト点数の解析を行いたい(40人全員の点数を知っている)。
例2 : 過去1年間、365日で体重がどのくらい増減したかの解析をしたい(365日分のデータが存在する)。
平均\(m\)
\(
\displaystyle m=\frac{1}{N}\sum_{i=1}^N x_i
\)
分散\(v\)
\(
\displaystyle v=\frac{1}{N}\sum_{i=1}^N (x_i-m)^2
\)
標準偏差\(\sigma\)
\(
\displaystyle \sigma=\sqrt{v}
\)
平均値から\(\pm 66\%\)の誤差に収まっている範囲は、
平均m ± 標準偏差σ と書ける。
例1 のクラスの点数の場合は、
平均m ± 標準偏差σ [点] となる。
(ii)一部分のデータしか存在しない場合
例1 : 40人クラスにおいて23人しかテストの点数を知らないが、その23人からクラス全体の点数の解析を行いたい(23人の点数は分かる。残り17人の点数は不明)。
例2 : 過去1年間、365日で体重の増減を解析したいが、200日分のデータしかない。だけど1年の解析を行いたい(165日分のデータは不明、紛失した)。
例3 : 物理量の測定(測定回数が1000回だとしても、物理量は無限回の測定をしなければ真値は不明だ、と考える。)
この場合、平均、分散、標準偏差は
平均\(m’\)
\(
\displaystyle m’=\frac{1}{N}\sum_{i=1}^N x_i
\)
分散\(v’\)
\(
\displaystyle v’=\frac{1}{N}\sum_{i=1}^N (x_i-m’)^2
\)
標準偏差\(\sigma’\)
\(
\displaystyle \sigma’=\sqrt{v’}
\)
平均値から\(\pm 66\%\)の不確かさに収まっている範囲は、
平均m’ ± 標準偏差σ’ と書ける。
例1 のクラスの点数の場合は、
平均m’ ± 標準偏差σ’ [点] となる。
誤差と不確かさ は違うので注意しましょう。
誤差 → 完璧なデータのときに使う。
不確かさ → 本当の値を知らないときに使う。