備忘録的な何か

忘れそうなことを書いていく予定

誤差について気になったこと

大学1年生の時分にノギスやマイクロメータで測定した実験データの処理をする上で習った標準誤差(standard error)に関して思い出さなければならない事案があったため、備忘録としてここに記す。 また、書いている本人は統計に関しては素人である。
JIS-Z8101でググると大体出てくる。

統計の数値の定義

備忘録代わりにおいておく。

名称 Excelでの関数
平均 {\overline{x} = \frac{x_1+x_2+\cdots +x_n}{N}=\frac{\Sigma x_i}{N}} average
偏差平方和 {S = \Sigma (x_i - \overline{x}) ^2} devsq
母分散 {\sigma ^2 = \frac{S}{N} } var.p
標本分散 {V = \frac{S}{N-1}} var.s
母集団標準偏差 {\sigma = \sqrt{\frac{S}{N}} } stdev.p
標本標準偏差 {s = \sqrt{V} =\sqrt{\frac{S}{N-1}} } stdev.s

これらの数値は関数電卓の統計モードを使えば容易に出すことが出来る上、上記のExcelの関数を用いればさらに簡単に求めることが出来る。

標準偏差の意味

標準偏差の意味するところはデータのバラつき具合を示す数値であることである。ということは例えばノギスで5回板の厚みを測定するといった実験をした場合、測定値から出す標準偏差の意味は この測定結果のばらつき度合い、測定方法に関する誤差を見積もることが出来るということである。

標準誤差について

ただし今回欲しいデータはその平均値が持つ誤差である。それは一般的に標準誤差(standard error)と呼ばれるものである。JIS規格Z8101-1によると
標本平均の標準誤差は
{\sigma_{\overline{x}} = \frac{\sigma}{\sqrt{N}}}

標準誤差の推定量は
{\sigma_{\overline{x}} = \frac{s}{\sqrt{N}}}
として表されるものらしい。

問題はどちらを採用すれば良いかであるが、{N}が十分に多い場合であればほぼイコールになるので計算プロセスが明らかであればどちらを採用しても問題無いハズ・・・

しかしノギスで5回測定した場合の平均値など、母集団の平均値が直接求まらない場合では標準誤差の推定量として下の方の計算式で出すのが妥当と考えられる。