金木犀先生との長い闘い
文字数 1,634文字
さて、私は何かのきっかけで”ランダムサンプリング”という言葉を使いました。多分飼い猫先生かラピス先生が論拠とするサンプルに疑問があった時だと思います。そこでも説明したことですが、このランダムサンプリングというのはサンプルの抽出方法で、例えるならカレーの入った鍋をよくかき混ぜて、お玉で掬うというもの。鍋全体(母集団)を調べなくても、そのお玉一杯は母集団を代表する(同じ比率で具が入っている)ということです。すると金木犀先生も、さも前から知っていたかのようにランダムサンプリングという言葉を使って統計について語り出します。金木犀先生の言葉ではありませんが、それこそ統計学を齧った人であるなら金木犀先生に統計の知識がないのは明白だったので、突っ込んでみました。
「たしかにぷりもさんは”思った以上に”知識があるのかもしれませんね。確かに僕は”言うほど”統計学を勉強したことはありません。それは本当にその通りです」
引用符で囲った部分ですが、ここでも一定のプライドを保とうとする心理が出ています。
そこで、そのメッキを剥がそうと私は意地悪な問題を出題しました。以下コピペです。
では、ものすごく基本的な、それこそ統計を齧ったことのある人なら、こんなの検定試験に出ないよと笑ってしまうくらい簡単な問題出しますよ。
Q.製パン会社Aで生産しているアンパンの規格は100g±10gである。
あなたは規格を満足しているか調べることにしました。
サンプルの数は100個。平均値は101g、標準偏差は1.2、危険度は1%に設定します。
サンプルはランダムサンプリングで抽出し、分布は正規分布に従うものとします。
(※一応念のため、統計手法は適切で得られたデータは信用のおけるものとします)
さて、あなたはこのデータに基づいて、次にどのようなアクションをとりますか?
規格の中心値と平均のズレを考慮した上で答えてください。
ものすごく簡単とはいえ、ネットでちょっと調べてコピペできるような問題ではないと予めお伝えしておきますよ。
調べてももちろん構いません。
*
その結果は次のチャプターで。