1.確率変数と確率分布
確率変数…ある試行の結果によってその値が定まり,各値に対してその値をとる確率が定まるような変数のことを確率変数という。
確率分布…確率変数 \(X\) のとりうる値 \(x_k \) \((k = 1, 2, \cdots\cdots, n)\) と \(X = x_k\) をとる確率\(p_k\) との対応関係を \(X\) の確率分布という。
\(p_1 \geq 0, p_2 \geq 0, \cdots\cdots, p_n \geq 0\)
\(p_1 + p_2 + \cdots\cdots + p_n = 1\) ←確率の総和は1
2.確率変数の期待値・分散・標準偏差
確率変数 \(X\) が下の表に示された分布に従うとする。
期待値(平均)\(E(X) = x_1 p_1 + x_2 p_2 + \cdots\cdots + x_n p_n = \displaystyle \sum_{k=1}^n x_k p_k\)
分散 \(\color{red}{V(x) = E((X – m)^2)}\) ←偏差の2乗の期待値
\(= (x_1 – m)^2 p_1 + (x_2 – m)^2 p_2 + \cdots\cdots + (x_n – m)^2 p_n\)
\(= \color{red}{\displaystyle \sum_{k=1}^n (x_k – m)^2 p_k}\)
標準偏差 \(\color{red}{\sigma (X) = \sqrt{V(X)}}\)
※\(E(X) = m\) とするとき, \((X – m)\) を\(X\) の偏差という。
分散 \(\color{red}{V(X) = E(X^2) – {E(X)}^2}\) ←\( \color{blue}{(X^2 の期待値) – (X の期待値)^2}\)
標準偏差 \(\color{red}{\sigma (X) = \sqrt{E(X^2) – {E(X)}^2}}\)
3.確率変数の変換
\(X\) は確率変数,\(a\), \(b\) は定数とする。
\(Y = aX + b \) のとき
① 期待値 \(\color{red}{E(Y) = aE(X) +b}\)
② 分散 \(\color{red}{V(Y) = a^2 V(X)}\)
③ 標準偏差 \(\color{red}{\sigma (Y) = | a |\sigma(X)}\)
4.確率変数の和と積
\(X, Y\) は確率変数 \(a\), \(b\) は定数とする。
・\(P(X = x_i, Y = y_j) = p_ij\) とするとき,\((x_i, y_j)\) と\(p_{ij}\) の対応を\(X\) と \(Y\) の同時分布という。
・\(P(X = x_i, Y = y_j) = P(X = x_i) \cdot P(Y = y_j)\) が成り立つとき\(\color{red}{X と Y は互いに独立である}\)という。
① \(\color{red}{E(X + Y) = E(X) + E(Y)}\)
② \(\color{red}{E(aX + bY) = aE(X) + bE(Y)}\)
※これらはいつでも成り立つ
\(X, Y\) が互いに独立であるとき
① \(\color{red}{E(XY) = E(X)E(Y)}\)
② \(\color{red}{V(X + Y) = V(X) + V(Y)}\)
③ \(\color{red}{V(aX + bY) = a^2V(X) + b^2V(Y)}\)
5.二項分布
1回の試行で事象\(A\) の起こる確率が \(p\) であるとき,この試行を\(n\) 回行う反復試行において,\(A\) の起こる回数を\(X\) とすると,\(X = r \) になる確率は
\(\color{red}{P(X = r) = {}_n C_r p^r q^{n – r} }\)\((r = 0, 1, 2, \cdots\cdots, n), 0 < p < 1, q = 1 – p\)
このとき,\( \color{red}{確率変数X は二項分布 B(n, p) に従う}\) という。
確率変数X は二項分布 \(B(n, p)\) に従うとき
期待値 \(\color{red}{E(X) = np}\)
分散 \(\color{red}{V(X) = npq}\)
標準偏差 \(\color{red}{\sigma(X) = \sqrt{npq}}\)\((q = 1 – p)\)
6.正規分布
離散型確率変数…飛び飛びの値をとる確率変数
連続型確率変数…実数のある区間の連続的な値をとる確率変数
\(X\) は連続型確率変数とするとき,以下の性質を満たす関数\(f(x)\) が1つ対応する。
① \(\color{red}{常に f(x) \geq 0}\)
② \(\color{red}{P(a \leq X \leq b) = \int_a^b f(x) dx}\)
③ \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\) のとき
\(\color{red}{\int_{\alpha}^{\beta} f(x) dx = 1}\) ←(全面積)=1
この関数 \(f(x)\) を\(X\) の確率密度関数, \(y = f(x)\) のグラフを\(X\) の分布曲線という。
\(\alpha \geq X \geq \beta\) の範囲にある連続型確率変数\(X\) の確率密度関数\(f(x)\) であるとき,
① 期待値 \(\color{red}{E(X) = m = \int_{\alpha}^{\beta} xf(x) dx}\))
② 分散 \(\color{red}{V(X) = \int_{\alpha}^{\beta} (x – m)^2 f(x) dx = E(X^2) – {E(X)}^2 }\)
③ 標準偏差 \(\color{red}{\sigma(X) = \sqrt{V(X)}}\)
連続型確率変数 \(X\) と定数\(a, b\) に対して、連続型確率変数\(Y\) を \(Y = aX +b\) とする。
① 期待値 \(\color{red}{E(Y) = E(aX + b) = aE(X) + b}\)
② 分散 \(\color{red}{V(Y) = V(aX + b) = a^2V(X)}\)
連続型確率変数\(X\) の確率密度関数\(f(x)\) が\(f(x) = \displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x – m)^2}{2\sigma^2} であるとき,
\(X\) は正規分布 \(N(m, \sigma^2)\) に従うといい, \(y = f(x)\) のグラフを正規分布曲線という。
このとき,以下が成り立つ。
① 期待値 \(\color{red}{E(X) = m}\), 標準偏差 \(\color{red}{\sigma(X) = \sigma}\)
② 正規分布曲線 \(y = f(x)\) は次の性質をもつ
[1] 曲線は,直線 \(x = m\) に関して対称であり,\(f(x)\) の値は\(x = m\) で最大となる。
[2] \(x\) 軸を漸近線とする。
[3] 標準偏差\(\sigma\) が大きくなると,曲線の山が低くなって横に広がり,\(\sigma\) が小さくなると, 曲線の山は高くなって対称軸 \(x = m\) の周りに集まる。
\(X\) は正規分布 \(N(m, \sigma^2)\) に従う確率変数とする。
\(\color{red}{Z = \displaystyle\frac{X – m}{\sigma}}\) とおくと,確率変数 \(Z\) は標準正規分布 \(N(0, 1)\) に従う。
二項分布\(B(n, p)\) に従う確率変数\(X\) は,\(n\) が大きいとき,近似的に正規分布\(N(np, npq)\)に従う。
(\(q = 1 – p\))
つまり、\(\color{red}{Z = \displaystyle\frac{X – np}{\sqrt{npq}}}\) とおくと\(Z\) は近似的に\(N(0, 1)\)に従う。
7.標本平均とその分布
母平均\(m\), 母標準偏差\(\sigma\) の母集団から大きさ\(n\) の無作為標本を抽出するときの標本平均を\(\overline{X}\) とする。
期待値\(\color{red}{E(\overline{X}) = m}\)
標準偏差\(\color{red}{\sigma(\overline{X}) = \displaystyle\frac{\sigma}{\sqrt{n}}}\)
\(n\) が大きいとき,標本平均\(\overline{X}\) は近似的に正規分布\(N(m, \displaystyle\frac{\sigma^2}{n})\) に従う。
標本平均\(\overline{X}\) は,\(n\) が大きくなるに従って,母平均\(m\) に近づく。
8.推定
母標準偏差を\(\sigma\)とする
標本の大きさ\(n\) が大きいとき,母平均\(m\) に対する信頼度95%の信頼区間は
\(\color{red}{\left[\overline{X} – 1.96 \cdot \displaystyle\frac{\sigma}{\sqrt{n}}, \overline{X} + 1.96\cdot \displaystyle\frac{\sigma}{\sqrt{n}} \right]} \)
(\(\overline{X}\) は標本平均)
標本の大きさ\(n\) が大きいとき,母比率 \(p\) に対する信頼度95%の信頼区間は
\(\color{red}{\left[R – 1.96 \sqrt{\displaystyle\frac{R(1 – R)}{n}}, R + 1.96 \sqrt{\displaystyle\frac{R(1 – R)}{n}}\right] }\)
(\(R\) は標本比率)
9.仮説検定
① 事象が起こった状況や原因を推測し,仮説を立てる。
② 有意水準\(\alpha\) を定め, 仮説に基づいて棄却域を求める。
③ 標本から得られた確率変数の値が棄却域に入れば仮説を棄却し, 棄却域に入らなければ仮説を棄却しない。
コメント