정규분포 편집하기

{{이과}}

Normal Distribution

[[확통]]에서 존나 개꿀인 파트

== 수학 ==

확률밀도함수(probability density function, pdf)중 하나다. 급식 수준의 [[통계학]]을 배울때부터 나온다는 점에서부터 이놈의 중요성은 설명하지 않아도 아리라 생각한다.

보통 그리면 종 모양(bell-shaped)으로 생겼는데 종 가운데의 지점을 평균(mean, μ)이라고 한다. 종의 모양은 표준편차값(standard deviation, σ)에 따라 달라진다. 이놈의 적분이 곧 그 확률변수 구간에서의 확률을 나타낸다.

근데 이놈은 초등함수 적분이 불가능한 대표적인 함수 중에 하나라서 급식 수준에서는 그냥 표준정규분포(standard normal distribution; μ=0, σ^2=1)로 근사한 후 표준정규분포표를 갖고 확률을 구할거다.


즉 확률변수(random variable) Y가 N(μ, σ^2)를 따를 때 (<==> Y~N(μ, σ^2)), Z=(Y-μ)/σ ~ N(0, 1)가 성립한다.

증명 1:

Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다.

f_Y(y)를 Y의 pdf, f_Z(z)를 Z의 pdf라고 하자. (h^-1)(z) = σz + μ는 증가함수이고 (∵ σ > 0) 모든 y (-∞ < y < ∞)에 대해 f_Y(y) > 0이므로  

f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2)) (-∞ < y < ∞) => f_Z(z) = f_Y((h^-1)(z))|dh^-1/dz| (-∞ < σz +μ < ∞ => -∞ < z < ∞)이다. 

즉 f_Z(z) = f_Y(σz +μ)|σ| (∵dh^-1/dz = d/dz [σz + μ] = σ) = σf_Y(σz +μ) (∵ σ > 0)임을 알 수 있다.

그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2)) 

= (1/(σsqrt(2pi)))exp(-(z^2)/(2))이므로 σf_Y(σz +μ) = (1/sqrt(2pi))exp(-(z^2)/(2))다.

결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(0, 1)임을 보인다. ▯


증명 2:

m_Y(t) = exp(μt + 0.5(σ^2)(t^2)) 이므로 m_Z(t) = E(exp(tZ)) = E(exp(t(Y-μ)/σ)) = E(exp((t/σ)Y))E(exp(-μt/σ))

= exp(-μt/σ) * m_Y(t/σ) = exp(-μt/σ) * exp(μt/σ + 0.5(σ^2)(t/σ)^2)

= exp(-μt/σ + μt/σ + 0.5(t)^2) = exp(0 * t + 0.5(1^2)(t^2)). 따라서 Z~N(0, 1)임을 보인다. ▯


증명 3:

P(Y <= x) = int -∞ to x; (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt 이므로,

P(Z <= x) = P((Y-μ)/σ <= x) = P(Y-μ <= σx) = P(Y <= σx + μ) = int -∞ to (σx + μ); (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt

여기서 s = (t-μ)/σ 라고 하면 ds = dt/σ 이고 t = σx + μ => s = (σx + μ-μ)/σ = x 이므로, 정리하면 
 
P(Y <= σx + μ) = int -∞ to (x); (1/(sqrt(2pi)))exp(-(s/sqrt(2))^2) ds = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds.

즉 P(Z <= x) = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds 이여서 Z~N(0, 1)이다. ▯


특징:

(1) Y~N(μ, σ^2)일때 Y의 pdf f(y)는 y = μ±σ에서 convexity가 바뀐다. μ-σ<y<μ+σ 일 때 f(y)는 concave하고 그 외에는 convex하다.

(2) Z~N(μ=0, σ^2=1) => max{f(z) | -∞ < z < ∞} = 1/sqrt(2π) ≈ 0.4


다행히도 학식 이상에서는 이놈을 적분할 방법이 여러가지 나오므로 혹시 이걸 적분해보고 싶어 미치겠는 잉여라면 대학 미적분학을 열람하도록.

사실 가장 중요한 점은 바로 [[성급한 일반화의 오류충]]들을 아닥하게 만드는 함수라는 거다. 성급한 일반화의 오류충들에게 이걸 들이대고 그런 놈이 대부분이라는 것을 입증하면 전부 다 버로우한다. 즉, [[팩트폭력]]의 재료 중 하나라는 것이다.

ㄴ정규분포는 여러가지 모수들의 추정량을 나타내는 좋은 형태의 분포지만 초급통계에서나 먹히지 직접분석해보면 정규분포,t-분포,카이스퀘어 분포 등 정규분포 기반으로 만들어지 검정 추정방식들은 표본이 작거나 편향적인 데이터 즉 일반적인 데이터에서 표본으로부터 모집단의 특징을 충분히 반영하지 못하는 경우가 많다. 고로 정규분포검정에서 H0를 기각시켰다고 그게 사실이라고 하는것이 더 일반화의 오류이다.