조무위키
조무위키
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
특수 문서 목록
문서 정보
행위
문서
토론
편집
역사 보기
정규분포
편집하기
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
{{이과}} Normal Distribution [[확통]]에서 존나 개꿀인 파트 == 수학 == 확률밀도함수(probability density function, pdf)중 하나다. 급식 수준의 [[통계학]]을 배울때부터 나온다는 점에서부터 이놈의 중요성은 설명하지 않아도 아리라 생각한다. 보통 그리면 종 모양(bell-shaped)으로 생겼는데 종 가운데의 지점을 평균(mean, μ)이라고 한다. 종의 모양은 표준편차값(standard deviation, σ)에 따라 달라진다. 이놈의 적분이 곧 그 확률변수 구간에서의 확률을 나타낸다. 근데 이놈은 초등함수 적분이 불가능한 대표적인 함수 중에 하나라서 급식 수준에서는 그냥 표준정규분포(standard normal distribution; μ=0, σ^2=1)로 근사한 후 표준정규분포표를 갖고 확률을 구할거다. 즉 확률변수(random variable) Y가 N(μ, σ^2)를 따를 때 (<==> Y~N(μ, σ^2)), Z=(Y-μ)/σ ~ N(0, 1)가 성립한다. 증명 1: Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다. f_Y(y)를 Y의 pdf, f_Z(z)를 Z의 pdf라고 하자. (h^-1)(z) = σz + μ는 증가함수이고 (∵ σ > 0) 모든 y (-∞ < y < ∞)에 대해 f_Y(y) > 0이므로 f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2)) (-∞ < y < ∞) => f_Z(z) = f_Y((h^-1)(z))|dh^-1/dz| (-∞ < σz +μ < ∞ => -∞ < z < ∞)이다. 즉 f_Z(z) = f_Y(σz +μ)|σ| (∵dh^-1/dz = d/dz [σz + μ] = σ) = σf_Y(σz +μ) (∵ σ > 0)임을 알 수 있다. 그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(z^2)/(2))이므로 σf_Y(σz +μ) = (1/sqrt(2pi))exp(-(z^2)/(2))다. 결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(0, 1)임을 보인다. ▯ 증명 2: m_Y(t) = exp(μt + 0.5(σ^2)(t^2)) 이므로 m_Z(t) = E(exp(tZ)) = E(exp(t(Y-μ)/σ)) = E(exp((t/σ)Y))E(exp(-μt/σ)) = exp(-μt/σ) * m_Y(t/σ) = exp(-μt/σ) * exp(μt/σ + 0.5(σ^2)(t/σ)^2) = exp(-μt/σ + μt/σ + 0.5(t)^2) = exp(0 * t + 0.5(1^2)(t^2)). 따라서 Z~N(0, 1)임을 보인다. ▯ 증명 3: P(Y <= x) = int -∞ to x; (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt 이므로, P(Z <= x) = P((Y-μ)/σ <= x) = P(Y-μ <= σx) = P(Y <= σx + μ) = int -∞ to (σx + μ); (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt 여기서 s = (t-μ)/σ 라고 하면 ds = dt/σ 이고 t = σx + μ => s = (σx + μ-μ)/σ = x 이므로, 정리하면 P(Y <= σx + μ) = int -∞ to (x); (1/(sqrt(2pi)))exp(-(s/sqrt(2))^2) ds = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds. 즉 P(Z <= x) = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds 이여서 Z~N(0, 1)이다. ▯ 특징: (1) Y~N(μ, σ^2)일때 Y의 pdf f(y)는 y = μ±σ에서 convexity가 바뀐다. μ-σ<y<μ+σ 일 때 f(y)는 concave하고 그 외에는 convex하다. (2) Z~N(μ=0, σ^2=1) => max{f(z) | -∞ < z < ∞} = 1/sqrt(2π) ≈ 0.4 다행히도 학식 이상에서는 이놈을 적분할 방법이 여러가지 나오므로 혹시 이걸 적분해보고 싶어 미치겠는 잉여라면 대학 미적분학을 열람하도록. 사실 가장 중요한 점은 바로 [[성급한 일반화의 오류충]]들을 아닥하게 만드는 함수라는 거다. 성급한 일반화의 오류충들에게 이걸 들이대고 그런 놈이 대부분이라는 것을 입증하면 전부 다 버로우한다. 즉, [[팩트폭력]]의 재료 중 하나라는 것이다. ㄴ정규분포는 여러가지 모수들의 추정량을 나타내는 좋은 형태의 분포지만 초급통계에서나 먹히지 직접분석해보면 정규분포,t-분포,카이스퀘어 분포 등 정규분포 기반으로 만들어지 검정 추정방식들은 표본이 작거나 편향적인 데이터 즉 일반적인 데이터에서 표본으로부터 모집단의 특징을 충분히 반영하지 못하는 경우가 많다. 고로 정규분포검정에서 H0를 기각시켰다고 그게 사실이라고 하는것이 더 일반화의 오류이다.
요약:
조무위키에서의 모든 기여는 CC BY-SA 4.0 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
조무위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
이 문서에서 사용한 틀:
틀:알림 상자
(
편집
)
틀:이과
(
편집
)