카테고리 없음

통계학에서 정규분포란 무엇인가

토미더머니 2025. 5. 8. 13:13
반응형

정규분포 법칙(정규분포, Normal Distribution)은 통계학에서 가장 중요하고 자주 등장하는 개념 중 하나입니다.

 

정규분포 그래픽


✅ 정규분포란?

● 정규분포란?

많은 자연현상과 사회현상에서 측정값이 평균을 중심으로 종 모양으로 분포하는 현상


📊 정규분포의 핵심 특징

개념 설명
형태 가운데가 봉긋한 종(bell) 모양
대칭성 평균을 기준으로 좌우가 완벽하게 대칭
평균 = 중앙값 = 최빈값 모두 같은 값을 가짐
분산과 표준편차 퍼짐 정도(산포도)를 나타냄
면적의 총합 = 1 전체 확률(가능성)의 합이 100%

📐 정규분포의 법칙 (68-95-99.7 법칙)

정규분포에서는 표준편차(σ)를 기준으로 다음과 같은 비율로 데이터가 분포합니다:

구간 전체 데이터에서 차지하는 비율
평균 ± 1σ 68%
평균 ± 2σ 95%
평균 ± 3σ 99.7%

✅ 즉, 거의 모든 값은 평균 근처에 몰려 있고, 멀리 벗어난 값은 드뭅니다.


🎯 쉬운 비유 예시

예 1: 중학생들의 키

  • 한 중학교에서 1학년 남학생의 평균 키가 160cm, 표준편차가 5cm라고 가정하면:
구간 해석
155~165cm (±1σ) 전체 학생의 약 68%가 이 구간에 있음
150~170cm (±2σ) 전체 학생의 약 95%가 이 구간에 있음
145~175cm (±3σ) 거의 모든 학생(99.7%)이 이 구간에 있음

매우 크거나 작은 키(예: 180cm 이상, 140cm 이하)는 극히 소수라는 뜻입니다.


예 2: 시험 점수

  • 어떤 수학 시험에서 평균이 70점이고 표준편차가 10점이면:
구간 학생비율
60~80점 68%
50~90점 95%
40~100점 99.7%

극단적으로 낮거나 높은 점수는 매우 드문 값입니다.


🧪 실생활 예시

분야 예시
교육 시험 성적, IQ 분포
건강 혈압, 키, 체온 분포
제조 공장에서 나오는 부품 크기 오차
금융 주식 수익률의 일일 변화율 (근사적으로 정규분포 따름)

🤔 왜 중요한가?

  1. 확률 계산이 쉬움
    → 예: 특정 구간 안에 있을 확률 계산 가능
  2. 현실 설명력이 강함
    → 대부분의 자연현상과 사회현상이 정규분포를 따르거나 근사함
  3. 통계 검정과 머신러닝의 기반
    → 많은 통계기법이 정규분포를 전제로 함

📌 요약

정규분포는 현실에서 수치가 평균 근처에 몰려 있고 극단적인 값은 드문 현상을 설명하는 통계 모델로, 시험점수, 키, 혈압 등 많은 분야에 적용되며, 데이터 분석과 확률 계산의 핵심 도구입니다.


 

반응형