카테고리 없음
통계학에서 정규분포란 무엇인가
토미더머니
2025. 5. 8. 13:13
반응형
정규분포 법칙(정규분포, Normal Distribution)은 통계학에서 가장 중요하고 자주 등장하는 개념 중 하나입니다.
✅ 정규분포란?
● 정규분포란?
많은 자연현상과 사회현상에서 측정값이 평균을 중심으로 종 모양으로 분포하는 현상
📊 정규분포의 핵심 특징
개념 | 설명 |
형태 | 가운데가 봉긋한 종(bell) 모양 |
대칭성 | 평균을 기준으로 좌우가 완벽하게 대칭 |
평균 = 중앙값 = 최빈값 | 모두 같은 값을 가짐 |
분산과 표준편차 | 퍼짐 정도(산포도)를 나타냄 |
면적의 총합 = 1 | 전체 확률(가능성)의 합이 100% |
📐 정규분포의 법칙 (68-95-99.7 법칙)
정규분포에서는 표준편차(σ)를 기준으로 다음과 같은 비율로 데이터가 분포합니다:
구간 | 전체 데이터에서 차지하는 비율 |
평균 ± 1σ | 68% |
평균 ± 2σ | 95% |
평균 ± 3σ | 99.7% |
✅ 즉, 거의 모든 값은 평균 근처에 몰려 있고, 멀리 벗어난 값은 드뭅니다.
🎯 쉬운 비유 예시
예 1: 중학생들의 키
- 한 중학교에서 1학년 남학생의 평균 키가 160cm, 표준편차가 5cm라고 가정하면:
구간 | 해석 |
155~165cm (±1σ) | 전체 학생의 약 68%가 이 구간에 있음 |
150~170cm (±2σ) | 전체 학생의 약 95%가 이 구간에 있음 |
145~175cm (±3σ) | 거의 모든 학생(99.7%)이 이 구간에 있음 |
→ 매우 크거나 작은 키(예: 180cm 이상, 140cm 이하)는 극히 소수라는 뜻입니다.
예 2: 시험 점수
- 어떤 수학 시험에서 평균이 70점이고 표준편차가 10점이면:
구간 | 학생비율 |
60~80점 | 68% |
50~90점 | 95% |
40~100점 | 99.7% |
→ 극단적으로 낮거나 높은 점수는 매우 드문 값입니다.
🧪 실생활 예시
분야 | 예시 |
교육 | 시험 성적, IQ 분포 |
건강 | 혈압, 키, 체온 분포 |
제조 | 공장에서 나오는 부품 크기 오차 |
금융 | 주식 수익률의 일일 변화율 (근사적으로 정규분포 따름) |
🤔 왜 중요한가?
- 확률 계산이 쉬움
→ 예: 특정 구간 안에 있을 확률 계산 가능 - 현실 설명력이 강함
→ 대부분의 자연현상과 사회현상이 정규분포를 따르거나 근사함 - 통계 검정과 머신러닝의 기반
→ 많은 통계기법이 정규분포를 전제로 함
📌 요약
정규분포는 현실에서 수치가 평균 근처에 몰려 있고 극단적인 값은 드문 현상을 설명하는 통계 모델로, 시험점수, 키, 혈압 등 많은 분야에 적용되며, 데이터 분석과 확률 계산의 핵심 도구입니다.
반응형