본문 바로가기

통계

정규 분포에 대해 알아보자!

반응형

정규분포는 특정값의 출현비율을 그렸을 때, 중심(평균값)을 기준으로 좌우 대칭 형태가 나타나며,
좌우 극단으로 갈수록 급격하게 수치가 낮아지는 특징이 있다.
가우스가 처음 개념을 만들어 가우스 분포라고도 함.

그럼 표준정규분포는 먼데?

표준정규분포는 정규분포를 표준화 한 것!

평균=0 표준편차=1 로 만들면 됨!
How? 개별데이터에서 전체 데이터의 평균을 빼고 해당 데이터의 표준편차로 나누어줌. 이렇게 표준화된 데이터를 z-score라고 함.

 

 

왜 표준화 하느냐?

그룹간의 데이터를 비교 하기 용이하게 만들려구!


예컨대 A반의 중간고사 성적과 B반의 중간고사 성적을 비교할 때 반별 학생들의 평균과 표준편차가 다를텐데 이럴 때 객관적인 비교를 위해서 점수를 표준화하는 작업을 해줘야한다! 수능 표준점수도 뭐 이렇게 계산할거다.

개념은 이렇구 코드로 입력하면 넘넘 간단하게 뚝딱.

 

data <-(data-mean(data))/sd(data)

뭐 요런 느낌적인 느낌으로 해주면 된다.

반응형