반응형
로그를 취하는 경우는 정규성을 높이고 분석 시에 정확한 값을 얻기위함이다.
데이터에 로그를 취하는 경우는 특히 데이터 숫자값이 크면 클수록 이 효과가 높아진다.
예컨대 나이보다는 재산보유액같이 숫자가 굉장히 큰 경우가 있을 수 있다.
재산보유액에 로그를 취할 경우, 데이터의 왜도와 첨도를 줄일 수 있어 정규성이 높아지는 효과를 얻는다.
예를 들어 10과 100의 경우 숫자의 차이는 90이다. 하지만 이 두 숫자에 상용로그를 취하게 될 경우 값은 1과 2로, 그 차이는 1에 불과하다.
또 일반적으로 자연로그를 취하게 될 경우 비선형관계를 선형관계로 만들 수 있다.
(회귀분석의 전제는 x와 y가 선형관계이어야 하기 때문에 회귀분석을 위해 필요하다)
기하급수적으로 늘어나는 제곱형식의 그래프에 자연로그(ln)을 취하면 그 관계가 직선이 된다.
로그함수를 취하는 이유는 크게 다음 3가지다.
-
단위수가 너무 큰 값들을 바로 회귀분석 할 경우, 결과를 왜곡할 우려가 있으므로 이를 방지하기 위해.
-
독립변수와 종속변수의 변화관계에서 절대량이 아닌 비율을 확인하기 위해
-
비선형관계의 데이터를 선형으로 만들기 위해
반응형
'통계' 카테고리의 다른 글
공분산과 상관관계 (2) | 2020.04.13 |
---|---|
정규 분포에 대해 알아보자! (0) | 2020.04.09 |
모수적 방법과 비모수적 방법은 각각 언제 써야할까? (0) | 2020.04.07 |
신뢰구간은 무엇일까? (2) | 2020.04.06 |
p-value를 올바르게 이해하기(부제: 조심해야하는 p값 해석) (2) | 2020.02.06 |