본문 바로가기

통계

로그함수를 취하는 이유

반응형

로그를 취하는 경우는 정규성을 높이고 분석 시에 정확한 값을 얻기위함이다.
데이터에 로그를 취하는 경우는 특히 데이터 숫자값이 크면 클수록 이 효과가 높아진다.
예컨대 나이보다는 재산보유액같이 숫자가 굉장히 큰 경우가 있을 수 있다.
재산보유액에 로그를 취할 경우, 데이터의 왜도와 첨도를 줄일 수 있어 정규성이 높아지는 효과를 얻는다.
예를 들어 10과 100의 경우 숫자의 차이는 90이다. 하지만 이 두 숫자에 상용로그를 취하게 될 경우 값은 1과 2로, 그 차이는 1에 불과하다.

또 일반적으로 자연로그를 취하게 될 경우 비선형관계를 선형관계로 만들 수 있다.
(회귀분석의 전제는 x와 y가 선형관계이어야 하기 때문에 회귀분석을 위해 필요하다)

기하급수적으로 늘어나는 제곱형식의 그래프에 자연로그(ln)을 취하면 그 관계가 직선이 된다.

로그함수를 취하는 이유는 크게 다음 3가지다.

  1. 단위수가 너무 큰 값들을 바로 회귀분석 할 경우, 결과를 왜곡할 우려가 있으므로 이를 방지하기 위해.

  2. 독립변수와 종속변수의 변화관계에서 절대량이 아닌 비율을 확인하기 위해

  3. 비선형관계의 데이터를 선형으로 만들기 위해

반응형