모수적 방법과 비모수적 방법은 각각 언제 써야할까?
많은 통계적 추론은 모집단이 정규분포를 따른다는 가정에 의해서 출발한다. 이렇게 우리는 모수를 함수형태의 분포를 가정하여 접근하는 방법을 모수적 방법(Parametic method)이라고 한다. 반대로 모집단의 분포를 가정하지 않고 접근하는 방법을 비모수적 방법(Non-parametic method)라고 한다. 모수적 방법론은 다음과 같은 것들이 있다. 연속형 확률분포 정규분포, 일양분포, 지수분포, 로그정규분포, t분포, 카이제곱분포, f분포, 감마분포, 베타분포 등 이산형 확률분포 베르누이분포, 이항분포, 포아송분포, 기하분포, 초기하분포, 음이항분포 등 그렇다면 비모수적 방법은 어디에 쓰일까? 비모수적 방법은 정규성 검정에서 정규분포를 따르지 않는다 증명되거나, 표본의 개수가 10개 미만일 때 사용..
시계열 데이터 밑바닥부터 다루기 in R (2)
요일로 변환하기 우리는 YYYY-MM-DD 형택의 데이터에서 종종 해당날짜의 요일을 필요로 할 때가 있다. 요일에 따라 구분된 데이터는 예컨대 요일별 매출추이 등을 봐야할 때 유용할 것이다. 이럴 때 wday함수를 통해 요일을 추출해낼 수 있다. wday함수는 날짜에 따른 요일을 숫자로 표시해준다. 일요일=1, 월요일=2, 화요일=3, 수요일=4, 목요일=5, 금요일=6, 토요일=7 로 표기되며 wday(date, label=TRUE) label=TRUE를 통해 숫자에서 영문으로 표시를 바꿀 수 있다. 날짜 반올림, 올림, 내림처리 시계열 데이터 밑바닥부터 다루기 in R(1)에서 연,월,일 등의 요소를 추출하는 방법을 배웠지만 이럴 경우 추출한 값을 제외한 나머지 값들을 잃었다. 이럴 때 날짜를 반올림..