R programming (26) 썸네일형 리스트형 공유자전거 데이터 분석하기 kaggle에 처음으로 분석한 데이터는 로스앤젤로스의 공유자전거 여정 기록이다. 해당 자료는 13만 개의 행과 16개의 열로 구성되어 있는데 4개의 컬럼만 써서 일부분만의 데이터 분석을 할 수 있었다. 이용한 컬럼은 이용시작시간, 이용종료시간, pass holder type, Trip route가 전부였다. 13만 개의 데이터에서 타입별 이용횟수를 시각화했다. 자전거를 같은 곳에서 빌리고 반납하는 Round trip과 빌리는 장소와 반납하는 장소가 다른 One way의 빈도를 시각화 했다. 이용시작시간과 종료시간의 차이를 계산하여 위 그림과 같이 사용시간에 따른 빈도를 시각화했다. passholder type별로 사용시간 데이터를 박스플롯형태로 만들었다.점으로 표시되는 것을 결측치로 판단되는 자료다. 작.. 문과생 R 프로그래밍 입문하기 R을 공부한 지 이제 겨우 2개월 쯤 됐다. R은 기본적으로 통계&분석을 위한 툴이다.데이터 사이언티스트까지 될 생각도 없고, 될 능력도 없지만데이터에 근거해 의사결정을 내리는 과정이굉장히 합리적이라고 판단했다.공부하는 사람마다 여러가지 이유가 있겠지만 R을 공부하는게 나만의 skill을 가질 수 있다고 생각한다.(자고로 기술이 최고다) R관련 기초는 포항공과대학교의 MOOC 수업을 통해 배웠다.배웠다고 했지만 그것이 전적으로 내 것이 되는 것은 아니다. http://www.postechx.kr/ko/school/posco/courseware/45327 요새는 온라인을 통해 여러 강의를 제공하기 때문에 굳이 위 사이트가 아니더라도 배울 곳은 많다고 생각한다.MOOC의 장점은 훌륭한 교수진에게 무료로 강의.. 이전 1 2 3 4 다음