반응형
아래와 같은 데이터프레임이 있다고 가정해보자.
ID | CODE |
1 | 12345 |
2 | 12345, 56788, 12222, 11111, 22222, 33333 |
3 | 12333 |
4 | 12344 |
5 | 42323 |
6 | 11111, 22222 |
각 아이디에는 1개 이상의 CODE값을 가지고 있다.
복수개의 CODE값을 가지고 있는 것은 쉼표로 구분이 되어있다.
만들고자 했던 데이터 프레임의 형식은 다음과 같았다.
id | value1 | value2 | value3 | value4 | value5 |
1 | 12345 | NA | NA | NA | NA |
2 | 12345 | 56788 | 12222 | 1111 | 22222 |
3 | 12333 | NA | NA | NA | NA |
4 | 12344 | NA | NA | NA | NA |
5 | 42323 | NA | NA | NA | NA |
6 | 11111 | 22222 | NA | NA | NA |
처음엔 strsplit방법을 써서 해결하면 되는 줄 알았는데, 막상 적용하기가 쉽지않았다.
결국 구글링을 통해서 내가 원하는 모양을 간단하게 구현해주는 라이브러리를 찾았다.
splitstackshape패키지를 통해 구현가능했다.
library(splitstackshape)
cSplit(data,"code",",")
패키지를 불러오고 cSplit함수를 통해 code안에 있는 데이터를 쉼표를 구분자로 하여 나누어준다.
다음과 같은 결과를 얻을 수 있게 된다.
아래 링크의 내용을 참고해 공부했다.
반응형
'R programming' 카테고리의 다른 글
조금 더 현실적인 SQL 쿼리짜기 - R 코드로 같은 결과만들기 (0) | 2022.01.08 |
---|---|
시계열 데이터 밑바닥부터 다루기 in R (2) (0) | 2020.02.04 |
시계열 데이터 밑바닥부터 다루기 in R (1) (0) | 2020.02.03 |
data.frame과 data.table을 비교해보자 in R (0) | 2019.10.28 |
지도학습(supervised learning): 의사결정나무(decision tree)이해하기 (0) | 2019.07.21 |