본문 바로가기

엘라스틱서치 & 키바나

키바나 대시보드 Filter와 Buckets의 filters 차이

반응형

키바나에서 대시보드를 만들 때 특정조건에 해당하는 데이터만을 확인하고 싶을 때가 있습니다.
예컨대 '남성' 이거나, '30대'이거나, '서울'에 거주하지 않거나 등등 필터를 걸어 해당하는 데이터의 통계값만을 확인하는 경우가 그렇습니다.

 

 

이번 글에서는 키바나에서 대시보드를 제작할 때
특정조건을 걸 때 사용하는 Bucket과 Filter의 차이를 알아보겠습니다.
예시 데이터는 '타이타닉' 데이터를 사용하겠습니다.

 

기본 세팅된 대시보드 상태

기본 타이타닉 데이터 갯수는 891개입니다.

 

 

 

 

1. Filter


먼저,

좌측 상단의 Filter를 사용하는 경우를 알아보겠습니다.

Filter의 기능은
한 패널 안에 들어가는 '모든 매트릭 값'에 영향을 미칩니다.

 

한 패널 안에서 관찰하고자 하는 것이
"남성", "사망자" 조건을 충족하는 row데이터라고 합시다.

성별 : 남성, 생존여부 : 사망

Add filter에는 위와 같은 조건을 지정해주고,

Metrics 값에서 원하는 통계값은 "Average", 해당하는 필드는 "Age"
로 지정후 update합니다.

 

생성된 메트릭값

Add Filter를통해 남성 사망자의 평균나이는 31.618세 인 것을 확인할 수 있습니다.

 

더 여러정보를 확인하기 위해 추가 Metrics 를 넣어봅시다.

남성 사망자의 수를 추가해봅시다.

 

 

위와 같이 Aggregation에 Count를 넣은 메트릭을 추가하고 적용합니다.

남성 사망자 수와 그들의 평균나이

위와 같이 한 패널 안에 남성사망자의 평균나이, 남성사망자의 수 2개의 메트릭값을 볼 수 있습니다.

다시 정리하자면
Filter에 해당되는 Row데이터를 전제로 값을 만듭니다.

 

 

2. Bucket

 

반면 Bucket은 전체데이터에서 해당 하는 조건으로 데이터를 그룹지어 통계값을 냅니다.
설명만으로는 와닿지 않으므로 실제 값으로 비교해봅니다.

 

카운팅을 해봅시다.

 


Bucket에서 Aggregation을 Filters로 두고 두 조건을 설정합니다.
성별 : male, 생존여부 : 0

 

위와 같이 설정하면 어떤 데이터값이 나올 것인지 예상이 되시나요??

 

 

 

2개의 메트릭값이 나오면서, 각각 성별 : "남성" , 생존여부 : 0 인 값이 나왔습니다.
즉 891명의 탑승데이터 중에서 남성은 577명, 사망자는 549명을 보여줍니다.

한 패널 안에 각각의 조건에 해당하는 2개의 메트릭값을 만들었습니다.
이렇게 보면 Buckets 의 특징이 잘 와닿지 않습니다.

 

 


우리는 메트릭에서 통계값을 '카운팅'했고, 2개의 Filter 조건을 만들었습니다.
여기서 추가 메트릭을 하나 더 만들면 어떻게 될까요??

기존의 설정은 유지한 채
Metric에 통계값 '평균' 을 나타내는 메트릭을 추가해보겠습니다.

ADD METRIC 을 통해 추가합니다.

나이의 평균값 메트릭을 추가합니다.

 

이번에도 어떤 결과값이 나올지 예상되시나요??

 

 

 

 

 

 

 

 

 

 

기존 카운팅했던 577, 549 숫자와 더불어
2개의 통계값이 추가되어 총 4개의 통계값이 생성됐습니다.
Metric 2개, Filter 조건 2개 2 x 2 가 되어 4개가 나온 것입니다.


데이터를 살펴봅시다.

기존의 데이터에서 추가된 값은 30.727, 30.626 입니다.
라벨 설명에서도 알 수 있듯이
891개의 Row데이터에서 성별이 남성인 관측값들의 평균나이

891개의 Row데이터에서 생존여부가 0인 관측값들의 평균나이


를 보여줍니다.

 

 

3. Filter와 Bucket의 Filters기능 마무리 정리

 

Filter는 사용하는 based-데이터 갯수를 감소시킵니다.
Bucket의 Filters는 based-데이터 갯수를 감소시키지 않습니다.

 

다른 말로 표현하면,
Filter는 한 패널 안에 존재하는 전체 메트릭 값에 영향을 미칩니다.
Bucket은 한 패널 안에 존재하는 메트릭 중 일부 메트릭 값에만 영향을 미칩니다.

 

 

 

4. 대시보드 확인하기

 

위에서 총 2개의 패널을 만들었습니다.

그 결과의 대시보드는 아래와 같습니다.

 

왼쪽패널은  "남성"이면서 "사망"한 사람의 평균연령과 "남성"이면서"사망"한 사람의 수
2개의 값이 나타납니다.

 

오른쪽 패널은 2개의 메트릭 값을 2개의 조건으로 그룹지었을 때의 값이 나타납니다.

"남성"이 577명, "사망"한 사람의 수 549명
"남성"의 평균 연령 30.727세, "사망"한 사람의 평균연령 30.626세임을 확인할 수 있습니다.

 

 

키바나 대시보드를 제작하면서 비슷하지만 헷갈리는 기능인 Filter를 정리해보았습니다.
위 기능에 대해 궁금하신 점은 댓글로 남겨주세요.

 

반응형