본문 바로가기

반응형

전체 글

(70)
[AARRR] Revenue 지표 사업의 성패를 가르는건 어떤 비즈니스 모델을 가지고 있으며, 그 모델이 실제로 작동하는지 가입자가 아무리 많아도 활성유저 수가 아무리 많아도 평점이 아무리 높아도 수익이 발생하지 않으면 다 꽝. Revenue관련 지표 ARPU(Average Revenue Per User) 인당 결재 평균 결재액 = 수입/유저 수 전반적인 사업 상황을 보는데 유용함. 결제자 비율이 높은지 결제자들이 평균적으로 어느 정도 결제하는지 하지만 유저와 수익에 대한 정의가 모호함. 누적 가입자 전체? 누적 결제자 전체? 이번 달 결제자? 누적 결제금액 전체? 이번 달 결제액? 오늘 결제액 따라서 일반적으로는 월매출/월 활성 유저 ARPDAU처럼 명시적으로 기간을 정의함 일매출/데일리 활성 유저 ARPPU(Average Revenu..
[AARRR] Retention 지표 Retention 지표는 크게 아래 3가지로 나뉨. classic retention range retention rolling retention classic retension(Day-N Retention) 특정일에 다시 돌아온(come back) 유저의 비율 각 날짜에 접속한 유저는 독립적으로 계산됨(반복적으로 들어왔는지 여부는 중요하지 않음) 그동안 쭉 안들어오다가 하필 설정한 날짜에 들어오면 컴백한 유저가 됨. 계산 = Day N에 서비스를 사용한 사람 수/ Day 0에 처음 서비스를 사용한 사람 수 예컨대 0일에 접속하고 1,2,3,4,5,6일동안 안들어오다가 설정한 7일 후에 접속하면 카운팅 됨. 0일에 접속하고 1,2,3,4,5,6 일동안 계속 접속했으나 설정한 7일에 접속안하면 카운팅 되지 ..
TIL [파이썬] 클래스의 이해 파이썬의 클래스는 객체와의 관계사이에서 그 의미를 잘 이해할 수 있다. 클래스 : 설계도 객체 : 설계도에 의해 만들어진 실체 로 이해하면 머리 속에 쏙쏙 들어온다. 설계도를 만들어두지 않은 채 경험에 의존해 집을 짓는다면, 인간은 분명히 실수를 하기 때문에 미묘하게 다른 집이 완성될 것이다. 따라서 설계도를 만들어두고, 이에 맞추어 제작을 해야 동일한 형태의 집이 지어질 것이다. 클래스도 마찬가지다. 클래스가 있으면 동일한 여러 객체가 필요할 때, 간편하게 객체를 생성할 수 있다. 클래스는 여러 함수를 가질 수 있다. 함수는 앞서 이해했듯이 우리가 원하는 동작을 하도록 설계해둔 알고리즘이라고 할 수 있다. 우리가 인풋을 했을 때, 해당 인풋이 작성해둔 함수에 들어가 작동하고, 결괏값을 낸다. 사칙연산이..
A/B테스트 지표: Clike rate A/B테스트: 기존의 사이트와 버튼을 변경한 사이트 툴을 50%의 확률로 랜덤하게 노출시킴. 기간: 1주일 지표 확인: 7일간 일별로 클릭율을 집계한 후 각각 비교-> 각각 비교가 어렵거나 숫자가 작을 경우 평균값 비교. 실습(2) 레벨을 올리는 퍼즐게임에서 유저가 게임을 할 때, 레벨 40에서 사용자들이 어려워서 많이 이탈하는 것으로 보여서, 레벨 40을 새로 디자인했다. 다만 이 레벨 변경으로 사용자 이탈이 해결 될 지 아닐 지 몰라서 A/B 테스트를 해보려고 한다. 이 때 어떤 지표를 잡아야할지 어떻게 테스트를 해야할지 구상. 가설: 레벨 40의 난이도를 쉽게 하면 사용자들이 덜 이탈할 것이다. 지표: 레벨 40을 1회 플레이한 후 3일 이내 다시 게임에 접속하는 사용자 ..
길이가 다른 값들을 구분하여 각 열로 나누어주기 in R 아래와 같은 데이터프레임이 있다고 가정해보자. ID CODE 1 12345 2 12345, 56788, 12222, 11111, 22222, 33333 3 12333 4 12344 5 42323 6 11111, 22222 각 아이디에는 1개 이상의 CODE값을 가지고 있다. 복수개의 CODE값을 가지고 있는 것은 쉼표로 구분이 되어있다. 만들고자 했던 데이터 프레임의 형식은 다음과 같았다. id value1 value2 value3 value4 value5 1 12345 NA NA NA NA 2 12345 56788 12222 1111 22222 3 12333 NA NA NA NA 4 12344 NA NA NA NA 5 42323 NA NA NA NA 6 11111 22222 NA NA NA 처음엔 st..
중심극한정리에 대해 알아보자 중심극한정리란 동일한 확률분포를 가진 독립확률변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다는 정리. 헷갈리지 말아야 할 것은 '표본평균의 분포'가 정규분포에 가까워지는 것이지, "표본의 평균이 모집단의 평균과 같다"는 것이 아니다. 표본의 평균은 샘플링 때마다 달라진다. i.e. 각각의 샘플에서 평균을 구한 뒤, 그 평균들의 분포를 그려보니 정규분포 모양에 근사한 것 그럼 중심극한정리가 왜 중요할까? 중심극한정리를 이용해 모집단이 어떤 형태의 분포를 가지는가에 관계없이 (e.g. 균등분포, 비균등분포, 정규분포)표본의 크기가 충분히 크다면, 표본평균의 분포가 정규분포에 가까워진다는 것을 이용해 모집단의 모수추정, 집단간 표본평균비교 등을 할 수 있다.
공분산과 상관관계 공분산은 확률변수 X의 편차와 확률변수 Y의 편차를 곱한 것의 평균값이다. 식으로는 다음과 같이 나타낼 수 있다. 뮤X와 뮤Y는 X와 Y의 평균값이다. 식을 읽어보면, 공분산은 X의 편차와 Y의 편차를 곱한것의 평균이다. 공분산이 0보다 크면 X가 증가할 때, Y가 증가한다는 뜻이다. 반대로 공분산이 0보다 작으면 X가 감소할 때, Y도 감소한다는 뜻이다. 공분산은 이렇게 두 변수가 양의 상관관계인지, 혹은 음의 상관관계인지를 보여준다. 킹치만 공분산은 확률변수 단위 크기에 영향을 많이 받는다는 단점이 있다. 그래서 단위가 다른 확률변수들의 공분산은 값을 비교하는게 어려움... 그럼 어떡하냐구... 다 똑똑한 넘들이 보완할 점을 만들어냄. 바로 상관계수 상관계수는 우리가 구한 공분산을 X표준편차와 Y표준..
정규 분포에 대해 알아보자! 정규분포는 특정값의 출현비율을 그렸을 때, 중심(평균값)을 기준으로 좌우 대칭 형태가 나타나며, 좌우 극단으로 갈수록 급격하게 수치가 낮아지는 특징이 있다. 가우스가 처음 개념을 만들어 가우스 분포라고도 함. 그럼 표준정규분포는 먼데? 표준정규분포는 정규분포를 표준화 한 것! 평균=0 표준편차=1 로 만들면 됨! How? 개별데이터에서 전체 데이터의 평균을 빼고 해당 데이터의 표준편차로 나누어줌. 이렇게 표준화된 데이터를 z-score라고 함. 왜 표준화 하느냐? 그룹간의 데이터를 비교 하기 용이하게 만들려구! 예컨대 A반의 중간고사 성적과 B반의 중간고사 성적을 비교할 때 반별 학생들의 평균과 표준편차가 다를텐데 이럴 때 객관적인 비교를 위해서 점수를 표준화하는 작업을 해줘야한다! 수능 표준점수도 뭐 ..

반응형