뉴스레터 구독

최신 소식과 업데이트를 받아보세요.

코호트 분석에 대하여

홍길동
작성자
홍길동
카테고리
Analytics
작성일
2026년 1월 6일
조회수
13
좋아요
공유
코호트 분석에 대하여

코호트분석(Cohort Analysis)에 대하여

—-----

#cohort, #segment, #코호트, #세그먼트, #retention, #종적연구, #횡적연구

—-----

  1. Introduction
    1. Cohort란?
    2. 세그먼트와의 관계
    3. Cohort Study vs Cohort Analysis
  2. Cohort Analysis (in Analytics)
    1. 활용사례
  3. Special Case: Retention Analysis
    1. Retention Curve
    2. Retention Triangle
  4. (In-Depth Case Study)
  5. @signal은 이런 기능이 제공됩니다.
  6. Summary

코호트란 한마디로 ‘동질집단’이라고 번역하며, 좀더 풀어서 정의하자면 ‘특정 기간동안 공통된 특성이나 경험을 갖는 사용자 집단’이라고 할 수 있다. 세그먼트와 혼용해서 쓰이기도 한데, 정확하게는 **‘기간 또는 날짜의 개념이 포함된 고객 세그먼트’**라고 이해하면 된다.

  • 코호트 = 동질집단 = ‘특정 기간동안 공통된 특성이나 경험을 갖는 사용자 집단’
  • 구체적인 예시를 들어보면:
    • ‘국내 A 제조사 세단을 타는 사람들’ → 세그먼트
    • ‘국내 A 제조사 세단을 2024년 12월에 구매한 사람들’ → 코호트

흔히, 학계연구 또는 언론기사에서 언급되는 **코호트연구(Cohort Study)**라는 것이 있다. 주로 의학이나 사회과학에서 많이 사용되는 기법인데, 코호트연구와 코호트분석은 공통점이 있지만, 전개되는 방식에서 차이가 있다. 그럼에도 불구하고, 두가지 사이에는 Time(기간)이라는 요소와 기간의 경과를 추적하며 관심지표의 변화의 정도를 파악하는 측면에서 중요한 맥락을 함께하고 있다.

코호트 분석이 아닌 코호트 연구의 예시를 보면:

  • 코로나 시기 3년동안 중학교 시절을 보낸 학생들의 학업 성취도 또는 정신병리학 연구: 대조군이 없는 단일 코호트 연구
  • 흡연자 그룹과 비흡연자 그룹을 20년간 추적관찰하여 폐암 발생률을 비교: 대조군이 있는 코호트 연구

잠시, 종적연구횡적연구라는 개념부터 언급해보자. 코호트연구종적연구이다. 여기서 ‘종적’은 시간의 경과를 추적하면서 변화를 비교하고 연구한다는 개념이고, 횡적연구는 동일한 시점(기간)에서 다른 분류 기준으로 나뉘어지는 집단을 비교하는 것이다. 따라서, 코호트연구코호트분석은 동질 집단(시간 조건 포함)을 대상으로 하며, 기간의 경과에 따른 추적(종적연구)이 핵심이라는 것이다. 여기에 동일 시점에서의 다른 집단과 비교(횡적연구)를 하게 될 때, 실질적인 가치를 지니게 된다. 코호트 연구에서는 다른 집단(실험 대조군)과의 비교는 상대적으로 생략되기도 한다. 참고로, 흔히 세그먼트라고 하는 분류는 횡적연구를 위한 집단구분이라고 보면 된다.

그럼 우리가 집중해야할 코호트 분석에 대해 조금 더 알아보자.

코호트분석은 사용자를 특정 시점/기간 기준(가입일, 가입월, 첫 구매일, 첫 구매월 등)으로 그룹화하되, 세부 기준을 추가하여 정의할 수 있다. 기본적으로는 시간기반 조건, 행동기반 조건, 구매기반 조건으로 나눌 수 있는데, 현실적으로는 아래의 기준으로 주로 사용된다.

  • Time조건은 필수: 가입코호트, 구매코호트, 이벤트코호트 로 구분할 수 있겠다.
    • 설치시점, 가입시점, 유휴고객에서 활성화고객으로 전환된 시점
    • 구매시점 (첫 구매 외에는 구매시점은 더 이상 사용되지 않는다.)
    • 기타 비교 및 추적 모니터링이 필요한 이벤트(친구 추천 등)의 시점
  • 자주 사용되는 추가 조건:
    • 트리거 조건: 유입 채널, 유입 이벤트, 유입 또는 첫구매 프로모션
    • 데모그래픽 정보(성/연령/지역)
  • 기타 상세 분류를 위한 조건:
    • 사용량 및 빈도(구매/방문 횟수, 구매액 평균)
    • 마케팅용 프로파일 정보(관심 카테고리, 주 구매 카테고리, 구독회원 여부, LTV)
    • 행동/context 특성(주 접속/구매 시간대, 주 접속 지역, 특정 기능을 사용하는 고객)

기본적으로 코호트를 정의할 때 사용된 기간(Time) 조건은, 동일한 기간 분류 단위(시간대, 일, 주, 월, 분기 등)로 구분되는 다른 기간의 코호트와 비교를 하거나, 사용된 기간 조건 이후에 연속적으로 반복되는 기간 또는 합리적인 기간 단위로 추적을 한다는 암묵적인 추적기준이 내포되어 있다. 횡적연구에 해당하는 해당기간의 다른 집단 비교는 필수가 아니라 선택적이며, 때로는 다른 비교 집단이 없을 수도 있다.
아래 2가지 경우에 대해서 언급하자면, 2개 코호트 모두 코호트 정의에 사용된 기간 단위와 동일한 기간의 이후 모니터링이 필수이다. 첫번째는 weekly 비교가 이어지며, 두번째는 월별 모니터링이 수반되는 것이다.

  • 2024년 9월 첫째주 가입자 cohort:
    • Week 단위의 가입자 비교(둘째주 가입자, 셋째주 가입자, 등)가 필요하다는 의미
    • 다른 시점 가입자와 종적연구의 비교가 필요한 유형이다.
  • 2025년 1월 친구추천 이벤트를 통해 가입한 고객 cohort:
    • 다른 이벤트를 통해 가입한 고객 또는 자발적 가입고객과의 비교가 필요하다는 의미
    • 즉, 횡적연구가 이루어져야 의미가 있는 유형이다.
    • 이 고객군의 이후 기간 경과별 지표 추적(종적연구)가 수반된다.

코호트 분석이 주로 사용되는 분야를 보면

  • 사용자 행동 및 반응 분석: 특정 시점에 가입한 고객의 이후 변화를 추적하기 위함.
  • 고객 유지율 개선: 특정 시점에 가입한 고객의 이후 재방문율을 분석하면서 추가 조건으로 분류하여 기업의 고객 접근 전략을 세울 때 사용함. 특히, 신규 가입 고객에 대한 모니터링이 주로 이루어진다.
  • 제품 개선 방향 도출: Churn Rate(이탈률), Bounce Rate이 높은 고객군이 있다면, 우리 제품의 UX에 무언가 개선해야 될 요소가 있다는 것이다.
  • 마케팅 프로그램 효과 측정: 프로모션 별로 유입된 고객 또는 반응을 한 고객의 이후 활동에서 유의미한 인사이트를 얻기 위해 수행한다.

코호트와 세그먼트 개념이 함께 혼용되는 케이스를 보자

코호트 분석을 하게 되면 결국 이를 표나 차트 등 비주얼라이제이션을 수행해야 될텐데, 일반적인 정리 패턴은 **코호트 집단(세로축)**과 **경과시간단위(가로축)**가 열과 행으로 나누어져서 표로 구성되는 형태이다.

이런 형태가 바로 Retention Analysis와 Cohort Analysis이며, 실제로 이 2가지 분석은 개념상 동일한 것이다. 사실상 Retention Analysis는 Cohort Analysis의 특별한 하나의 케이스인 것이다. 흔히, 사용되는 Retention Curve와 Retention Triangle을 예시로 들어보자.

Retention Curve

Retention Triangle

이상에서 코호트세그먼트를 구분하려 차이점을 설명하긴 했지만, 일반적으로 Product Analytics Tool에서는 두가지의 개념이 약간 다른 용도로 아래처럼 사용되고 있다.

  • 코호트는 저장가능한 고객들에 대한 집합 성격이 강하고,
  • 세그먼트는 리포트 내에서 일회성 분석 필터로 사용된다.

코호트는 고객 기준이며 기간 개념이 필수이고, 세그먼트는 이벤트 기준 분류가 중심이라고 하지만 결국 고객 기준 분류는 동일하다. 오히려 기간 개념이 없다는 점이 유일한 차이라고 보는게 더 명확하다.

**앳시그널(@signal)**에서 제공하는 코호트분석은 아래 사항들을 지원한다.

  • Multiple Cohort의 교집합과 합집합을 통해서 세분화하여 관심지표를 분석할 수 있다.
  • 고객 세그먼트 개념이 포함되어 있으며 마케팅 목적에 부합하는 집단에 대한 분석이 가능하다.

Summary

  • Cohort는 기간 개념이 명확히 표현된 세그먼트라고 할 수 있다.
  • 단순히 Cohort간의 결과치 Metric 비교를 떠나서, Root-Cause Analysis를 해야 의미가 있다. 두 코호트 간의 차이가 나는 원인이 우리가 관찰하지 않은(또는 못한) 요인 때문인지 반복적으로 탐색하며, 원인을 찾아야 된다는 것이다. 여기서 중요한 것은 연관관계가 아닌 인과관계를 반드시 찾아야 된다는 점!
  • 코호트 분석을 왜 할까요? 결국, 어떤 고객들이 특정 이벤트에 반응을 잘하고, 그 이후에 재방문율이 높으며, 구매단가가 높은지, 우리 제품에 대한 만족도가 높은지 확인하기 위함이 아닌가요? 그래서, 더더욱 함축된 표면적으로 나타나지 않는 요인에 대해 가설을 수립하고, 지속적으로 확인하는 과정이 필요합니다.
  • 결국 실험계획 및 AB test의 영역까지 연결이 되어서 유기적으로 Closed Loop Cycle이 완성되어야 합니다.