카테고리 없음

[TIL26]

LHJ_ 2024. 12. 26. 23:53

프로젝트

별벅스 데이터를 선정했던 이유
JSON 데이터 전처리를 할 수 있음
실생활에 좀 더 친숙한 소재로 평소에도 느꼈던 경험으로 인하여 다양한 인사이트 도출 가능
다양한 고객 세그멘테이션 등등을 이용하여 비즈니스 기획을 해볼 수 있음
여러가지 체널을 이용하여 마케팅 전략, 리소스 최소화와 같이 여러가지 분석을 할 수 있음.



이후는 구글 이커마스 데이터 셋을 사용하면 클라우드 내에서 팀원과 sql을 공유하는 경험을 할 수 있고 빅데이터를 다룰 수 있는 경험을 얻을 수 있을 것 같아 변경하였음. 밑에는 주제를 정하고 그 안에 분석을 어떤 것으로 해야할지 정하면서 적은 메모.


시간대별 
고객 등급별 유지
프로모션 데이터가 있으니 어떤 프로모션이 효과가 있는지 할인 쿠폰의 반응, 무료 음료, 굿즈 판매 프로모션 효과
어떤 걸 사람들이 바라는지

계절메뉴 (신메뉴 프로모션 )




I. 고객 제안을 보내는 더 나은 방법은 무엇입니까?
II. 특정 고객 그룹에 대해 권장되는 전략은 무엇입니까?


모든 고객이 동일한 혜택을 받은 것은 아니다

제안 관련 이벤트에는 제안 접수, 제안 조회 및 완료, 그리고 고객이 구매한 거래라는 세 가지 유형


내가 만든 쿼리를 바로 공유할 수 있음<회사에서 


Visit number 현재 방문한 횟수 표시 (사이트에 아예 처음 들어오면 1, 전에 들어온 적이 있으면 2 전에 들어왔다는 기록은 어디서 나오는거지?)

해싱되다 입력값에 수학적 알고리즘을 적용하여 고정된 크기의 문자열을 출력하는 과정

해싱 : 보안 안전 번호



처음에 분석 기법 정할 때 뭘 해야할지도 모르겠고... 팀원이 말하는 걸 못 따라가서 나중에 이런 상황이 온다면 내가 할 수 있는 부분에 대해서 적어봄.

광고를 위해 분석한 사람이 있는지 확인(레포터 확인)
전체적인 테이블을 확인하여 테이블이 가지고 있는 성격?... 속성 파악.. 그에 따른 분석 방법을 확인...



길을 잃고 많이 헤매는 기분이 들어서 다시 한 번 가장 목표하는 바가 무엇인지 다시 한 번 확인함.

온라인 상점의 운영 전략을 제시하는 것을 목표
신규고객 유치, 휴면 고객 돌아오기, 기존 고객 할인 정보 구매 유도 / 
결국 판매율을 높이기 위함


그러다가 나온 이야기가 코호트 분석을 활용하자는 이야기.
코호트 분석을 하려면 기준을 가지고 사용자 그룹을 나눠야 함
그 그룹별로 구매 추적
예를 들어 프로모션 종류가 많음 나눠 놓은 특정 그룹별로 좋은 반응이 나오는 프로모션이 나옴
그 마케팅의 효과를 구매 전환율 구매 패턴

🍪프로모션(광고) - 코호트 분석 도출할 수 있는 주제

  1. 월별 / 계절별 등 구매와 관련된 그룹화 > 해당 시점의 프로모션 연결
  2. 프로모션 반응 기준 그룹화
    • 특정 광고에 반응한 고객끼리 묶어보기
    • 이때 구매전환이 이루어진 고객의 재구매율 분석
  3. 프로모션 유입 경로 기준 그룹화
  4. 구매 고객의 재구매율? 구매 후 다음 구매까지 경과 시간
  5. 프로모션 기간 동안 유입된 고객의 시간대 분석 > 효율적인 광고 시간대


이런 방향으로 가도 되는지 튜터님께 여쭤봄. 들은 내용을 대략적으로 정리.
유저들이 들어온 데이터를 가지고 하루에 몇 명이 들어오는지 확인
그 기준으로 프로모션을 타고 외부에서 들어온 사람이랑 오가닉하게 들어온 사람이랑 그룹을 형성
그렇게 만들어진 그룹 안에서 구매전환율, 재구매 전환율, 이탈율 확인


이렇게 나눈 그룹에 대해서 다시 세부적으로 나눈다면,

프로모션별로 나눌 수 있음
유효한 프로모션은 어떤 특성 프로모션인지 확인
어떤 프로모션이 높다면 왜 높은지 확인

유입되는 체널별로 나눌 수 있음.
프로모션 별 그 프로모션을 어디에서 개시했는지
개시 사이트를 활용하여 그 중 가장 임펙트있는 경로를 확인하고 고객 수를 확인

프로모션으로 들어온 고객이 구매 전환율이 높다면 얼마나 높은지 확인 (프로모션으로 들어오지 않은 유저와의 평균 금액 차이)
프로모션을 더 하면 얼마나 더 매출을 높일 수 있는지<이런 접근이 가능하다

가장 기본적인 유저들이 평균 일주일에 얼마나 방문하는지는 기본 정보 월별 분기별로 봤을 때 지표를 확인. e커머스라면 당연히 봐야하는 지표를 확인




그룹별 구매와 소비 패턴 추적 


시각화 용의 이 데이터가 뭔지 모름(다른 사람은)
운영 전략을 제시

유저들이 들어온 데이터를 가지고 하루에 몇 명이 들어오는지 확인
그 기준으로 외부로 들어온 사람이랑 오가닉하게 들어온 사람이랑 갈라
그리고 구매전환율
재구매 전환율
얼마나 이탈했는지 률

프로모션별로 나눌 수 있음
유효한 프로모션 어떤 특성 프로모션
어떤 프로모션보다 높다 왜 높은지 

유입되는 체널별 구글

프로모션 별 그 프로모션을 어디에서 개시했는지
개시 사이트를 활용
가장 임펙트있는 경로 및 고객

프로모션의 고객이 구매 전환율이 높다 얼마나 평균 금액 차이가 있는지

프로모션을 더 하면 얼마나 더 매출을 높일 수 있는지<이런 접근이 가능하다


가장 기본적인
유저들이 평균 일주일에 얼마나 방문하는지는 기본 정보
월별 분기별로 봤을 때 지표를 확인. 
e커머스라면 당연히 봐야하는 지표를 확인



두 그룹의 패턴을 확인 후 프로모션의 유무 확인


파레토의 법칙 
법칙이 맞는지 확인


20%를 왜 그렇게 많이 사는지 이유 분석 구매 패턴 분석




유저 행동 분석이 되어야 이탈자에 대한 기준을 잡을 수 있다
전체 리텐션을 봐야한다(평균 주기를 봐야함)
신규 방문자 제외해서 몇 번씩 
개개인으로 볼 지 전체로 볼지
서비스의 어떤 모습이 보임

신규나 복귀를 언제 할 수있는지 기간을 정할 수 있음

신규고객은 뺌
각 달의 활성 유저

이런 유저의 전체적인 행동을 보고(EDA가 끝나고) 나서 각 컬럼마다 나눠서 확인 할 수 있음 (제품군)




수업시간이 끝난 후 메너저님과 상담하면서 정리한 내용.

1. 전체 유저들의 재방문 평균적인 패턴 확인
2. 개개인의 유저를 랜덤으로 뽑아서 재방문의 패턴을 확인(이 데이터가 전체적으로 재방문율을 설정하기에 적합한 데이터인지 확인)

분석을 중점으로 데이터 컬럼을 하나하나 확인해보는 것은 너무 광범위 함.
때문에 데이터의 전체적인 흐름을 보기 위한 EDA가 다 함께 진행이 되어야함. (물론 이 과정에서 필요 없을 것 같은 건 제외한 상태에서 뜯어보기 (모든 경우의 수를 보기에는 시간이 없음))
EDA 진행이 되어야지만 분석을 하기 위한 (예를 들면 코호트 분석) 기법과 어떤 컬럼을 중심으로 진행이 되어야 할지 확인 할 수 있음.




여기에 더해서 다른 팀원분이 추가하여 최종 정리본
튜터님께서 말씀하신 핵심지표[신규유저, 이탈 유저, 돌아온 유저]를 통한 분석을 하기 위해서는 기간 설정이 중요하다. 앞서 얘기 나온 한달, 7일 등은 러프한 값으로, 특정적으로 이 google merchandise store에 적용해서 유의미한 데이터를 뽑아내기 위한 기간은 구체적으로 잡아주는 것이 좋다. 그러기 위해서 해야할 것
(참고: 재방문은 고유사용자ID와 날짜 두 컬럼을 이용해서 고유 사용자들이 각각 어떤 날짜에 데이터가 찍혔는지를 단순하게 확인해서 패턴을 보면 됨) 1. 랜덤으로 유저 몇명을 뽑아서 재방문 패턴이 어떤지 확인해 본다.
(이 데이터가 궁극적으로 retention을 파악하기에 적합한 데이터인지 preview 느낌으로 확인해보는 작업)
 2.전체 유저들의 재방문 기간의 평균 값을 구해본다.
 3. 간단한 EDA 과정이 필요하다. 최종적으로 retention 기간을 설정하기 위해서 더 구체적인 정보를 얻기 위해 필요한 과정이다. 전체 데이터의 흐름을 알기 위해서도 필요함.

 

EDA 프로젝트 때 목적성을 가지지 않고 헤맨 것에 대해 크게 데인 바가 있어 이번엔 너무 목적만 가지고 분석 기법에만 집중한 것 같음. 분석을 하려면 단계별로 차분하게 나아가야하는데 그걸 생략하고 바로 어떤 분석을 할지, 그에 맞는 어떤 컬럼을 써야할지 하나하나 골라보고 있었음. 분석이라는 것은 EDA가 꼭 필요한 건데 기법에 정신이 팔려 중요한 사실을 잊어버린 듯 함.

내일은 EDA에 중점을 맞춰서 진행해보기로..

 

 

더보기

너무 풀어졌다...

연말과 크리스마스라는 이유로....

또 판다스와 시각화에 들어가면서 어떤 공부를 구체적을 해야할지 갈피를 잡지 못해 계속해서 미뤄두기도 하였다. 하지만 이제 크리스마스도 지났으니 나는 다시 태어났다.

이제 정말.. 미루지 않고 적어야겠다. 아무리 힘들더라도.... 오늘처럼 복붙과 거기에 대해 살짝 정리하는 형식이 되더라도 매일 꾸준히 쓰자. 

 

오늘 다시 태어난 김에 미뤘던 부분들을 다 다시 정리하려고 했는데, 프로젝트 시작으로 정리할 시간이 없어보인다. 사실 시간이야 있지... 이럴 시간에 적음 되잖어... 주말에 꼭 해야겠다(ㅋㅋㅋ) 아 맞아 개인과제 복습도... sql도 못했는데 큰일났다.. 이번 주 주말은 주말이 없는 거다.. 잠만 푹 자고... 할 일을 하자

 

공식으로 진행되는 첫 프로젝트라 긴장도 많이 된다. 소통을 잘 할 수 있을지도 모르겠고... 오늘 이야기 나누면서 따라가지 못한 느낌을 받음.. 

서로 가지고 있는 지식 수준이 다른데 그걸 간과하고 대화하는 느낌이다... 코드 공부는 억지로 따라가면 질문하고 하며 할 수 있는데 분석 쪽으로가면 도메인 지식도 거의 전무하다 싶이하고... 그래서 컬럼 하나하나 확인 할 때도 뭘 의미하는지도 모르겠고 뭐부터 시작해야할지 모르겠는 느낌?..... 사실 코드도.. 판다스 시각화도.. 잘 활용하지 못한다.. 할 게 너무 많은데 따라가기도 점점 힘들어서 안 그래도 딸리는 체력 버티기도 힘들어진다.. 큰일이났다... 아냐 난 할 수 없다.. 없어도 뭐.. 버티면 어케든 되것지...