원격 개발 환경 구성 1. 개발용 VM 세팅(feat. 오라클)
2021. 10. 6. 20:19
Data/Data Engineering
원격 개발 환경 구성 1. 개발용 VM 세팅(feat. 오라클) I. 개요 데이터 분석과 기초 개발이나 모델링을 위해 노트북 2대를 이용 중이며 이번에 아이패드 1대를 추가로 구매하였습니다. 작업한 모든 결과물은 GIT을 이용하여 관리하며 개인 개발 및 공부용(개인 계정)과 업무용(회사 계정)을 사용 중입니다. 위 두 가지 사유로 아래와 같은 문제와 스트레스가 반복됩니다. 기기를 옮겨갈 때마다 매번 로컬 환경을 새로고침(pull) 할 필요가 있음 이 과정에서 잘못된 계정으로 push/pull 하는 경우가 생기기도 함 새로운 기기를 구매하거나, 기존 기기에 문제가 생기면 일련의 개발 환경 세팅을 매번 새롭게 해주어야 함 외출 등의 이유로 기기의 접근할 수 없어 빠르게 대응하지 못하는 상황들이 종종 존재 이..
데이터 기반 마케팅 분석 - 기여도 분석(Attribution Analysis)
2021. 8. 12. 16:59
Data/Data Analysis
기여도 분석이란? 고객이 제품을 접하고 진입한 뒤 활성 단계(critical event)에 도착하기까지 수많은 여정이 존재한다. 이 과정에서 여러 방법과 경로의 마케팅이 진행된다. 어떠한 채널/광고가 효과적이었는가를 판단하여 효율 증진 고객의 구매 여정을 활용해 UX/UI 개선, 쿠포닝 등을 통한 전환율 증진 1. 마케팅 관점의 기여도 분석 과거 마케팅은 신문 광고, TV 광고 등 추적이 어렵고, 채널이 적었다. 오늘날 마케팅에서는 제품에 접근시키기 위해 추천(초대)시스템, 온라인 광고(배너, 구글, 검색 등), 오프라인 광고(지류 쿠폰, 버스 광고 등), 앱 광고 등 다양한 채널을 개설하고 있다. 각각의 채널이 모두 같은 효과를 발생시키지 않기 때문에 채널별 가중치를 부여해가며 채널별 마케팅 기여도를 ..
해적지표(AARRR) 을 활용한 데이터 분석
2021. 8. 11. 09:33
Data/Data Analysis
해적지표(AARRR) 란? 500 strats up 설립자 데이브 맥클루어Dave McClure) 가 제시한 그로스해킹 분석 기법으로 해적 지표라는 이름으로 소개하였으며 그 효용성이 인정되어 프레임워크화 되었다. 스타트업을 "해적"으로 표현하는 것에 착안하여 해적 지표라는 네이밍이 붙었다. 초기 시장 진입 단계 또는 퀀텀점프가 필요한 제품을 가진 소규모 기업은 관찰 가능한 데이터는 많지만 그것을 분석할 자원이 부족한 경우가 많다. 해적지표는 5가지의 핵심지표를 제시하는데 해당 지표에 집중하여 리소스는 감축하면서 뛰어난 성과를 얻을 수 있기 때문에 특히 스타트업, 소규모 기업에게 매력적인 분석기법이라 할 수 있다. 단순히 제품의 리뷰가 아니라 각 지표별 성과 측정을 통해 마케팅 전략의 변경, 제품의 마이크..
[MKT/CRM] 10분만에 계산하는 CLV(LTV)
2021. 7. 10. 14:40
Data/Data Analysis
10분만에 계산하는 CLV(LTV) I. 개요 서비스 성장을 위해서는 신규 유저 모집과 이탈 유저 회유, 기존 유저 락인(lock in) 세가지가 균형있게 이루어져야 함 이를 위해 다양한 마케팅 전략(프로모션, 광고 등)을 사용 하지만 전략에 따라서는 마케터의 기대와 다르게 체리피킹 후 이탈하는 유저와 바운스 되는 유저가 굉장히 많을 수 있음 때문에 "우리가 신규 유저 유치를 위해 금주에 비용 N만큼 썼더니 가입 유저가 M 명이나 돼요!" 라고 말하는 것은 오류가 있음 따라서 고객을 유치하는 비용(CAC)과 잔존시키기 위한 비용(CRC), 유저가 우리 서비스를 이용하여 만들어낸 가치(CV) 등을 고려하여 전체 유저의 생산가치(CLV) 를 고려해야 마케팅 액션의 성과를 보다 명확히 측정할 수 있음 본문에서..
[Dagster/Orchestrator] Airflow를 이길수있을까? 새로운 data orchestrator, Dagster 맛보기
2021. 5. 22. 18:24
Data/Data Engineering
Dagster 대시보드를 업데이트하거나, 파이프라인을 꽂아 데이터를 추출 및 적재해야하는 상황 또는 모델의 학습과 데이터 전처리 자동화 등 정기적으로 수행해야하는 업무들이 있습니다. 이러한 일들은 꼭 필요한 작업이지만 매번 사람이 직접 수행하기 어려운 경우가 많습니다. 우리는 이러한 일들을 여러 툴을 사용해 자동화 시키곤 하는데, 이때 가장 자주 사용되는 것이 Airflow 입니다. airflow는 python 기반으로 작성이 가능하다는 점에서 데이터 분석가도 쉽게 사용할 수 있는 장점이 있으며, 방대한 생태계와 잘 정리된 문서로 쉽게 도움을 받을 수 있다는 장점이 있습니다. 또한 나름 괜찮은 UI를 제공하고 있기도 합니다. 이러한 사유로 여태껏 airflow는 워크플로엔진의 탑티어로 군림하고 있으며 어..