셈이, 연서, 연이, 오영, 우진
신규고객을 확보하기 위해 지출되는 비용이 기존고객을 유지하는 비용보다 5배 이상 달한다는 선행연구 결과⁽¹⁾ 통해 서비스 포화 시장에서 기업의 경쟁력 강화를 위한 3가지 주요 전략(1. 신규고객 확보, 2. 기존 고객에 대한 매출 증대, 3. 고객 유지 기간 연장)중, 고객 유지 기간 연장 전략이 가장 수익성이 높은 것으로 나타났습니다.⁽²⁾
또한 고객유지율을 5% 높이는 것으로, 수익의 25~95%를 증가시킬 수 있으며, 2년이 지날 경우 유지율 5%의 차이가 고객의 수 비율을 500% 차이 나게 만들 수 있습니다. ( Frederick Reichheld of Bain & Company) (Gond) 이와 관련된 많은 연구를 통해, 고객 유지 전략의 필요성이 오랜 기간 기업의 주요 관심사로 대두되었으며, 대부분의 기업에서 고객 이탈을 줄이기 위한 마케팅을 더욱 세분화하여 진행하고 있습니다.
과거에 회사는 이탈률의 원인을 이해하려고 노력했고, 사후 조치 계획을 통해 이러한 요인을 해결했습니다. 고객 이탈 예측의 정확도를 높이기 위해 기계 학습을 기반으로 한 고객 이탈 예측 모델을 이용하여, 이탈 방지를 위한 전략을 시기적절하게 적용하고 있습니다. 이는 통신사에서 비롯되어 지난 수십 년간 금융 분야 및 다양한 서비스 분야로 확대되었습니다.
이에 따라 다양한 고객의 니즈를 충족하기 위해 고객의 특성과 가치를 더욱 세분화하고 있고, 충성도와 이탈률 예측 정확도를 점진적으로 개선하는 등, 데이터를 기반한 이탈예측의 노력이 늘어나고 있습니다. 이에 대한 예로, 2015년 노르웨이 신문 Afterposten은 2015년 이탈 예측 모델을 개발하여, 이탈 가능 독자를 식별해, 특별 프로모션 및 할인과 같은 전략을 수행했습니다. 고객 지원 부서에서 해지할 가능성이 있는 구독자에게 연락하여 이탈을 방지했고, 5년간 구독자 수를 10만 6천 명에서 16만 5천 명 이상으로 증가했으며, 이와 같은 방법을 통해, 윌스트리트저널의 경우, 2018년 160만 명에서 2023년 340만 명으로 증가했습니다.
고객의 이탈율과 원인을 예측하고 고객의 이탈에 영향을 주는 특징을 찾아내는 것을 해당 프로젝트의 목적으로 설정 했습니다. pandas 라이브러리를 이용해 데이터를 확인하고, 고객이 이탈하는 이유가 될 수 있는 특징을 찾아내고 새로운 독립변수를 생성할 것입니다. 또한, 랜덤 포레스트 모델을 사용하여 이탈 고객을 예측하고, 주기적으로 변화하는 데이터를 쉽게 전처리 하고 예측할 수 있도록 제작하였습니다.
python 3.11.9
pandas
sklearn
matplotlib
seaborn
캐글 링크