고객 이탈 예측 데이터마이닝 기법 비교 연구 = Comparison of data mining methodology for predicting customer defection
저자
발행사항
서울 : 연세대학교 정보대학원, 2006
학위논문사항
학위논문(석사)-- 연세대학교 정보대학원 : 정보시스템 관리 전공 2006.2
발행연도
2006
작성언어
한국어
주제어
발행국(도시)
서울
형태사항
ix, 42장 : 삽도 ; 26 cm
일반주기명
지도교수: 이준기
소장기관
This study attempted to find out the factors affecting the predictability of Data Mining Methodologies that are used for the prediction of customer defection, and compared the predictability.Unlike in previous researches, the differences in the predictability of Data Mining Methodology based on the size of sample, the ratio of Training Sample and Testing Sample, and distribution ratio were examined. Then a comparison was made to verify the component ratio with which the predictability was superior.In addition, the existing major Decision Tree Algorithms of C4.5, CHAID and CART were compared to the predictability of a brand-new technique of Ensemble to analyze the difference in their predictability.It was found out through an actual analysis based on hypothetical data that the Data Mining Methodologies had different predictabilities according to the dissimilarity in the size of samples abstracted from the population, abstraction method, distribution ratio of the sample and the size of the Testing Sample which is the target variable.It was observed in this evaluation that the Decision Tree Algorithm had a high level of stability and predictability with the change in the sample distribution ratio, and the Neural Network Algorithm and the Regression Analysis Algorithm had an elevated predictability with a Balanced Sampling of the Training Sample and Testing Sample.
더보기데이터의 양은 늘어가고 있으나 정작 필요한 정보만을 얻어내는 일은 그만큼 어려워지고 있는 것이 현실이다. 이에 원하는 정보를 찾아내는 과정인 데이터마이닝을 이용하여 의미 있는 지식을 찾아내고자 여러 가지 데이터마이닝 기법들이 사용되어지고 있다.본 논문에서는 고객이탈 예측 기법에 사용되어지는 데이터마이닝 기법들의 예측력에 영향을 미치는 요소들을 찾아보고 예측력을 비교해 보았다.기존의 연구들과 달리 데이터마이닝의 예측력에 영향을 미치는 것으로 표본의 크기, 분석표본과 검증표본의 비율, 구성비에 따라 차이가 있는지를 검증해 보고, 어떤 구성비 아래에서 예측력이 우수한지를 비교 검증하였다.또한 기존에 주로 사용되어진 의사결정나무기법 C4.5, CHAID, CART와 최신 기법인 Ensemble의 예측력을 비교하여 예측력의 차이를 분석하였다.가상의 데이터를 기반으로 실증 분석한 결과 다음과 같은 결과를 얻을 수 있었다.데이터마이닝 기법들은 모집단에서 추출되어지는 표본의 크기, 추출방법, 표본의 구성비율, 목표변수인 검증표본의 크기의 차이에 따라 예측력의 차이가 있음을 알 수 있었고, 이 평가속에서 의사결정나무의 기법들은 표본구성비율의 변화속에서 안정성과 예측력이 높으며 신경망기법과 회귀분석기법은 분석표본과 검증표본의 표본구성비가 비슷한 경우에 예측력이 높게 나타나고 있음을 알 수 있었다.
더보기분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)