데이터마이닝 기법을 활용한 외식소비자들의 구매 연관성 분석
저자
발행사항
서울 : 경희대학교 대학원, 2020
학위논문사항
학위논문(박사)-- 경희대학교 대학원 : 조리외식경영학과 2020. 2
발행연도
2020
작성언어
한국어
주제어
DDC
641.7 판사항(22)
발행국(도시)
서울
기타서명
A Study of Diners' Purchase Association Rule Using Data Mining Methods
형태사항
ix, 205 p. : 삽화 ; 26 cm
일반주기명
경희대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 최규완
참고문헌: p. 165-179
UCI식별코드
I804:11006-200000285121
소장기관
In an era of rapidly changing business environment, accurately identifying the needs of customers has long been considered a very important task. As big data is now available, various studies have been conducted to predict purchasing patterns by analyzing large amounts of consumer purchasing data. In recent research on the hospitality industry, purchasing pattern analysis based on data mining has emerged as an important methodology. Among them, RFM(Recency, Frequency, and Monetary) analysis and association analysis are frequently used. Based on past purchasing data, the RFM methodology identifies a profitable group of customers by analyzing information about how recently, how frequently, and how much the
purchase has been made. Association rule methodology contrasts with the passive methodology that only tests random hypotheses set by researchers, with a technique to explore the relationship between variables from simple binomial data.
In this dissertation, the consumer panel data and credit card payment information provided by EMBRAIN is used to conduct a sociological analysis that classifies out customers and discover significant association rules among classified clusters. Out of the total 115,000 panels, panel data of 11,187 who agreed to provide credit card payment information was collected, then 6,980 consumers who paid for dining out are to be extracted and analyzed. To handle large amounts of data, RFM analysis, Sparse K-means cluster analysis, and association rule analysis are used as research methodologies. The purchase concentration by age, gender, income,
educational background, marital status, regional and residential status for 152 restaurant brands well known to the general consumer is to be looked at, and to see if there are any differences in purchases based on
demographics. Instead of consumer choice attributes or surveys, modified RFM analysis is utilized using the actual credit card payment information. In this dissertation, modified RFM analysis is called FMP analysis using the frequency(F), the total amount(M) of restaurant payment, and the percentage of restaurant payment out of total credit card expenditures(P). Based on prior research and industry experts' advice, percentage of
restaurant payment out of total credit card expenditure is used instead of recency. By looking at the ratio of payments to dining out, it is expected to better understand how much the consumer puts weighs on dining out. After segmenting 6,980 eating out consumers into 27 groups(F: 3 groups × M: 3groups × P: 3 groups), FMP lower, middle, and upper value is analyzed. Then Sparse K-means cluster analysis is used to group the customers with similar characteristics and association rules is extracted by cluster and
identify the characteristics of the restaurant consumer. Based on a total of 36,581 payments, the top five brands were Paris Baguette, Starbucks, McDonald's, Baemin, Lotteria, with many coffee shops at the top. Fast-food topped the list for men, and Paris Baguette topped the list in almost every field, but Mom'sTouch topped the list for 10s. Delivery application Baemin ranked in top for 10s, 20s and 30s, but the frequency
decreases sharply in their 40s and older who are not actively utilizing the app. FMP analysis to compare the lower values(111 groups), the median values(222 groups) and the upper values(333 groups) is conducted, with each group showing differences in demographic information and different association rules. In addition, whether FMP 333 group is truly the top-rated group of restaurant consumption is carefully considered, and 331 and 332 groups, which have different rates of payment for dining out of total credit
card spending(P), are also valuable groups that should be noticed by restaurant industry. Later, the Sparse K-means cluster analysis was utilized to classify into four clusters, which is an algorithm that simultaneously seek
to maximize similarities within a cluster and differences between clutters. Each of the four clusters was named dine-out heavy user, dine-out medium user, dine-out light user, dine-out rare user, and classified into groups with high FMP values, similar values, low values and very low values compared to the overall mean, showing different demographic information and association rules.
Key words: credit card payment, diners, RFM analysis, cluster analysis, association rule
급변하는 경영 환경 변화의 시대에 고객의 니즈를 정확하게 파악하는 것은 예전부터 매우 중요한 과제로 인식되고 있다. 현재 빅데이터가 활용 가능하게 됨으로써 대량의 소비자의 구매 데이터를 분석하여 구매 패턴을 예측하는 다양한 연구가 진행되었다. 최근 환대산업 연구에 있어 데이터마이닝에 바탕을 둔 구매 패턴 분석기법이 중요한 방법론으로 떠오르고 있다. 그 중에서도 RFM(Recency, Frequency, Monetary: 최근성, 빈도, 금전가치) 분석과 연관성 분석이 자주 이용되고 있다. RFM 방법론은 과거 구매 데이터를 바탕으로 고객의 구매 시기, 구매 빈도, 구매 총액의 정보 분석을 통하여 수익성 있는 고객 그룹을 찾아내는 것이며, 연관규칙은 간단한 이항 데이터로부터 변수 사이의 관계성을 탐색적으로 찾아내는 기법으로 연구자가 설정한 임의의 가설 검정만을 하는 피동적인 방법론과 대비된다.
본 학위 논문에서는 ㈜마크로밀엠브레인에서 제공한 소비자 패널데이터와 신용카드 결제정보를 활용하여 외식소비자들을 분류하고 분류된 군집 사이에서 유의미한 연관규칙을 발견하는 사회과학적 분석을 해보고자 한다. 총 11만 5천여 명의 패널 중 신용카드 결제정보활용에 동의한 패널데이터 11,187명분을 받아서 외식분야에 결제를 한 외식소비자 6,980명을 추출하여 분석을 진행한다. 대량의 데이터를 처리하기 위하여 데이터마이닝 기법인 RFM분석, Sparse K-평균 군집분석, 연관성분석을 연구방법론으로 활용한다. 일반 소비자에게 잘 알려진 152개의 외식브랜드에 대한 연령별, 성별, 소득별, 학력별, 결혼여부별, 지역별, 주거보유 현황별 구매집중도를 알아보고, 인구통계 정보를 바탕으로 집단별 구매에 차이가 있는지 파악해보고자 한다. 그간 이루어진 소비자 선택속성이나 설문에 근거하는 대신 실제 결제 정보를 바탕으로 외식 결제 빈도(F: frequency), 외식 결제 총액(M: monetary), 전체 신용카드 지출 중 외식 결제 비율(P: proportion of restaurant expense over all other expenses)을 활용한 변형된 RFM분석인 'FMP분석‘을 시행한다. 선행연구와 업계 전문가들의 조언에 따라 빈번하게 일어나는 외식 결제의 특성에 기안하여 최근성(R)을 제외하고 대신 전체 신용카드 지출 중 외식 결제 비율(P)을 대신 넣어 외식소비자가 외식에 얼마만큼의 지출을 하는지를 알아보기로 한다. 이는 소비자의 전체 신용카드 지출을 파악할 수 있기에 가능하며, 외식 결제 비율(P)을 알아봄으로써 해당 외식소비자가 외식에 지출하는 중요도를 더 잘 알아볼 수 있으리라 예측하기 때문이다. 고객을 총 27개의 그룹(F: 3개 × M: 3개 × P: 3개)으로 세분화하여 FMP 하위값, 중위값, 상위값 그룹을 분석한 후, Sparse K-평균 군집분석을 활용하여 고객을 비슷한 특성끼리 묶어 해당 군집별 연관규칙을 추출하고 외식소비자의 특성을 알아본다.
빈도분석 결과, 총 36,581번의 결제를 바탕으로 상위 5개 브랜드는 파리바게뜨, 스타벅스, 맥도날드, 배달의민족, 롯데리아였으며 커피전문점 브랜드 다수가 상위권을 차지하였다. 인구통계 특성별 구매집중 빈도분석에서는 다음의 특징을 보였다. 남성의 경우 패스트푸드가, 여성은 제과점과 커피전문점 결제가 상위권을 차지하였으며, 거의 모든 분야에서 파리바게뜨가 1위를 차지하였으나 10대에서는 맘스터치가 1위를 기록한 흥미로운 결과를 보였다. 배달의민족은 10대, 20대, 30대에서는 모두 상위권을 기록하였으나, 40대 이후에서는 9위 밖으로 밀려난 것을 보아 앱 활용이 활발하지 않은 40대 이상에서 사용빈도가 급감함을 알 수 있다. 학력별 결제에서 주목할 점은 같은 커피브랜드라도 이디야가 비슷한 순위를 기록한 것에 반해 스타벅스는 학력이 올라감에 따라 순위가 상승하는 것을 볼 수 있다. 또한 투썸플레이스는 1억 원 이상에서 처음 등장하며 9위를 기록하였는데 학력에서도 대학원 재학과 대학원 졸업에만 등장하여, 고소득 고학력 소비자들이 선호하는 브랜드로 해석할 수 있겠다.
FMP분석을 활용하여 분류된 27개 그룹을 바탕으로 하위값(111 그룹), 중위값(222 그룹), 상위값(333 그룹)을 비교해보았는데, 각 그룹은 인구통계정보에서부터 차이점을 보였으며, 연관규칙 역시 다르게 나타났다. 또한, FMP 333 그룹만이 진정 외식 소비의 상위값 그룹인지에 대한 고찰을 해보았는데, 외식 결제 빈도(F)와 외식 결제 총액(M)이 똑같이 많더라도 전체 신용카드 지출 중 외식부분의 결제 비율(P)이 다른 331, 332 그룹 역시 외식 종사자들이 눈여겨 봐야하는 가치 있는 그룹임을 밝혔다.
이후, Sparse K-평균 군집 분석을 활용하여 4개의 군집으로 분류하였는데, Sparse K-평균 군집분석은 클러스터 내의 유사도 및 클러터 간의 차이 극대화를 동시에 추구하는 알고리즘이다. 따라서 복잡한 구조의 데이터 군집화에서 클러스트들을 보다 선명하게 구분지어 더 정확한 분류를 가능하게 하는 장점이 있다. 4개 군집은 각각 외식결제 헤비유저형(heavy user), 미디움유저형(medium user), 라이트유저형(light user), 레어유저형(rare user)로 명명하였으며, 전체평균과 비교하여 FMP값이 높은 그룹, 비슷한 그룹, 낮은 그룹, 아주 낮은 그룹으로 분류되었다. 이들은 각기 다른 속성의 인구통계 정보와 연관규칙을 보였다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)