텍스트마이닝 기법을 활용한 레스토랑 고객의 감성분석에 관한 연구 : 외래관광객의 온라인 리뷰 빅데이터 중심으로
저자
발행사항
서울 : 경희대학교 대학원, 2021
학위논문사항
학위논문(박사)-- 경희대학교 대학원 : 조리외식경영학과 2021. 2
발행연도
2021
작성언어
한국어
주제어
DDC
641.7 판사항(22)
발행국(도시)
서울
기타서명
A Study on Sentiment Analysis of Restaurant Customers Using Text-Mining methods : Focused on the Big Data of On-line Reviews of Tourists
형태사항
x, 170 p. : 천연색삽화 ; 26 cm
일반주기명
경희대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 최규완
참고문헌: p. 154-166
UCI식별코드
I804:11006-200000365462
소장기관
Along with an advent of the 4th industrial revolution, paradigms in various domestic industries have changed, where in the field of ‘hospitality’ is experiencing diverse changes based on digital technologies comprising big data and artificial intelligence etc. In particular, consumers are writing and sharing their experiences of services they had received real-time in accordance with increasing access to internet via the popularization of smartphones by which the data thereof are increasing explosively. Such a vast amount of review data can play the important role over entire domain of consumers’ decision making, as well as the roles of delivery of information and recommenders wherein the positive reviews on services they had experienced increase the loyalty of consumers. In addition, the review data reflect diverse kinds of consumers’ emotions frankly expressed thus they can be exploited as resources to measure and improve consumers’ service experiences.
A survey employing questionnaire is widely used to measure customers’ experiences through which diverse kinds of questions can be used for quantification of consumers’ experiences however it has disadvantages of measurement errors dependent on limitations of sampling and errors in memory of past experiences of respondents, terminologies in questions, and length of questions etc. On the contrary, the analysis using text mining techniques has an advantage of identifying psychological aspects of respondents realized by the broad collection of all written opinions in categories freely set by consumers which was difficult to identify through conducting quantitative studies despite disadvantages of selecting appropriate respondents and difficulty in measurement according to intended designs of the analysis.
The present study intends to read the emotional factors of satisfaction and dissatisfaction of foreign tourists by using the left on-line reviews of restaurants, and to verify the presence of positive effects of sentiment polarity values of selection attributes upon overall level of customers’ satisfaction and differences in types of restaurants. To conduct the study, the data of on-line reviews on hotels and restaurants of customers were collected from the Review Community (TripAdvisor). The crawler was prepared by using Python to collect the data from corresponding community by which the profile information of customers, reviews written in English, and comprehensive scores thereof were collected. And then, the text mining techniques were exploited for the analysis of each text. The natural language processing technique was used to quantify the text data, and the frequency analysis on keywords per each type of restaurants was carried out.
And then, the topic modeling technique was used to distinguish each sentence in reviews in terms of selection attributes of the foods, price, service, and atmosphere, and then the distinguished sentences were put into the sentiment analysis to determine the factors of satisfaction or dissatisfaction of tourists. Finally, the test of hypotheses was carried out by using techniques of statistical analysis on the effectual relationship between differences in sentiment polarity at each type of restaurants and degree of satisfaction of customers.
The results obtained from the present study are summarized as in the following.
First, the factors of satisfaction and dissatisfaction per each type of restaurants were compared to each other through conducting sentiment analysis on the on-line reviews left by tourists. Common terms used to express dissatisfaction of tourists comprised time, staff, wait, late, forget, missing, and wrong etc. The terms imply the degree of hospitality of employees in restaurants and management of waiting time of customers in restaurants could influence greatly on the degree of dissatisfaction of customers. In respect of each type of restaurants, the terms comprising expensive, quality, course, table, reservation, credit, card, glass, plate, table, lobby, cat, and taxi etc. appeared in fine dining restaurants, whereas the terms such as English, speak, language, queue, and busy etc. appeared in casual dining restaurants. The terms such as line, quick, fast, seating, parking, wrap, and dirty were frequently used in describing the quick and self-service restaurants. This suggests the factors of dissatisfaction vary according to each type of restaurants.
Second, the demographic characteristics of customers were compared by using the results of sentiment analysis. Contrary to customers visiting restaurants who left many reviews on respective services and foods, the reviews on prices appeared relatively few, wherein the difference in scores of emotion on selection attributes between sex and age of customers appeared insignificant. Besides, the ratio of dissatisfaction on price and service appeared higher than that of foods and atmosphere of restaurants from the analysis of customers divided into groups of the satisfaction (positive) and dissatisfaction (negative) of selection attributes. This suggests the service of restaurants requires continuous awareness and management in that the failure in providing pertinent service could lead to the dissatisfaction of customers.
Third, the differences in values of sentiment polarity of selection attributes per each type of restaurants were compared. The value of sentiment polarity of selection attributes of foods, service, and atmosphere of fine dining restaurant appeared highest, whereas the highest value of sentiment polarity of selection attribute of price appeared in the quick and self-service restaurant. In respect of the appraisal of tourists on the high-class fine dining restaurants, they appeared satisfactory on foods, service, and atmosphere therein while they exhibited dissatisfaction on prices of restaurants.
Fourth, the ANOVA tests per each type of restaurants were carried out to determine the presence of significant differences in values of sentiment polarity of selection attributes. The results revealed the presence of significant differences of all selection attributes per each type of restaurants.
Fifth, the effect of sentiment polarity of selection attributes per each type of restaurants upon degree of satisfaction of customers was examined. Values of sentiment polarity of foods, price, service, and atmosphere of restaurants upon customers’ satisfaction were verified by conducting the Tobit regression analysis. The values of sentiment polarity of food, price, and service appeared with significant effect on customer’s satisfaction, whereas the effect of the value of sentiment polarity of atmosphere of restaurants appeared insignificant. This was concluded the preference to foods, price, and service than atmosphere of restaurants of practical tourists affected relatively more on the degrees of satisfaction.
In the present study, the factors of satisfaction and dissatisfaction of tourists reflected in on-line reviews were analyzed and compared to each other by using the sentiment analysis of selection attributes per each type of restaurants based on the topic modeling technique, by which the study demonstrated the quantification of customers’ experiences was enabled through the information of text. Together with ordinary approaches that measured customers’ experiences by exploiting conventional surveys employing respective questionnaires, the study approach to text review also demonstrated that it could bring significant research results.
Keywords
selection attribute of restaurant, on-line review, big data, text mining, natural language processing, topic modeling, sentiment analysis
4차산업혁명이 도래하면서 국내 다양한 산업들의 패러다임이 변화하고 있고, Hospitality 분야에서도 빅데이터, 인공지능 등 디지털 기술을 기반으로 다양한 변화가 생기고 있다. 특히 스마트폰의 대중화 및 인터넷 접근성의 증가와 함께 소비자들은 서비스 경험을 실시간으로 온라인상 작성 및 공유하고 있고, 그 데이터의 양이 폭발적으로 증가하고 있다. 이러한 방대한 리뷰 데이터는 소비자 의사결정 전 영역에 걸쳐 중요한 영향력을 행사하고 있고, 정보 전달자와 추천인의 역할을 하는 한편, 긍정적으로 작성된 리뷰는 소비자의 충성도를 높이는 역할을 하고 있다. 또한 리뷰 데이터는 고객의 솔직하고 다양한 감성을 담고 있어 고객 서비스 경험을 측정하고 개선하는 소중한 자원으로 활용될 수 있다.
고객 경험을 측정하기 위해 설문조사 방식을 많이 활용하고 있는데, 설문방식의 경우 연구목적에 따라 다양한 설문을 통해 계량화 할 수 있다는 장점이 있으나, 샘플링의 한계와 응답자가 설문에 응답하면서 과거 기억의 오류 및 설문 용어ㆍ길이에 따라 측정 오류가 발생할 수 있다는 단점이 있다. 반면에 텍스트마이닝을 통한 분석은 사전에 연구자가 원하는 목적대로 설계하여 응답자 선정 후 측정하기 힘들다는 단점이 있으나, 고객이 자유롭게 작성한 모든 범주의 의견을 폭넓게 수집하여, 양적 연구에서 포착하기 힘들었던 심리적인 부분까지 밝힐 수 있다는 장점이 있다.
본 연구의 목적은 외래관광객이 남긴 온라인 레스토랑 리뷰를 활용하여 만족과 불만족 감정요인을 읽어내고, 선택속성별 감성극성값이 레스토랑 유형별로 차이가 있는지, 전체 고객만족에 긍정적인 영향을 미치는지 검증하고자 한다. 연구 주제를 해결하기 위해 호텔ㆍ레스토랑 리뷰 커뮤니티(TripAdvisor)에서 온라인 리뷰데이터를 수집하였다. 해당 커뮤니티에서 데이터를 수집하기 위해 Python을 활용하여 크롤러를 제작 후 고객 프로필 정보, 영문텍스트 리뷰, 종합평점 정보를 수집하였다. 그리고 텍스트를 분석하기 위하여 텍스트 마이닝 기법을 활용하였다. 텍스트 데이터를 계량화하기 위하여 자연어 처리(NLP) 기법을 사용하였고, 레스토랑 유형별 핵심 키워드 빈도분석을 실시하였다. 다음으로 리뷰별 문장을 음식ㆍ가격ㆍ서비스ㆍ분위기 선택속성별로 구분하기 위하여 토픽모델링 기법을 활용하였고, 이렇게 분류된 문장을 감성분석을 실시하여 외래관광객의 만족ㆍ불만족 요인을 심층 분석하였다. 마지막으로 레스토랑 유형별 감성극성값의 차이 및 고객만족에 미치는 영향관계에 관해 통계 분석을 통한 가설 검증을 실시하였다.
연구결과를 정리하면 다음과 같다.
첫째, 외래관광객이 남긴 온라인 리뷰에 대하여 감성분석을 통하여 레스토랑 유형별로 만족요인과 불만족요인을 비교하였다. 레스토랑 공통 불만족 용어로 사용된 것은 time, staff, wait, late, forget, missing, wrong 등이다. 즉, 레스토랑 대기시간 관리와 종업원의 친절도가 고객 불만족에 큰 영향을 줄 수 있음을 나타낸다. 레스토랑 유형별로 보면 파인다이닝 불만족 용어로는 expensive, quality, course, table, reservation, credit, card, glass, plate, table, lobby, cat, taxi 등이 나타났고, 캐주얼다이닝의 경우는 english, speak, language, queue, busy 등이 나타났으며, 퀵ㆍ셀프서비스 레스토랑의 경우 line, quick, fast, seating, parking, wrap, dirty 등이 자주 사용되었다. 즉, 레스토랑 유형별로 주로 사용되는 불만족 요인 키워드가 차이가 있음을 알 수 있다.
둘째, 감성분석 결과를 활용하여 인구통계적 특성을 비교하였다. 레스토랑 방문 고객은 음식과 서비스에 대하여 많은 리뷰를 작성하는 반면 가격에 대해서는 그렇지 않은 것으로 나타났고, 선택속성별 감성점수는 성별과 연령에 따른 차이는 크지 않은 것으로 나타났다. 또한 선택속성별 만족(긍정) 그룹과 불만족(부정) 그룹으로 구분하여 불만족 그룹의 특성을 파악해 본 결과 가격과 서비스가 음식과 분위기에 비해 불만족 비율이 높은 것을 알 수 있다. 즉, 서비스 실패는 쉽게 불만족으로 연결될 수 있다는 점에서 지속 관리가 필요한 요소임을 알 수 있다.
셋째, 레스토랑 유형별로 선택속성별 감성극성값의 차이를 비교하였다. 음식, 서비스, 분위기 선택속성 감성극성값은 파인다이닝 레스토랑이 제일 높았고, 가격선택속성 감성극성값은 퀵ㆍ셀프서비스 레스토랑이 제일 높았다. 외래관광객이 고급 파인다이닝 레스토랑에 대한 평가시 음식, 서비스, 분위기는 대체적으로 만족하지만 비싼 가격으로 인해 가격에 대해서는 만족도가 낮은 것을 알 수 있다.
넷째, 레스토랑 유형별로 선택속성 감성극성값이 유의한 차이가 있는지 검증하기 위해 레스토랑 유형별 분산분석(ANOVA)을 실시하였다. 그 결과 레스토랑 유형별로 모든 선택속성이 유의한 차이를 보였다.
다섯째, 레스토랑 선택속성별 감성극성값이 고객만족에 영향을 미치는지 살펴보았다. 음식ㆍ가격ㆍ서비스ㆍ분위기 감성극성값이 고객만족에 영향을 미치는지 검증하기 위해 토빗-회귀분석을 실시하였다. 음식ㆍ가격ㆍ서비스 감성극성값은 고객만족도에 유의하게 영향을 미치는 것으로 나타났고, 분위기 감성극성값은 유의하지 않게 나타났다. 이는 실리를 중시여기는 외래관광객의 특성상 상대적으로 분위기 보다는 음식, 가격, 서비스 속성이 만족에 더 큰 영향을 미치기 때문으로 볼 수 있다.
본 연구는 토픽모델링에 기반한 선택속성별 감성분석을 활용하여 온라인 리뷰에 담긴 속성별 고객의 만족 및 불만족 요인을 심층적으로 분석하였고, 레스토랑 유형에 따라 비교한 연구로서, 텍스트 정보를 통해 고객의 경험을 계량화하여 파악할 수 있다는 것을 보여주었다. 기존 설문 조사를 통해 고객 경험을 측정하던 일반론적인 접근방식과 더불어 텍스트 리뷰를 통한 연구방식 또한 유의미한 결과를 가져올 수 있음을 보여주었다.
핵심어 : 레스토랑 선택속성, 온라인 리뷰, 빅데이터, 텍스트마이닝,
자연어 처리, 토픽모델링, 감성분석
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)