BERT의 지식 전이학습 모형을 이용한 비즈니스 모델 캔버스(BMC) 자연어 분석 연구
저자
발행사항
서울 : 경희대학교 대학원, 2021
학위논문사항
학위논문(박사)-- 경희대학교 대학원 : 경영학과 2021. 8
발행연도
2021
작성언어
한국어
주제어
DDC
650 판사항(22)
발행국(도시)
서울
기타서명
Text Analysis of Business Model Canvas Using BERT's Knowledge Transfer Learning
형태사항
xiv, 120 p. : 삽화, 도표 ; 26 cm
일반주기명
경희대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 김재경
참고문헌: p. 98-106
UCI식별코드
I804:11006-200000500601
소장기관
BERT의 지식 전이학습 모형을 이용한 비즈니스 모델 캔버스(BMC) 자연어 분석 연구
비즈니스 모델(Business Model)은 기업이 비즈니스를 어떻게 수행할 것인가에 대한 설계도이며 고객에게 제품과 서비스를 제공하여 수익을 창출하는 일련의 과정을 설명하는 것이다. 그러나 비즈니스 모델의 중요성에도 불구하고 고객이 원하는 제품을 파악하지 못해 시장 진입에 실패하는 경우가 50% 가까이 발생하고 있다. 비즈니스 모델이 부족하다는 것은 기업의 생존에 필요한 수익을 기대하기 어렵고 성장에 한계가 있다는 의미이다. 이와 같은 실패 요인은 비즈니스 모델이 중요한데도 불구하고 스타트업 기업을 비롯하여 국내 기업의 99%가 50인 미만의 중소기업이기 때문에 제대로 된 비즈니스 모델을 수립하는 데 한계가 있다. 즉, 기업의 비즈니스 모델을 정확하게 수립하고 평가할 수 있다면 중소기업이나 스타트업 기업의 비즈니스 성공 확률은 상승할 것으로 기대된다. 비즈니스 모델을 수립하고 평가하기 위해 접근할 수 있는 툴이 있으면 대다수의 중소기업에 도움이 될 것이다.
비즈니스 모델 캔버스(BMC, Business Model Canvas)는 고객 세그먼트, 가치제안, 채널, 고객관계, 수익원, 핵심자원, 핵심활동, 핵심파트너, 비용구조를 9개 블록으로 나누어 한 장의 캔버스에 요약한 모델이다. 비즈니스 모델 캔버스는 기업이 목표로 하는 고객에게 기업의 핵심역량을 통해 만든 핵심가치를 어떻게 전달하여 수익을 창출하는지를 직관적으로 파악할 수 있도록 비즈니스 모델을 작성할 수 있는 편리한 도구이다. 비즈니스 모델 캔버스는 기업이 어떻게 고객가치를 만들고, 전파하는지, 그리고 이로 인해 어떻게 수익을 창출하는지에 대한 원리를 이해하고 유용하게 사용할 수 있는 도구이다.
본 연구에서는 BERT(Bidirectional Encoder Representations from Transformers) 모델을 활용하여 지식 전이학습을 통한 비정형데이터인 비즈니스 모델 캔버스를 객관적으로 평가하는 모델을 개발하였다. BERT 모델을 이용하여 건설제조업과 IT기업의 비즈니스 모델 캔버스로부터 자동으로 비즈니스 모델을 추출한 후, 이를 비즈니스 모델 평가에 직접 활용하는 평가모델을 제안하고, 이에 대한 성능을 검증하였다. 이를 위해 506개 건설제조업과 542개 IT기업의 비즈니스 모델 캔버스 데이터를 수집하였다. 분석에는 트랜스포머(Transformer) 기반 딥러닝 NLP(Natural Language Processing) 중 대표적인 BERT 모델을 사용하였다. BERT는 사전학습(pre-training) 과정을 거쳐서 컴퓨터에 대용량의 언어를 이해시켰다. 이후에 지식 전이과정을 통해서 사용 목적에 맞게 분야별 언어를 집중적으로 학습하는 파인튜닝(fine-tuning)을 실시하였고, 건설제조업과 IT기업의 BMC 모델을 이해할 수 있게 학습시켰다. SKT-Brain에서 사전학습 시킨 한국어 BERT 모델을 기반으로 비즈니스 모델 캔버스의 구성요소에 대한 평가를 분류하기 위해 전이학습(Transfer Learning)을 통해 파인튜닝을 실행하였다.
본 연구는 비정형 데이터 비즈니스 모델 캔버스의 자연어 분석을 통해 비즈니스 모델 지수를 예측하는 것이다. 분석절차는 한국어 위키사전과 한국어 뉴스로 사전학습을 한 KoBERT에 비즈니스 모델 캔버스 비정형 데이터를 학습시켜 비즈니스 모델 지수를 예측하였다. 하이퍼 파라미터 파인 튜닝은 AdamWoptimizer를 사용하였고, 학습은 총 50 epoch, minibatch 사이즈는 32, 드롭아웃은 0.1, 학습률 2e-5, L2정규화 계수는 5e-5, weight decay를 L2 정규화로 0.01, 모델 구현과 실행은 python 3.7 pytorch 1.8.0 CUDA11.1를 사용하였다. 예측 모델 평가는 9개의 비즈니스 모델 캔버스의 구성요소를 독립적인 요소로 보고, Hold-Out 검증을 통해 train data와 test data를 7대3으로 구분하여 랜덤하게 진행하였다. 모델평가는 오분류표를 이용하여 정확도를 계산하였고, 교차 엔트로피를 이용하여 로스(loss)계산을 하였다. 비즈니스 모델 캔버스 9개 구성요소의 5라벨 평균 정확도는 건설제조업이 0.606이고 IT기업은 0.508이다. 근접 라벨의 평균 정확도는 건설제조업과 IT기업 모두 0.933이다.
본 연구의 학문적 의의는 기업 혁신이나 사업계획서를 바탕으로 하는 비정형데이터인 비즈니스 모델 캔버스 데이터를 KoBERT 모델을 사용하여, 기업의 비즈니스 모델 평가에 대한 예측 모델을 최초로 개발하여 연구하였다는 것이다. 이는 비즈니스 모델을 평가하고 이를 바탕으로 기업이 목표로 하는 경영 혁신을 이룰 수 있는 계기가 될 것으로 기대한다. 실무적 의의는 비즈니스 모델 캔버스 데이터의 비정형 텍스트 데이터를 이용하여, 자연어 처리 딥러닝 모델을 기반으로 산업 현장에 적용할 수 있는 평가 모델을 개발함으로써 실무적으로 유용하게 이용될 수 있을 것으로 예상된다. 또한, 제안된 모델의 응용으로 비즈니스 모델 자기 진단시스템을 제안하였다. 비즈니스 모델 자기 진단시스템을 이용하면 기업은 전문가의 도움 없이 비즈니스 모델 분석을 하고 개선 사항을 파악할 수 있을 것으로 기대된다. 비즈니스 모델 9개 블록 요인에 대한 점수를 도출하여 선도업체나 동종업종과 비교하여 자사의 강점과 보완 사항을 파악하고 미래 전략을 수립하는 데 기여하도록 하였다.
본 연구의 한계점 및 향후 연구는 다음과 같다. 비즈니스 모델 캔버스의 9개 요소가 개별 기업의 노하우가 담긴 내용이 많고, 회사 내부 정보에 대한 데이터이기 때문에 폭넓은 산업을 대상으로 하지 못하고 건설제조업과 IT기업만을 대상으로 데이터를 수집하여 연구한 점이다. 향후 건설제조업과 IT기업 이외의 타 산업의 비즈니스 모델 구성요소에 대한 데이터를 수집하여 예측 정확도의 차이가 비즈니스 모델 구성요소의 요인별 특성인지 산업 도메인 차이 인지를 비교하는 연구가 필요하다.
본 연구를 바탕으로 BERT기반 BMC모델을 활용하여 사업계획서, 인사평가, 제안서 분석, 중장기 전략 등 회사 경영에 전반적으로 적용한다면 맨파워가 부족한 많은 중소기업이나 스타트업 기업에게 큰 도움이 될 것으로 기대된다.
주제어: 비즈니스 모델, 비즈니스 모델 캔버스, BERT, 전이학습, 자연어 분석, 딥러닝, 텍스트 마이닝
Text Analysis of Business Model Canvas Using BERT's Knowledge Transfer Learning
A business model is a blueprint for how a company will conduct business and describes a series of processes that generate revenue by providing products and services to customers. However, despite the importance of the business model, nearly 50% of the cases fail to enter the market because they do not understand the product they want. The lack of a business model means that it is difficult to expect the profits necessary for the survival of a company and there is a limit to growth. Despite the importance of the business model, there is a limit to establishing a proper business model because 99% of domestic companies, including start-ups, are small and medium-sized enterprises (SMEs) with fewer than 50 employees. In other words, if a company's business model can be accurately established and evaluated, the probability of business success of SMEs or start-ups is expected to increase. Most small businesses will benefit from having tools they can access to build and evaluate their business models.
Business Model Canvas(BMC) is a model that summarizes Customer Segments, Value Propositions, Channels, Customer Relationships, Revenue Streams, Key Resources, Key Activities, Key Partners, Cost Structure and cost structure into 9 blocks on one canvas. The business model canvas is a convenient tool that allows you to intuitively understand how to generate profits by delivering core values to customers based on the company's core competencies to target customers. The business model canvas is a tool that can be useful and understand the principles of how a company creates, disseminates, and monetizes customer value.
In this study, using the BERT (Bidirectional Encoder Representations from Transformers) model, a model was developed to objectively evaluate the business model canvas, which is unstructured data through knowledge transfer learning. After automatically extracting a business model from the business model canvas of the construction manufacturing industry and IT company using the BERT model, an evaluation model that directly uses it for business model evaluation was proposed and its performance was verified. For this purpose, business model canvas data of 506 construction and manufacturing industries and 542 IT companies were collected. For the analysis, a representative BERT model among Transformer-based deep learning NLP (Natural Language Processing) was used. BERT made the computer understand a large amount of language through a pre-training process. After that, fine-tuning was conducted to intensively learn languages for each field according to the purpose of use through the knowledge transfer process, and the BMC model of the construction manufacturing industry and IT companies was learned to be understood. Fine tuning was performed through transfer learning to classify the evaluation of the components of the business model canvas based on the Korean BERT model trained in advance by SKT-Brain.
This study predicts the business model index through natural language analysis of the unstructured data business model canvas. As for the analysis procedure, the business model index was predicted by learning the business model canvas unstructured data in KoBERT, which was previously studied with Korean wiki dictionary and Korean news. For hyperparameter fine tuning, AdamWoptimizer was used, training was performed for a total of 50 epochs, minibatch size was 32, dropout was 0.1, learning rate was 2e-5, L2 regularization coefficient was 5e-5, weight decay was 0.01 for L2 regularization, model implementation and Execution was performed using python 3.7 pytorch 1.8.0 CUDA11.1. For the prediction model evaluation, the 9 business model canvas components were regarded as independent elements, and train data and test data were divided 7 to 3 through hold-out verification and randomly performed. For model evaluation, accuracy was calculated using a misclassification table, and loss was calculated using cross entropy. The average accuracy of the 5 labels of the 9 components of the business model canvas is 0.606 for the construction and manufacturing industry and 0.508 for the IT company. The average accuracy of proximity label is 0.933 for both construction manufacturing and IT companies.
The academic significance of this study is that the business model canvas data, which is unstructured data based on corporate innovation or business plan, was used for the first time to develop and study a predictive model for corporate business model evaluation using the KoBERT model. It is expected that this will serve as an opportunity to evaluate the business model and achieve the management innovation targeted by the company based on it. The practical significance is expected to be practically useful by developing an evaluation model that can be applied to industrial sites based on a natural language processing deep learning model using the unstructured text data of the business model canvas data. In addition, a business model self-diagnosis system was proposed as an application of the proposed model. By using the business model self-diagnosis system, companies are expected to be able to analyze business models and identify improvements without the help of experts. By deriving scores for the 9 business model block factors, we compared them with leading companies or the same industry to identify their strengths and complements and contribute to establishing future strategies.
The limitations of this study and future research are as follows. Because the 9 elements of the business model canvas contain a lot of the know-how of individual companies and are data about company internal information, it is not possible to target a wide range of industries, but only the construction manufacturing industry and IT companies. In the future, it is necessary to collect data on business model components of industries other than the construction manufacturing industry and IT companies to compare whether the difference in prediction accuracy is a characteristic of each factor of the business model component or a difference in the industry domain.
Based on this study, if the BERT-based BMC model is applied to overall company management such as business plans, personnel evaluation, proposal analysis, and mid- to long-term strategies, it is expected that it will be of great help to many SMEs and startups lacking manpower.
Key words: Business Model, Business Model Canvas, BERT, Transfer Learning, Natural Language Analysis, Deep Learning, Text Mining
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)