빅데이터 기반의 사이버위험 측정 방법 및 사이버사고 예측모형 연구 = Developing Cyber Risk Assessment Framework for Cyber Insurance: A Big Data Approach
저자
발행기관
학술지명
권호사항
발행연도
2018
작성언어
-주제어
자료형태
학술저널
수록면
1-80(80쪽)
제공처
Ⅰ. 서론
■ 최근 증가되고 있는 사이버위험 요소에 대한 관리 방안이 필요함
○기술적, 정책적 해결 방안들이 지속적으로 개발되고 있음
○동시에 사이버보험을 통한 사이버위험 관리에 대한 수요가 증가함
○하지만 사이버보험 관련 데이터 및 표준의 부재가 사이버보험 시장 확대의 방해 요소로 작용함
○본 연구에서는 빅데이터 기반의 사이버위험 측정체계 및 사이버사고 예측모델을 개발하고자 함
Ⅱ. 사이버위험 및 사이버보험 현황
1. 사이버위험 및 인식 현황조사
■ 사이버공격으로 인한 사이버위험은 지속적으로 증가하고 있는 추세임
○사이버위험은 정보통신시스템 사용에 방해되는 모든 요소를 의미하는데, 발생 원인은 단순실수나 해커의 의도된 공격 등으로 다양함
○정보유출과 같은 사이버공격의 피해가 최근 12년간 10배 이상 증가하였고, 사이버공격은 정보통신이 발달한 나라에 집중되고 있음
○정보통신시스템은 여러 시스템이 서로 유기적으로 연결되어 동작하는데, 이 때문에 사이버위험은 상호복합성(Interdependency) 및 높은 불확실성 때문에 모델링이 어려움
■ 지속되는 사이버공격으로 인해, 기업들의 사이버위험에 대한 인식 또한 증가하고 있음
○미국 상장사의 연간보고서에 기재된 위험요소(Risk Factor) 정보를 수집하여 텍스트 마이닝한 결과, 사이버위험에 대한 언급량이 최근 12년간 3배 이상 증가한 것으로 확인됨
2. 사이버보험 및 인식 현황조사
■ 사이버보험 시장은 미국 등 일부 국가들 중심으로 시작됨
○보험료 기준으로 미국이 전세계 시장의 90%를 차지함
○전세계 보험료 추정액은 선형적으로 증가하고 있음
○현재 보험상품들은 다양한 사이버위험에 대하여 보장함
○해킹에 의한 보험 청구 건이 가장 많이 발생함
■ 기업들의 사이버보험 구매의향이 증가하고 있음
○구매의향 비율이 2011년 24%에서 2015년 64%로 크게 증가함
○수요자 측면에서는 보험상품의 복잡성이 비구매 사유로 거론됨
○공급자 측면에서는 잠재 피보험자의 낮은 사이버보안 수준이 가입거부 사유로 거론됨
Ⅲ. 사이버위험 측정체계 개발
1. 사이버위험 관련 개념 및 데이터 종류
■ 사이버위험을 발생시키는 다양한 사이버공격에 대한 데이터가 존재함
○사이버공격의 종류는 스팸이메일, 피싱공격 등이 있음
○이러한 사이버공격은 악성코드나 바이러스에 감염된 컴퓨터들의 네트워크 봇넷(Botnet)을 통해 수행됨
○실제 공격자의 신원을 파악하는 것은 매우 어려움
2. 사이버위험 빅데이터 수집 및 처리 시스템
■ 스팸이메일, 피싱사이트 데이터를 통하여 사이버위험 측정이 가능함
○스팸이메일은 CBL, PSBL에서, 피싱사이트 데이터는 APWG, 오픈피시를 통하여 수집함
○클라우드 기반의 데이터 수집 및 처리 시스템을 개발함
○IP 주소별로 구성되어있는 사이버공격 데이터를 기관별로 정리하기 위한 3단계 매핑이 필요함
○APNIC 데이터를 기준으로 인터넷 주소를 할당받은 한국 기관 정보를 수집하고, 도메인주소 정보를 이용하여 산업군별로 분류함
○한국 기관들의 사이버위험 지수를 측정할 결과, 대학기관, 교육기관, 인터넷 망 사업자들의 사이버위험 지수가 높은 것으로 나타남
3. 사이버위험 공시의 효과 측정 실험
■ 제시된 사이버위험 지수의 효용성을 검증하기 위하여 필드실험을 실시함
○중국어권 6개국의 1262개 기관을 대상으로 필드실험을 실시함
○통계적으로 동일한 제어군과 실험군으로 구분하여, 실험군의 기관들에게 이메일 및 웹사이트를 통하여 위험 측정결과를 고지, 공시함
○사이버위험 자료공시 이후, 실험군 기관들의 스팸이메일 발생량이 통계적으로 유의미한 수준으로 감소함을 확인함
○제시된 사이버위험 평가자료를 적극적으로 확인한 기관일수록, 높은 수준의 감소량이 측정됨
Ⅳ. 사이버사고 예측모델 개발
1. 기계학습 개념 및 예측 문제 정의
■ 사이버사고 예측문제는 감독기계학습(Supervised Machine Learning) 중 분류문제에 해당됨
○빅데이터 수집, 강력해진 계산능력 등 여러 요소들로 인하여 기계학습 기반의 예측이 정확해지고 있음
○예측모형을 만들기 위해 데이터유출사고 데이터를 사용하는데, 예측변수가 이산변수이므로, 분류(Classification) 알고리즘을 적용함
2. 데이터 수집
■ 기 발생된 사이버사고 데이터 및 사이버위험 지수 데이터를 통합하여 학습데이터(Training Data)를 구축하였음
○사이버사고 중 대표적인 종류인 정보유출사고 데이터를 수집함
○사이버위험 지수를 바탕으로 기관별 특징변수들을 추출함. 특히 CBL상의 봇넷 정보를 이용함
○기관명과 스트링매칭 알고리즘을 이용하여 사이버사고 데이터와 사이버위험 데이터를 통합함
3. 예측 알고리즘 및 모델 평가
■ 전통적인 기계학습 및 딥러닝 알고리즘을 통합데이터에 적용함
○전통적인 기계학습 알고리즘 중 KNN, Logistic Regression, Decision Tree, Random Forest를 적용함
○딥러닝 알고리즘 중 피드포워드 신경망을 적용함
■ 최대 94%의 확률로 정보유출사고 여부를 예측할 수 있음
○10-fold 교차검증을 통하여 여러 알고리즘들을 평가함
○데이터 불균형 문제를 해결하기 위해 Precision, Recall, F1 score 기준으로 예측 정확성을 측정함
As our society is heavily depending on the information and communication technology, the associated risk has also significantly increased. Cyber insurance has been emerged as a possible means to better manage such cyber risk. However, cyber insurance market is still in a premature stage due to the lack of data sharing and standards on cyber risk and cyber insurance. To address this issue, this research proposes a data-driven framework to assess cyber risk using externally observable cyber attack data sources such as outbound spam and phishing websites. We show that the feasilibility of such approach by building cyber risk assessment reports for Korean organizations. Then, by conducting a large-scale randomized field experiment, we measure the causal effect of cyber risk disclosure on organizational security levels. Finally, we develop machine-learning models to predict data breach incidents, as a case of cyber incidents, using the developed cyber risk assessment data. We believe that the propsed data-driven methods can be a stepping-stone to enable information transparency in cyber insurance market.
더보기분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)