심혈관 질환 예방을 위한 심층 신경망 기반 헬스 빅데이터 처리 기법 = Health big data processing method based on deep neural network for preventing cardiovascular disease
저자
발행사항
원주 : 상지대학교, 2019
학위논문사항
학위논문(박사) -- 상지대학교 일반대학원 컴퓨터정보공학과 정보통신공학전공 2019.8
발행연도
2019
작성언어
한국어
주제어
KDC
567 판사항(6)
발행국(도시)
강원특별자치도
형태사항
viii, 115장 : 삽화, 도표 ; 26cm
일반주기명
상지대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 홍유식
국문초록: 장 vi-viii
Abstract: 장 112-115
참고문헌: 103-111
UCI식별코드
I804:42007-200000215501
소장기관
In modern society, the aging population is rapidly increasing, is rapidly aging, thus the need for personal health and preventive management of chronic diseases, and the demand for customized information to sustain much healthier life are increasing also. Especially, the chronic diseases, such as the heart disease and the diabetes, are increasing in all age groups, so it is necessary to control such chronic diseases continuously using a healthcare system.
In order for the healthcare system to continuously control the risk factors of the personal cardiovascular disease, it is required to establish the database based on the disease history and the basic dietary information in the fast period, and the database based on the pattern of the biometric activity in the current situation. The disease history and the dietary information can be acquired with a PHR(Personal Health Record), and the recent biometric data can be collected using IoT in a huge amount. The comprehensive analysis of the big data based on the health records can provide the basis for the real-time determination of the risk factors for the personal cardiovascular disease.
The data mining system for processing the health big data has been remarkably progressed as it is developed to the intelligent system. However, for ensuring that the intelligence system is implemented with an efficient operation, the artificial neural network system should be established basically, further the external elements including the artificial neural network including the data preprocessing, the association mining and the distributed computing process for operating the big data should be properly configured. Particularly, the tools and methods for the data preprocessing is critical to the accuracy and the response performance of the various data processing including the image analysis and the sound analysis of the intelligent system. The purpose of this paper is to implement a deep neural network model with more reality in which the data preprocessing may be more effectively conducted by the association mining and the cycle analysis from the personal health records, a kind of static health big data, and the biometric data, a kind of dynamic health big data, and the distributed computing system may be established by applying the edge computing model.
The PHR(Personal Health Record) is used as the static health big data. In order to analyze the association and the differentiation between the general popular group and the disease group using the PHR basic data, it is necessary to select the items having the significant association, further, for this, the multivariate analysis algorithm is required. For applying the algorithm, the PHR related to the same type of the health behavior and the dietary habits is collected from the patients focusing on the selected items. In addition, for analyzing the PHR similarity between the selected items and the patients, the Minkovsky distance generalized from the analytical geometry to the Euclidean geometry is applied. A risk group with a high degree of the similarity with the cardiovascular disease is created according to the proximity to the Minkovsky’s distance, and the risk factors for the cardiovascular disease are predicted by the similarity estimation between the risk group and the individual.
The biometric data, a kind of the dynamic health big data is collected based on the sensor data of the IoT devices as a big data scale, so the big data processing technology are required to acquire, analyze and integrate the sensor information related to the individual body and his/her environment. One of the typical basic data for analyzing and the estimating the big data processing technology is the heartbeat data, one of the time series biometric data. This is the most basic biometric data as for using the dynamic health data. Using the fast Fourier transformation as the preprocessing for the frequency analysis of the heartbeat rate, and reducing the data from the frequency ratio data of the power spectrum extracted, the most efficient model is established. The semantic interpretation of the preprocessed data is performed based on the Deep Neural Network which is useful for analyzing and estimating the feedback data among the neural network algorithms. The internal structure of the deep neural network algorithm includes the input layer, the hidden layer and the output layer, and the model between nodes is configured using the gradient descent. This model is useful for learning from the input data and for developing the approximate function which can be evolved. Using this, the risk situations may be informed to the individual. This paper further includes a health care model using the edge computing method for saving the processing costs and improving the response time.
In this paper, the performance of the proposed model is evaluated by using the data processing cost reduction ratio and MAE, F-measure statistics. As the comparative results, the PHR data reduction ratio of 1/33 is acquired by using the multivariate statistical method, the ECG data reduction ratio of 1/32 is established by using the fast Fourier transformation and the cumulative frequency ratio method. In addition, the F-measure result shows the accuracy of 83.83%, the response delay improvement of 59.95% is acquired by applying the edge computing model.
From the evaluation results, it is confirm that the combination of the edge computing model and the deep neural network is used as the technology for distributing and processing a big data computing tasks, and becomes the effective system for reducing the response delay time. The results of this study can be used as a base technology for implementing the smart health care system which provides more personalized and more applicable information with higher satisfaction and enhanced performance.
현대 사회는 급속한 고령화가 진행되고 있으며, 이에 따라 개인별 건강 및 만성질환 예방적 관리의 필요성과 건강한 삶을 지속하기 위한 맞춤형 정보 요구가 증가하고 있다. 특히, 대표적인 만성질환인 심장질환 및 당뇨병은 전 연령층에서 질환자가 증가하고 있으며, 지속적으로 헬스케어 시스템을 통한 관리가 필요하다.
헬스케어 시스템이 개인 심혈관 질환 위험 요소를 지속적으로 판단하기 위해서 과거시점의 병력과 식생활 기초 데이터가 필요하며, 현시점의 생체활동 패턴 데이터가 필요하다. 과거 병력과 식생활 패턴은 PHR (Personal Health Record)로 취득할 수 있으며, 최근의 생체활동 데이터는 IoT를 활용해 대량으로 취득할 수 있는 환경이 갖추어지고 있다. 이러한 각각의 헬스 빅데이터에 대한 종합적 분석은 개인의 심혈관 질환 위험요소를 실시간으로 판단할 수 있는 기반이 된다.
헬스 빅데이터를 처리하기 위해 데이터 마이닝 시스템은 지능형 시스템으로 확대되면서 눈부시게 발전하고 있다. 하지만 지능형 시스템의 현실적인 구현은 기본적인 신경망 시스템의 구현뿐만 아니라 데이터 전처리, 연관관계 분석 및 빅데이터 규모의 연산량을 소화하기 위한 분산처리 등 신경망 외부 요소가 올바르게 구성되어야 효율적인 처리가 가능하다. 특히 전처리의 내용과 방식은 지능 시스템의 이미지, 음향 분석 등 다양한 데이터 처리의 정확도와 응답성능에 결정적 요소이다. 본 논문은 정적 헬스 빅데이터인 개인건강기록과 동적 헬스 빅데이터인 생체 정보 데이터의 연관관계 분석과 주파수 분석을 통해 효율적으로 전처리하고, 에지 컴퓨팅 모델을 응용한 분산 시스템의 구현으로 보다 현실적인 심층 신경망 모델을 구현하도록 한다.
정적 헬스 빅데이터는 PHR 기초 데이터를 사용해 일반인 그룹과 심혈관환자 그룹의 연관성, 차별성을 분석하기 위해서는 유의관계가 있는 항목의 선별이 필요하며, 이를 위해 다변량 분석 알고리즘이 필요하다. 알고리즘의 적용을 위해 선별된 항목을 중심으로 사용자로부터 동일한 형태의 건강행태 및 식이습관에 관련된 PHR을 수집한다. 선별된 항목과 사용자별 PHR 유사도 분석을 위해 해석기하학에서 유클리드 기하학으로 일반화한 민코프스키 거리를 변형해 적용한다. 민코프스키 거리의 근접에 따라 심혈관 질환자와 높은 유사도를 가지는 위험그룹을 생성하고 그룹과 사용자 간 유사도를 통해 심혈관 질환 위험 요소를 평가한다.
동적 헬스 빅데이터인 생체 정보 데이터는 IoT 디바이스의 센서 데이터를 기반으로 빅데이터 규모의 방대한 자료가 수집되고 있으며, 이를 이용한 인체와 환경에 관련된 센서 정보의 획득, 분석, 통합을 위한 빅데이터 처리 기법이 필요하다. 기법의 분석과 평가를 위한 대표적인 기초데이터는 시계열 생체 정보인 심박동 데이터이다. 이는 동적 헬스 데이터로 사용하기에 가장 기본적인 생체 정보이다. 심박동 수치의 주파수 분석을 위한 전처리로 고속 푸리에 변환을 이용하며, 추출된 파워 스펙트럼의 주파수별 비율 데이터를 활용해 데이터를 축소하고 효율적인 모델을 구축한다. 전처리된 데이터의 의미 해석을 위해 신경망 알고리즘 중 피드백 데이터를 분석하고 평가하는데 유용한 심층 신경망 을 기반으로 한다. 심층 신경망 알고리즘의 내부 구성은 입력층, 은닉층, 출력층으로 설계하고, 경사하강법을 이용해 노드간의 모델을 구성한다. 이러한 모델은 입력 데이터를 학습하고, 진화하는 근사함수를 개발하는데 유용하게 사용되며, 이를 통해 사용자에게 위험 상황을 알려준다. 또한 논문에서는 연산비용 감소와 응답 시간의 성능 개선을 위해 에지 컴퓨팅 모델을 활용한 헬스케어 모델을 별도로 구성한다.
본 논문에서 제안하는 모델의 성능 평가를 위해 데이터 연산 비용 감소 비율과 MAE, F-measure를 사용해 평가한다. 비교 결과 다변량 분석을 통해 1/33로 PHR 데이터를 축소하였으며, 고속 푸리에 변환과 누적 빈도 비율방식의 사용으로 1/32로 ECG 데이터 감소가 이루어졌다. 또한 F-measure의 결과 83.83%의 정확도를 나타냄을 확인하였으며, 에지 컴퓨팅 모델을 적용해 59.95%의 응답 지연 개선을 이루었다.
평가 결과를 통해 에지 컴퓨팅 모델과 심층 신경망 기술의 결합은 빅데이터 규모의 컴퓨팅 작업을 분산해 처리할 수 있는 기법으로 사용될 수 있으며, 응답 지연시간을 감소시키는 효과적인 체계임을 확인하였다. 이러한 연구결과는 보다 개인화되고 융통성 있는 결과를 생성하면서도 현실화된 성능으로 만족도가 높고 효과적인 스마트 헬스케어를 구성할 수 있는 기반 기술로 활용할 수 있다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)