KCI등재
데이터 일반화가 딥러닝 성능에 미치는 영향 연구 = A Study on the Effect of Data Generalization on Deep Learning Performance
저자
발행기관
학술지명
아시아태평양융합연구교류논문지(Asia-pacific Journal or Convergent Recearch Interchange)
권호사항
발행연도
2022
작성언어
Korean
주제어
등재정보
KCI등재
자료형태
학술저널
수록면
1-11(11쪽)
DOI식별코드
제공처
k-익명화는 해커들의 개인 정보 탈취를 예방하기 위해, 원래의 데이터를 변경하여 제삼자에게 배포하는 기술이다. 데이터 일반화는 원래의 데이터 값을 고수준의 값으로 대체하는 방법으로 k-익명화 기법에서 널리 사용되고 있다. 이 기법은 매우 효율적인 방법으로 증명되고 있지만, 일반화된 데이터를 딥러닝에 사용할 경우, 학습 성능이 저하되는 단점이 있다. 본 연구에서는 데이터 일반화에 의한 값 왜곡이 딥러닝 성능에 얼마나 영향을 주는지 알아보고자 하였다. 실험에서는 텐서플로우를 사용하여 딥러닝 모델을 구축하고 일반화되지 않은 데이터셋과 일반화된 데이터셋을 사용하여 구축된 모델을 학습시킨후, 각각에 대한 학습 성능을 측정하였다. 학습 데이터로는 2010년 1월 1일부터 2022년 6월까지 수집한 한국의 온도 데이터를 사용하였다. 실험을 위해, 데이터 일반화 기법을 적용하여 원래의 값을 고수준 값으로 변경하고 이를 실험 데이터로 사용하였다. 학습 성능 지표값으로는 평균제곱 오차(Root Mean Square Error, RMSE)를 사용하였다. 실험결과, 일반화 정도가 적을 경우, 0.90%의 성능 저하가, 일반화 정도가 중간일 경우, 3.15%의 성능 저하가, 일반화 정도가 심할 경우, 6.57%의 성능 저하가 발생하였다.
더보기k-anonymization is a technology that changes original data and distributes it to third parties to prevent hackers from stealing personal information. Data generalization is widely used in k-anonymization where the data values are replaced by high-level ones. Although this method has been proven to be very effective in protecting personal information, when generalized data is used as machine learning data such as deep learning, there is a problem that the learning performance is degraded. This study tried to find out how much the value distortion caused by data generalization affects deep learning performance. In the experiment, a deep learning model was built using TensorFlow, the same model was trained using a non-generalized dataset and a generalized dataset, and the learning performance of each was measured. The Korea’s temperature collected from January 1, 2010 to June 2022 was used as training dataset. In addition, in order to generate distorted data, the values were changed into high-level generalized ones by force. Root Mean Square Error (RMSE) was used as the performance metric value. The experiment results show that when the degree of generalization was small, there was a performance degradation of 0.90%, when the degree of generalization was medium, a performance degradation of 3.15%, and when the degree of generalization was severe, a performance degradation of 6.57% occurred.
더보기분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)