KCI등재
BSM1을 활용한 시간적 해상도가 기계학습모델의 성능에 미치는 영향에 대한 연구 = Assessing the Impact of Temporal Resolution Using BSM1 on the Performance of Machine Learning
저자
오원기 (한국산업기술시험원 디지털혁신센터) ; 기서진 (경상국립대학교 환경공학과) ; 박진미 (경상국립대학교 미래융복합기술연구소) ; 신승구 (경상국립대학교 미래융복합기술연구소)
발행기관
학술지명
대한환경공학회지(Journal of Korean Society of Environmental Engineers)
권호사항
발행연도
2023
작성언어
Korean
주제어
등재정보
KCI등재
자료형태
학술저널
발행기관 URL
수록면
625-642(18쪽)
제공처
목적 : 데이터의 시간적 해상도의 변화에 따른 데이터의 특성 변화를 확인하고, 데이터의 시간적 해상도가 기계학습 모델의 성능에 미치는 영향을 확인한다.
방법 : 하수처리시설에 대하여 BSM1으로 시뮬레이션하여 활용해 15분 간격 한 유입수 및 유출수 수질데이터를 확보하였다. 데이터를 n개씩 묶는 down sampling으로 데이터 수를 줄이고, 보간법으로 데이터 늘리는 up sampling의 resampling으로 데이터의 특성 변화를 확인하고, down sampling된 데이터로 구축한 30개의 기계학습 모델들의 성능을 상호 비교하였다.
결과 및 토의 : down sampling을 진행할 수록 R2는 낮아지고, RMSE는 증가하였다. 평균값을 대푯값으로 할 때 데이터의 정확성과 오차의 손실이 적고, 최대값을 대푯값으로 할 때 데이터 특성을 유지하여 정보의 손실을 감소시킬 수 있었다. 시간적 해상도가 다른 모델의 성능을 비교하기 위해서는 같은 수준의 데이터를 적용하여 모델간 성능을 비교할 필요가 있었다.
결론 : 사고경보 등 정확성보다는 변화를 감지하는 능력이 필요한 모델은 일정기간에 대한 최대값을 대푯값으로 활용하는 것이 효과적이다. 데이터의 측정 간격은 기계학습 모델의 성능에 영향을 주요 인자로 측정 간격이 다른 상태로 개발된 기계학습 모델이 제시된 성능을 발휘하지 못하는 주요 원인이 된다. 본 연구에서는 데이터의 전처리, 분류, 학습 및 검증의 모든 과정을 LabVIEW로 구현하여 향후 제어, 계측 분야에 널리 활용되고 있는 LabVIEW에 데이터 분석 과정이 포함된 통합개발환경의 구현의 가능성을 확인하였다.
Objectives : This study aims to establish efficient strategies for data-driven operational management by examining the variations in machine learning modeling outcomes and data characteristics based on data acquisition intervals and methods.
Methods : The BSM1 was used to simulate wastewater treatment facilities and to generate influent and effluent water quality data at 15-minute intervals. The generated data was processed by volume reduction through down sampling and data characteristic observation via resampling techniques, including up sampling through interpolation. Subsequently, the study involved a comparative analysis of the performance of 30 machine learning models built with the down sampled data.
Results and Discussion : As data acquisition interval increased (i.e., down sampling progressed), R2 decreased and RMSE increased. When using the mean value as a representation, data accuracy was high, and error loss was minimal. Utilizing the maximum value as a representation helped maintain data characteristics and reduce information loss. Simple interpolation methods did not yield improved data accuracy. Furthermore, with wider data acquisition intervals, the practical predictive performance of machine learning models decreased, and the models experienced a sharp decline in performance when data became insufficient.
Conclusion : For models requiring the ability to detect changes rather than accuracy, utilizing the maximum value over a specific period proves to be effective. The measurement interval of data emerges as a significant factor affecting the performance of machine learning models, with models developed under different measurement intervals often failing to demonstrate the expected performance. In this study, we have implemented all stages of data preprocessing, classification, training, and validation using LabVIEW, confirming the potential for integrating data analysis processes into LabVIEW, a widely used platform in the fields of control and measurement.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)