국방 인공지능 모델의 기술과제 발전방안에 관한 연구 : 설명가능성, 적대적 공격 대응, 모델 경량화를 중심으로
저자
발행사항
서울 : 국방대학교 국방관리대학원, 2023
학위논문사항
학위논문(박사)-- 국방대학교 국방관리대학원 : 군사운영분석 2023. 1
발행연도
2023
작성언어
한국어
주제어
발행국(도시)
서울
형태사항
; 26 cm
UCI식별코드
I804:11070-200000651811
소장기관
This dissertation is a study that identifies the technical challenges of defense artificial intelligence technology and suggests solutions. AI, the core technology of future warfare, is expected to be used as a game changer for the efficient operation and intelligent weapon systems. However, AI has its limitations, and national defense has special characteristics that are different from those of civilians. Therefore, to consider this, a methodology for identifying and solving the technical tasks of the defense AI model was studied. The research was conducted on image detection and classification models among AI models, and the superiority of the methodology was confirmed by applying the proposed methodology to various image detection models.
In order to identify technical tasks, we researched the main issues of AI and existing research for the development of defense artificial intelligence. The main issues of AI identified through previous research are lack of learning data, model explanation and interpretation limitations, vulnerability to adversarial attacks, need to reduce model weight, and establishment of AI ethics. On the other hand, AI models to be used in national defense require high performance compared to civilians and have the characteristic that they can be used in various environments. Therefore, it requires higher accuracy and speed than civilian, and interpretability, security, and flawless are required. When considering collectively, the following three technical tasks were derived. The technical tasks are first, development of an explainable AI model, second, defense to adversarial attacks, and third, lightweight artificial intelligence. In this dissertation, a new methodology to solve the derived technical task was proposed and applied to the image detection model to confirm the superiority of the methodology.
The following is a summary of the proposed method for the technical task and the results of its application.
First, HITL (Human In The Loop) was applied to develop an AI model with guaranteed explanation. In general supervised learning, the model is trained to predict the true label given input data and true label. In the proposed method, in addition to the data and true label, the knowledge of experts in the relevant field is converted into data and injected into the model. Expert knowledge data is coordinated with important parts when classifying an object judged by an expert. The ROI data is used as the true data of the feature map of the convolution operation of the input image, and a Loss function is added. That is, the proposed method can make the Feature Map of the input data similar to the ROI along with the label prediction by using true label and ROI data. When the Feature Map becomes similar to the ROI, it means that the important characteristics extracted by the model are similar to the important regions designated by experts. The proposed learning method is called Strong Supervised Learning (SSL) because it is learned by adding expert knowledge data. The proposed SSL was applied to the image classification models VGG16, ResNet, Inception, and Xception, and the similarity with the results of ROI and visual XAI (eXplainable AI), Grad CAM (Gradient Class Activation Method), was evaluated. As the evaluation index, SSIM (Structural Similarity Index Map) that confirms the similarity of images was used, and it was confirmed that the proposed SSL method increased Global SSIM by 15.51% and Local SSIM by 8.83% compared to general supervised learning.
Second, in order to defense to adversarial attacks, a method capable of adversarial detection was applied. To detect AEs, adversarial retraining, outlier detection using stochastic neighbor embedding (t-SNE) and Mahalanobis distance, and outlier detection using CAE (Convolutional AutoEncoder) were applied. Adversarial retraining showed the result of 100% detection of AEs by using the AEs as learning data again. t-SNE is a method that can visualize the distribution of data by reducing nonlinear high-dimensional data. As a result of reducing the dimension and visualizing it, it was confirmed that the AEs form a different cluster from other classes. was detected. CAE is a deep learning framework consisting of compression and decompression that can generate new data similar to input data. In this case, it is a method to measure the reproduction error between the raw data and the generated data, and if there is an error over a certain threshold, it is detected as an outlier. The threshold of CAE was designated as the upper 95% of the reproducibility error, and when this was applied, the detection rate of the AEs was 3.6%, which showed the lowest detection result among the proposed methods.
Third, to develop a lightweight model, the Mask RCNN model was lightweighted using MobileNet, a lightweight feature extraction model, and Depthwise Seprerable Convolution (hereafter, DW Conv). DW Conv is the core idea of MobileNet and can extract features with only about 1/9 of the amount of computation and parameters compared to spatial convolution operation. As a result of lightweighting Mask RCNN by applying a lightweight technique, the size and number of parameters of the model were reduced by about 64%, and the training and inference times were shortened by 11.6% and 46% due to the reduced parameters.
In consideration of the above technical tasks, the procedure for developing an AI model is presented. And the empirical model was developed by following the procedure. The empirical model is a model that can detect nine objects such as warships, merchant ships, and fishing vessels operating in the sea using YOLOv5. The empirical model is a model that not only collects learning data and considers accuracy improvement, but also considers explanatory power, defense adversarial attack, and weight reduction of the model.
It is expected that the research will contribute to the development of defense AI by increasing understanding and consensus on the technological challenges of defense AI, and contributing to the improvement of naval maritime surveillance operations through empirical models.
본 논문은 인공지능 기술의 국방 활용을 위해 가져야 할 기술과제를 식별하고 해결방안을 제시한 연구이다. 미래전의 핵심기술인 인공지능은 지능화 무기체계 및 국방의 효율적 운용에 게임 체인져로 활용될 것이다. 하지만 인공지능이 가지는 한계가 있고, 국방은 민간과는 다른 특수성이 있다. 따라서 이를 반영하기 위해 국방 인공지능 모델의 기술과제를 식별하고 해결하기 위한 방법론을 연구하였다. 연구는 이미지 탐지 및 분류 모델을 대상으로 다양한 이미지 탐지 모델에 제안하는 방법론을 적용하여 방법론의 우수성을 확인하였다.
기술과제를 식별하기 위해 국내외에서 논의되고 있는 인공지능 주요이슈와 국방 인공지능 발전을 위한 기존연구를 살펴보았다. 기존연구를 통해 확인한 인공지능의 주요이슈는 학습 데이터 부족, 모델 설명 및 해석 제한, 적대적 공격에 취약, 모델 경량화 필요, 인공지능 윤리 정립이다. 한편 국방에서 활용될 인공지능 모델은 민간에 대비하여 높은 성능이 요구되고 다양한 환경에서 활용될 수 있다는 특징이 있다. 따라서 민간에 대비하여 높은 정확도와 신속성을 요구하며, 해석성, 보안성, 무결점 등이 요구된다. 이를 종합적으로 고려하여 다음과 같은 세 가지 기술과제를 도출하였다. 첫째, 설명 가능한 인공지능 모델 개발, 둘째, 적대적 공격 대응, 셋째, 경량화 인공지능이다. 본 논문에서 도출된 기술과제를 해결하기 위한 새로운 방법론을 제안하고 이미지 탐지 모델에 적용하여 방법론의 우수성을 확인하였다.
아래는 기술과제에 대해 제안하는 방법과 그 적용 결과에 대한 요약이다.
첫째, 설명력이 보장되는 인공지능 모델 개발을 위해 사람이 모델 학습과정에 개입하는 HITL(Human In The Loop)을 적용하였다. 일반적인 지도학습에서는 데이터와 정답 라벨을 주고 라벨을 잘 예측하도록 모델이 학습된다. 제안하는 방법은 데이터와 정답 라벨에 추가하여 해당분야 전문가의 전문지식을 데이터화하여 모델에 주입하였다. 전문지식 데이터는 전문가가 판단한 객체 분류 시 중요 부위를 좌표화한 것으로 연구에서는 이를 ROI(Region Of Important) 데이터로 명명하였다. ROI 데이터는 입력 이미지의 합성곱 연산 Feature Map의 정답 데이터로 활용되며 이를 반영할 수 있는 Loss 함수를 추가하였다. 즉, 제안하는 방법은 데이터, 정답라벨, ROI 데이터를 활용하여 라벨 예측과 함께 입력 데이터의 Feature Map이 ROI와 유사해지도록 하는 방법이라고 할 수 있다. Feature Map이 ROI와 유사해진다는 것은 모델이 추출한 중요 특성이 전문가가 지정하는 중요 부위와 유사해짐을 의미한다. 제안하는 학습방법은 전문가의 지식 데이터가 추가되어 학습되므로 강한 지도학습(Strong Supervised Learning, SSL)이라고 지칭하였다. 제안하는 SSL을 이미지 분류 모델인 VGG16, ResNet, Inception, Xception에 적용하고 ROI와 visual XAI(eXplainable AI) 기법인 Grad CAM(Gradient Class Activation Method) 결과와 유사성을 평가하였다. 평가지표는 이미지의 유사성을 확인하는 SSIM(Structural Similarity Index Map)을 이용하였으며 제안하는 SSL 방법이 일반 지도학습 대비 Global SSIM 15.51%, Local SSIM 8.83% 증가함을 확인하였다.
둘째, 적대적 공격에 대응하기 위해 적대적 사례를 탐지할 수 있는 방법을 적용하였다. 적대적 사례를 탐지하기 위해 적대적 사례 재훈련, t-SNE(Stochastic Neighbor Embedding)과 마할라노비스 거리를 이용한 이상치 탐지 방법, CAE(Convolutional AutoEncoder)를 이용하여 이상치를 탐지하는 방법을 적용하였다. 적대적 재훈련은 적대적 사례를 다시 학습 데이터로 활용하는 방법으로 적대적 사례를 100% 탐지하는 결과를 보여주었다. t-SNE는 비선형 고차원 데이터를 축소하여 데이터의 분포를 가시화할 수 있는 방법이다. 차원을 축소하여 가시화한 결과 적대적 예제는 타 클래스와 다른 군집을 이루고 있음을 확인하였으며, 마할라노비스 거리를 이용하여 클래스간 거리를 측정하고 상위 95% 이상을 이상치로 간주했을 때 44.66%의 적대적 예제를 탐지하였다. CAE는 압축과 해제로 이뤄진 딥러닝 프레임워크로 입력 데이터와 유사한 새로운 데이터를 생성할 수 있다. 이때 원 데이터와 생성 데이터간의 재현 오차를 측정하여 특정 임계치 이상의 오차가 있을 경우 이상치로 탐지하는 방법이다. CAE의 임계치는 재현 오차 상위 95%로 지정하였고 이를 적용할 경우 적대적 예제 탐지율은 3.6%로 제안하는 방법 중 가장 저조한 탐지 결과를 보여주었다.
셋째, 경량화 모델 개발을 위해 경량화 feature extraction 모델인 MobileNet과 Depthwise Seprerable Convolution(이하 DW Conv)을 이용하여 Mask RCNN 모델을 경량화하였다. DW Conv는 MobileNet의 핵심 아이디어로 기존의 합성곱 연산에 대비하여 약 1/9의 계산량과 파라미터만으로 특징을 추출할 수 있다. 경량화 기법을 적용하여 Mask RCNN을 경량화한 결과 모델의 크기와 파라미터 수가 약 64% 감소하였으며, 감소된 파라미터로 인해 학습과 추론 시간은 11.6%, 46% 단축시켰다.
이상의 기술과제를 고려하여 인공지능 모델을 개발하는 절차를 제시하였다. 그리고 그 절차를 준수하여 실증모델을 개발하였다. 실증모델은 YOLOv5를 이용하여 해상에서 활동하는 군함, 상선, 어선 등 9개의 객체를 탐지할 수 있는 모델이다. 실증모델은 단순히 학습 데이터를 수집하고 정확도 향상만을 고려한 것이 아니고 설명력과 적대적 공격대응, 모델의 경량화를 고려한 모델로 기존의 해상탐지 모델 중 국방의 특성이 가장 잘 반영된 모델이다.
연구를 통해 국방 인공지능의 기술과제에 대한 이해와 공감대를 높여 국방 인공지능 발전에 기여하고, 실증모델을 통해 해군 해상 감시 작전의 향상에 기여하기를 기대한다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)