Data Partitioning and Reduction for Improving eSVM-based BCI Speller = BCI 문자 입력 장치를 위한 앙상블 SVM의 전처리 방법에 관한 연구
저자
발행사항
부산 : 부산대학교 대학원, 2018
학위논문사항
학위논문(박사)-- 부산대학교 대학원 : 전자전기컴퓨터공학과 2018. 2
발행연도
2018
작성언어
영어
주제어
DDC
621.381 판사항(23)
발행국(도시)
부산
형태사항
vii, 73 장 : 삽화, 표 ; 30 cm
일반주기명
지도교수: 김형남
참고문헌: 장 66-69
UCI식별코드
I804:21016-000000134118
DOI식별코드
소장기관
A BCI speller is a device for typing word s by analyzing the electroencephalogram (EEG) caused by visual stimuli. Among classification methods used for the BCI speller, the ensemble of support vector machines (eSVM) is well known to achieve considerable classification accuracy. The eSVM consists of linear support vector machines trained by each small part of the divided training data. To get an ensemble model that improves the accuracy of the classification, it is generally important that each classifier should be as accurate and diverse as possible; diverse classifiers have different errors on a dataset. However, the conventional eSVM considers only an accuracy of individual classifiers by clustering the homogeneous training data with similar noisy components. In view of diversity, this thesis proposes a dataset manipulation method that divides a training dataset into several groups with different characteristics to train each classifier. Depending on the distance between the letters that a subject is focused on and the lines reinforced on a visual keyboard, can generate EEG signals with different characteristics in a BCI speller. Based on this property, the training data is divided into groups with the same distance. If each individual SVM is trained by using each of these groups, the trained classifiers have the increased diversity. The experimental results of a BCI speller show that the proposed eSVM, which has higher diversity, improves the letter typing speed of the BCI speller. Specifically, the proposed method shows an average of 70% accuracy (verbal communication with the Language Support Program is possible at that level) by repeating the dataset for a single letter only four times.
In addition, this thesis proposes a preprocessing method to reduce non-target data to decrease computational complexity of eSVM in training phase. In order to affect the classification performance, the proposed method uses paradigm characteristic of the visual stimulation of the BCI speller. Target data and non-target data have a ratio of 1: 5 in the entire input dataset due to the visual device, so that data unbalance occurs in the non-target data. Therefore, the proposed preprocessing scheme has a little affect the classification performance by randomly reducing the non-target data have a ratio of 1:2. Finally, it is confirmed that the proposed method can train about 10% faster than the existing eSVM in terms of training time. In respect of classification accuracy, when the number of repeated data for one character is 15, the classification accuracy of the
proposed method is reduced by 1%, but it is possible to correct through the language support program. On the other hand, when the number of repetitive data is 5 or less, it can be confirmed that classification accuracy is not greatly affected.
P300 기반 문자 입력 장치는 시각적 자극으로 유발되는 뇌파 (EEG)를 분석하여 문자를 입력하는 장치이다. 기존에 P300 기반 문자 입력 장치에 사용된 분류 방법 중, 앙상블 서포트 벡터 머신 (ensemble of support vector machines, eSVM) 은 높은 문자 입력 정확도를 가지는 것으로 알려져 있다. eSVM은 다수의 선형 서포트 벡터 머신(support vector machine, SVM)으로 구성되는데 각각의 SVM을 훈련시키기 위해서 훈련 데이터를 분할하여 서로 다른 데이터를 이용해 각 SVM을 훈련시킨다. 일반적으로 높은 분류 정확도를 가지는 앙상블 모델을 얻으려면, 각 분류기의 분류 정확도가 높아야 하며 분류기 간의 서로 다른 특성을 나타내는 상이성 (diversity)이 높아야 한다. 분류기 간의 서로 다른 특성인 상이성을 가지면 동일한 입력 데이터에 대해 서로 다른 오류를 갖는다. 그러나 기존의 eSVM은 유사한 잡음 성분을 가지도록 데이터의 동질성 (homogeneity)만을 고려하여 학습 데이터를 분할함으로써 개별 분류기의 정확도 관점만을 고려하였다. 본 논문에서는 상이성의 관점에서 각 분류기를 훈련하기 위해 훈련 데이터 집합을 특성이 다른 여러 그룹으로 나누는 데이터 분할 방법을 제안한다. 시각 키보드에서 피실험자가 집중하고 있는 문자와 자극을 발생시키는 다른 문자와의 거리가 서로 다른 특성을 가지는 EEG 신호를 생성할 수 있다. 이러한 특성을 기반으로 시각 키보드에서 동일한 거리를 가지는 자극에 의해 발생된 신호는 동일한 그룹으로 훈련 데이터를 분할한다. 각각의 SVM이 서로 다른 각 그룹을 사용하여 훈련되는 경우에, 훈련된 분류기 간의 상이성이 증가하게 된다. 실험 결과에서 제안한 eSVM의 상이성이 높아질수록 P300 기반 문자 입력 장치의 문자 입력 속도를 향상시킬 수 있다는 것을 확인할 수 있다. 특히, 제안한 방법은 단일 문자에 대한 데이터를 기존 방법보다 적은 4 번의 반복 횟수일 때, 평균 71.8 %의 문자 입력 정확도 (30 %의 오차는 언어 지원 프로그램을 통해 정정이 가능하며, 70 %의 정확도로 구두 의사 소통이 가능함)를 가진다.
또한 본 논문에서는 반복되는 연산이 많다는 특징을 가지는 eSVM의 훈련 연산 시간을 줄이기 위해 비목표(non-target) 데이터를 줄이는 전처리 방법을 제안한다. 분류 성능에 영향을 주지 않으면서 데이터를 줄이는 방법은 P300 기반 문자 입력 장치의 시각 자극에 대한 패러다임의 특성을 이용한다. 시각 장치에 의해 전체 입력 중 목표 데이터와 비목표 데이터가 1대 5의 비율을 가지기 때문에 비목표 데이터의 데이터 불균형이 발생한다. 따라서 본 논문에서는 목표 데이터와 비목표 데이터가 1대 2의 비율을 가지도록 비목표 데이터를 무작위로 줄임으로써 분류 성능에는 큰 영향을 미치지 않는 전처리 방식을 제안하였다. 최종적으로 제안된 방법은 훈련 시간 측면에서는 기존의 eSVM보다 약 10 % 정도 빠른 훈련이 가능한 것을 확인하였다. 분류 정확도 측면에서는 한 문자에 대해 반복되는 데이터가 15 개 일 때는 제안된 방법의 분류 정확도가 1 % 가 낮아졌지만 언어 지원 프로그램을 통한 정정이 가능한 정도이고, 반복 데이터가 적을 때는 분류 정확도에 큰 영향을 미치지 않는 것을 확인할 수 있다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)