오류어와 대치어의 재현율 향상과 정확도 제어를 통한 ‘사용자 적응형 문맥 기반 한국어 맞춤법 검사기’ 개발
저자
발행기관
-
발행연도
2015년
작성언어
Korean
주제어
자료형태
한국연구재단(NRF)
Korean Spelling and Grammar Checker is the system that dectects the error word appears in the Korean text, and suggests the recommanded word to correct it. The types of error word can be divided into isolated-term spelling correction(non-word spelling error) and context-sensitive spelling error(real-word spelling correction). Context-sensitive spelling errors (CSSE) are hard to correct, since they are perfect words when analyzed alone. Determined only by considering the semantic and syntactic relations of their context, CSSEs affect largely the performance of spelling and grammar checkers. The existing Korean Spelling and Grammar Checker (KSGC) adopts a rule-based method, which uses hand-made correction rules for CSSEs. Focusing on general users' demands, the KSGC is designed to obtain the very high precision, which results in the extremely low recall. This system does not meet the needs of text experts such as editors, writers or journalists, who wish to detect and correct as many errors as possible.
The purpose of this study is to develop the 'User-Adaptive KSGC' that user can adjust the precision and recall by the user purpose. To develop the adjustable system, this study generalizes the CSSE correction rules to improve the recall, and minimize the lowering precision of corre
‘한국어 맞춤법 검사기(Korean Spelling and Grammar Checker)’의 기능은 전자화된 한국어 텍스트에 나타난 오류어(error word)를 검색하고, 이를 교정할 대치어(recommanded word)를 제시하는 것이다. 이때 오류어의 유형은 크게 “삶은 달랼을 찬물에서 건져”에서 “*달랼을”과 같은 단순 철자오류(isolated-term spelling correction; non-word spelling error)와 “물건값을 결재하는 날에는”의 “결재하는”과 같은 문맥의존 철자오류(context-sensitive spelling error; real-word spelling correction)로 구분할 수 있다. 전자의 경우, “*달랼”이라는 어휘가 없으므로, 해당 어절을 형태적으로 분석하는 것만으로 쉽게 오류어를 검색할 수 있다면, 후자에서 “결재하는”의 오류 여부는 “물건값을”과 같은 문맥(context)의 의미․통사적 관계를 고려해야만 하므로 검색이 매우 어렵다. 한국어 맞춤법 오류 중 이러한 문맥의존 철자오류의 비율이 20%를 넘는데, 이는 영어에 비해 4-5배나 높다. 또한, 단순 철자오류라도 교정 단계에서 “*달랼을”을 “달걀을”로 정확한 제시어를 보여주려면 “삶은”이라는 문맥의 고려가 필수적이므로, 문맥분석은 한국어 맞춤법 검사기의 성능에 크게 영향을 미친다. 맞춤법 검사기의 성능에 대한 요구는 사용자나 응용 목적에 따라 아주 다양하다. 물론 맞춤법 검사기가 모든 오류를 찾아서 항상 올바른 대치어를 제시해주면 좋겠지만, 이런 시스템을 만들기는 불가능하다. 따라서 범용 맞춤법 검사기는 ‘일반인’이 ‘일상생활’에서 사용하는 환경을 가정하므로, 재현율보다 정확도가 중요시된다. 맞춤법을 잘 알고, 맞춤법 검사기가 틀릴 수도 있다고 생각하는 사용자라면 맞춤법 검사기가 오류라고 제시해도 이를 취사선택할 수 있겠지만, 일반인은 맞춤법 검사기를 절대적으로 신뢰할 가능성이 크기 때문이다. 따라서 어떤 어절이 오류어일 가능성이 아주 높더라도 그 정확도가 100%가 아니라면 범용 맞춤법 검사기는 이를 바르다고 본다. 그러나 교과서나 도서 교열을 담당하는 전문가는 정확도가 어느 정도 유지되는 선에서 재현율이 최대한 높기를 원한다. 바로 문맥의존 철자오류 검색과 대치어 제시가 재현율을 높이는 데 결정적인 역할을 한다. 더구나 신문 기자를 비롯한 일부 작가는 급할 때에는 정확도가 높은 검사를, 여유가 있을 때는 재현율이 높은 검사를 할 수 있게 선택하기를 원하기도 한다. 하지만 이렇듯 다양한 요구에 맞춰 맞춤법 검사기를 따로 개발하기는 불가능하다. 그 이유는 수작업으
더보기분석정보
View
상세정보조회
0
usage
원문다운로드
0
대출신청
0
복사신청
0
EDDS신청
0
usage
내책장담기
0
내보내기
0
SNS공유
0
동일 주제 내 활용도 TOP
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)