KCI우수등재
말뭉치로부터 자동 추출된 문맥 반영 구문 규칙을 이용한 영어 구문 분석 = Syntactic Analysis in English using Automatically Acquired Context - Sensitive Grammar Rules from Corpus
저자
발행기관
학술지명
권호사항
발행연도
1994
작성언어
Korean
KDC
028
등재정보
KCI우수등재
자료형태
학술저널
발행기관 URL
수록면
1702-1710(9쪽)
제공처
구문 분석 과정에서 애매성은 구문 분석의 효율을 떨어뜨릴 뿐만 아니라 다음 단계에도 부담이 된다. 이런 애매성은 구문 분석의 선호도(parse preference)를 이용하여 해결할 수 있는데 확률 모델은 이런 분석 선호도를 명확하게 정의할 수 있는 모델이다. 따라서 본 논문에서도 구문 분석 과정시 확률 모델을 이용하고자 한다. 본 논문에서는 구문 분석 과정에서의 애매성을 처리하기 위한 확률적 차트 파싱 알고리듬을 제안한다. 이를 위해 먼저, 본 시스템은 이미 구문 분석이 된 문장들로 이루어진 대량의 말뭉치인 Penn Treebank로부터 트라이 그램에 기반하는 문맥 반영 문법규칙을 자동으로 추출하고, 동시에 각 규칙에 대한 문맥을 반영한 조건 확률을 얻는다. 그리고 확률적 예측과 확률 필터를 이용하여 구문 분석을 한다. 구문 분석 후, 순위 매김 함수에 의해 구문 분석 결과에 순위를 정한다. 실험 결과, 본 시스템은 93-94%의 구문 분석 성공율과 84-86%의 순위 매긴 정확성을 가지며, 50% 이상의 불필요한 중간 결과를 제거함으로써 구문 분석의 모호성 해소와 속도 향상에 기여하는 결과를 얻었다.
더보기In syntactic analysis, ambiguity degrades the efficiency of a parser and burdens the next analysis phase. The ambiguity can be resolved by parse preference and by the results of the previous processing, probabilistic models provide a well defined preference rule for selecting among grammatical alternatives. We attemp to use a probabilistic model in syntactic analysis. This thesis describes a probabilistic chart parsing algorithm to deal with ambiguity. Our system, first, automatically acquires a set of context sensitive grammar rules based trigram and the corresponding context sensitive conditional probabilities from a large preparsed corpus, called the Penn Treebank. And then, parses sentences using a technique called probabilistic prediction and probabilistic filter. Then, the system ranks the output parse trees using a scoring function. Experimental results show the hit ratio of this parser is 93~94%, and the number of syntactic interpretations is decreased by 60~64%. The overall ranking accuracy rate is 84~86%.
더보기서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)