KCI등재
신경망 언어 모델 구축을 통한 중국어 문두 다중논항 어순 수용성 예측 연구 = A Study on Predicting the Word Order Acceptability of Chinese Sentence-Initial Multiple Arguments by Building a Neural Network Language Model
저자
박정구 ( Park Jungku ) ; 유수경 ( Yu Sukyong ) ; 박민준 ( Park Minjun ) ; 강병규 ( Kang Byeongkwu )
발행기관
학술지명
권호사항
발행연도
2024
작성언어
-주제어
KDC
700
등재정보
KCI등재
자료형태
학술저널
수록면
161-189(29쪽)
제공처
본고에서는 중국어 문두 다중논항의 어순 배열 문제를 해결하기 위해 트랜스포머 기반의 신경망 언어 모델을 적용하고 그 효율성을 검증하는 연구를 수행하였다. 본 연구에서는 문두에 나타나는 다양한 성분들과 이들 사이의 상호 작용, 그리고 어순 배열에 대한 제약이 어떻게 문법성을 형성하는지에 초점을 맞췄다. 이를 통해 중국어 문두 다중논항의 어순 배열과 관련된 문법성을 판단하는데 자연어처리 방법론이 얼마나 효과적인지 검증하고자 하였다. 본 연구에서 구축된 ‘문두 다중논항 데이터셋’은 15,298개의 중국어 문장으로 이루어져 있으며, 이 데이터셋은 문법적으로 올바른 문장과 비문법적인 문장을 이진 분류 방식으로 레이블링 하여 사용되었다. 연구팀은 이 데이터셋을 활용하여 문두 다중논항의 어순 수용성을 예측하는 모델을 개발하고, 그 정확도를 평가하였다. 연구 결과, 모델은 90%의 높은 정확도로 어순 수용성을 예측할 수 있음을 보여주었다. 또한, 본 연구는 원어민의 판단과 모델의 예측이 일치하지 않는 경우를 분석하여, 언어 수용도가 단순한 이분법으로만 구분되지 않음을 확인하였다. 이를 통해 언어 모델의 예측 능력과 원어민 판단 사이의 상관성을 보다 정교하게 파악할 수 있었다. 원어민의 판단과 AI 모델의 예측이 일치하지 않는 경우의 다양성을 고려하여, 본 연구는 153개의 문장에 대한 2차 분석을 실시하였다. 이 과정에서 74개의 문장이 유사 문장으로 재분류되었고, 결과적으로 1,450개 문장(94.8%)이 두 예측치가 일치하거나 유사한 것으로 평가되었다. 이는 AI 모델 예측의 높은 정확도를 보여주는 결과이다.
더보기In this paper, we applied a transformer-based neural network language model to solve the word order problem in Chinese Sentence-Initial Multiple Arguments (SIMA) and verified its effectiveness. The study focused on the different constituents that occur at the beginning of Chinese sentences, their interactions, and how word order constraints contribute to grammaticality. The goal was to validate the effectiveness of natural language processing methods in determining the grammaticality of word order in Chinese SIMA.
To investigate this, we constructed a specialized dataset and developed a predictive model. The SIMA dataset consists of 15,298 Chinese sentences. These sentences were labeled as grammatically correct or incorrect using a binary classification method. We developed a model to predict the acceptability of word order in SIMA and evaluated its accuracy. The model demonstrated a high level of accuracy in predicting word order, achieving 90% correctness compared to established grammatical norms.
In addition, the study analyzed cases where the model’s predictions differed from native speakers’ judgments, showing that acceptability prediction is not just a simple binary distinction process. This led to a more nuanced understanding of the relationship between language model predictions and native speaker judgments. In the secondary analysis focusing on sentences where the AI model’s predictions diverged from native speaker judgments, we found that after reevaluation, a significant proportion of these sentences (94.8%) aligned closely with native judgments, highlighting the nuanced capabilities of our model. These findings not only demonstrate the effectiveness of our model in analyzing Chinese SIMA but also contribute to a deeper understanding of AI’s role in linguistic analysis.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)