중국어권 한국어 학습자의 연어 사용 연구 : 연결주의를 기반으로
저자
발행사항
서울 : 연세대학교 대학원, 2021
학위논문사항
학위논문(박사) -- 연세대학교 대학원 국어국문학과 2021.2
발행연도
2021
작성언어
한국어
주제어
발행국(도시)
서울
기타서명
A study on the collocation usage of Chinese-speaking Korean learners : based on connectionism
형태사항
x, 193 p. : 삽화 ; 26 cm
일반주기명
지도교수: 원미진
UCI식별코드
I804:11046-000000531780
소장기관
본고에서는 뇌의 기제를 은유적으로 차용하여 사람의 인지와 정보 처리 과정을 연구하는 연결주의(connectionism)를 기반으로 대규모 한국어 학습자 말뭉치를 사용하여 중국어권 한국어 학습자들의 '체언+용언'형 연어의 사용 양상 및 오류 양상을 분석하였다. 이를 통해 언어 입력과 모국어가 연어 사용에 구체적으로 어떤 영향을 미치는지를 살펴보았다. 연어 사용 양상은 '돈, 말, 생각, 생활' 등 네 개 고빈도 명사와 결합되는 주술관계, 목술관계 연어를 중점으로 두어 살펴보았으며 연어 오류 양상은 중국어권 학습자들이 명사, 동사, 형용사의 위치에서 범하는 주술, 목술, 부술관계 연어 오류에 주목하여 오류 양상을 살펴보았다. 연어의 판정은 <한국어 교육 어휘 내용 개발(4단계)> 및 <한중연어사전>에서 제시된 목록을 통합하여 재구성한 한국어 교육용 연어 목록을 학습자 말뭉치에서 나타난 연어의 판정 기준으로 삼았다. 또한 모국어가 연어 사용 및 오류에 어떤 영향을 미치는지를 살펴보기 위해 '일치성'이라는 개념을 도입하였으며 '역번역(back translation)'이라는 방법으로 일치성 여부를 판정하였다. 이를 기반으로 하여 학습자 말뭉치에서 추출된 연어를 분석하였으며 다음과 같은 연구 결과를 도출하였다.
첫 번째는 학습자들이 고빈도 명사와 결합되는 연어 사용 양상에 대한 분석 결과이다. 먼저 학습자들이 고빈도 명사와 결합되는 연어를 얼마나 다양하게 사용하는지를 살펴보기 위해 학습자들이 사용된 연어 유형수/한국어 교육용 연어 유형수의 비율로 된 '연어 다양도'라는 척도를 도입하였으며 연어 사용의 다양성을 검토해 보았다. 그 결과 학습자들이 341개 교육용 연어 중 총 128개의 연어를 사용하였으며 37.54%의 다양도를 나타냈다. 이는 학습자들이 제한된 범위 내에서만 연어를 사용하고 다양한 연어 표현을 구사하지 못하였음을 보여준다.
다음으로 연어 입력 빈도와 사용 빈도 간의 관계를 살펴보기 위해 세종계획 말뭉치에서의 연어 빈도를 입력 빈도의 지표로 삼아 학습자 말뭉치에서 나타난 128개 유형의 연어 사용 빈도와 비교하고자 Spss를 이용하여 상관관계 분석을 실시하였다. 분석 결과 상관계수가 .624로 나타나 연어의 사용 빈도가 입력 빈도와는 높은 상관관계를 가지고 있다는 것을 밝혀졌다. 이는 Ellis et al.(2014)에서는 나오는 학습자의 사용 빈도와 입력 빈도 간의 상관계수 .59, 0.65, 0.59와 비슷하다. 또한 일치성이 있는 연어와 일치성이 없는 연어가 각각 입력 빈도와의 관계에 있어 차이가 있는지를 살펴보기 위해 128개 연어 유형을 두 그룹으로 나뉘어 각각 상관관계 분석을 실시하였다. 그 결과 93개 일치성이 있는 연어의 사용 빈도와 입력 빈도 간의 상관계수는 .600이며 39개 일치성이 없는 연어의 사용 빈도와 입력 빈도의 상관계수는 .809로 나타나 일치성이 없는 연어가 입력에 더 의존한다는 결과를 밝혔으며 이는 Yamashita & Jiang(2010), Wolter & Gyllstad(2013), Wolter & Yamashita(2018) 등 연구에서의 논의를 뒷받침해준다.
이어서 학습자들의 연어 과잉 사용, 과소 사용 등 양상을 살펴보기 위해 100어절 당 연어 입력 빈도와 사용 빈도를 정규화한 후 세종말뭉치와 학습자 말뭉치에서의 연어 빈도를 비교해 보았다. 분석 결과 과잉 사용의 유형이 과소 사용보다 많으며 과잉 사용의 경향 또한 더 강하다는 것이다. 그리고 과잉 사용 및 과소 사용에 영향을 미치는 요인이 크게 장르 및 주제, 일치성(congruency), 그리고 연결 강도에 따른 원형(prototypical) 등이 밝혀졌다.
다음으로 숙달도에 따른 연어 다양도, 연어 세련도, 그리고 연어 발달 양상을 살펴보았다. 연어 다양도는 유형수 측면에서 학습자들의 연어 사용의 다양도는 중급으로 가면서 증가하며 고급에서는 크게 발전되지 않는 모습을 보여줬으며 연어 세련도는 숙달도에 따라 U자형 곡선이 나타났다. 이는 학습자들이 숙달도가 높아짐에 따라 중·고급 연어 지식이 어느 정도 증가하였으나 여전히 부족하다는 것을 보여주었다.
그리고 숙달도에 따른 전체 발달 양상을 분석한 결과 '초급→중급' 단계에서 13.78%의 발달률이 나타났으며 '중급→고급' 단계에서 7.33%의 발달률이 나타났다. 즉 학습단계가 높아짐에 따라 학습자의 연어 지식이 발달되었으나 그 폭이 점차 줄어든다는 것을 알 수 있다.
두 번째는 학습자들의 연어 오류 양상에 대한 분석 결과이다. 이에 대해 구체적으로 오류 원인, 통사 유형, 일치성, 그리고 숙달도에 따라 각기 어떤 양상이 나타나는지를 살펴보았다. 먼저 오류 원인에 따른 양상에 대한 분석 결과를 살펴보면 전체 546개 오류 중 L1 간섭으로 인한 오류는 198개로 36.26%를 차지하였다. 통사 유형 중 목술관계 연어의 비율이 60.26%로 가장 높은 비중을 차지하였다. 일치성에 따른 오류 양상을 살펴보면 일치성이 없는 174개 연어 중 L1 간섭 오류가 나는 횟수가 84개로 48.28%를 차지하고 있으며 일치성이 있는 연어 372개 중 L1 간섭 오류가 114회가 나서 30.65%의 비율을 차지하고 있다. 이로 미루어 보아 학습자들이 일치성이 없는 연어의 사용에 있어 L1 간섭을 받을 가능성이 일치성이 있는 연어보다 더욱 높으며 학습자들이 오류를 범하는 데에 있어 이런 일치성의 영향을 받고 있다는 것도 증명해 준다. 숙달도에 따른 전체 연어 오류율이 초·중·고급에서 U자형 패턴을 나타냈으나 문어에서 숙달도별로 오히려 계속 상승하는 모습을 보이고 있었다.
본 연구는 중국어권 학습자의 연어 사용 및 오류 양상을 연결주의적 시각에서 분석했다는 점, 일치성에 따라 한·중 연어 대조 방법을 새롭게 제안했다는 점, 연어 입력이 연어 사용과 높은 상관관계를 가졌으며 일치성이 있는 연어보다 일치성이 없는 연어가 입력을 더 의존적이었다는 것을 밝혔다는 점, 연결주의 및 Jiang(2000, 2004)에 기반하여 모국어가 의미 전이 및 결합 패턴 전이 두 가지 방식으로 간섭을 일으켰다는 것을 밝혔으며 이에 따라 연어 오류 원인을 다시 규명하였다는 점에서 의의를 갖는다.
This study analyzes the uses and errors of the 'substantive+predicate' type of collocations by Chinese-speaking Korean learners using a large-scale Korean language corpus based on connectionism, which uses brain mechanisms metaphorically to study human cognition and information processing processes. And investigates how input and first language influenced the usage of collocation. The uses of collocation is focused on collocations, which is combined with four high-frequency nouns such as 'money(돈), words(말), thoughts(생각), life(생활)', while the errors of collocation is examined by Chinese learners, paying attention to the errors of subject-predicate, object-predicate, adverb-predicate collocations take place in nouns, verbs and adjectives. Collocation's judgment is based on the compilation of lists presented in the <Korean Language Education Vocabulary Contents Development (Step 4)> and the <Korean-Chinese Collocation Dictionary>. In addition, the concept of 'congruency' is introduced to examine how the first language influence on collocation uses and errors, and 'congruency' is determined by the method of 'back translation'. Based on this, collocation extracted from the learner corpus is analyzed and the research results are as follows.
First, the analysis results of the way how learners use collocation combined with high-frequency nouns are as follows. Firstly, to see how diverse the learners use collocation combined with high frequency nouns, we introduced a 'collocational diversity' scale, which is a proportion of the number of collocation types used by learners in the number of Korean educational collocation types. As a result, learners used a total of 128 collocations out of 341 Korean educational collocations, representing a 37.54% diversity, indicating that learners use collocation only within a limited range and could not use various expressions of collocations.
Next, a correlation analysis was conducted using spss to examine the relationship between the frequency of collocation input and the frequency of collocation usage. To compare the frequency of 128 types of collocation used in the learner's corpus , we take the frequency of the corpus of Sejong Planning as an indicator of input collocation frequency. According to the analysis, the correlation coefficient is .624, indicating that the frequency of collocation use is highly correlated with the frequency of input. This is similar to the correlation .59, 0.65, and 0.59 in Ellis et al.(2014). In addition, 128 types of collocation were divided into congruent groups and non-congruent groups to see if there were differences in their relationship to the input frequency. As a result, the correlation between congruent collocations(93) and input frequency is .600 and the correlation between non-congruent(39) collocation and the input frequency was found to be .809. This indicated that the non-congruent collocation relied more on input, which supported the discussions in the studies such as Yamashita & Jiang(2010), Wolter & Gyllstad(2013), and Wolter & Yamashita(2018).
We then compared the frequency of collocation input and frequency of usage per 100 words in the learner's corpus and the Corpus of Sejong Planning to examine the learner's overuse and underuse of collocation. Analysis shows that the type of overuse is more than underuse, and the tendency to overuse is also stronger. And the factors affecting overuse and underuse can be largely identified as genre and subject, congruency, and prototype according to the strength of the combination.
Next, we looked at the variety of collocation, the sophistication of collocation, and the development of collocation as proficiency increases. In terms of the number of collocation types, the diversity of collocation usage by learners increased as they moved to the intermediate level and showed no significant development in advanced, while the sophistication of collocation showed a U-shaped pattern depending on the level of proficiency. This showed that the knowledge of intermediate and advanced collocation has increased to some extent but is still lacking as learners become more skilled. In addition, an analysis of the overall development patterns of proficiency showed a 13.78% development rate in the 'basic to intermediate' stage, and a 7.33% development rate in the 'intermediate to advanced' stage. This revealed that the learner's collocational knowledge has developed as the proficiency increases, but the degree of development gradually decreases.
Secondly, the analysis results of the learner's errors of collocation are as follows. To be specific, we analyzed the causes of the errors, the syntax type of errors, the congruency type of the errors, and changes through proficiency increases. First of all, in regard to the causes of collocation errors, 198 errors were caused by L1 interference out of the total 546 errors, accounting for 36.26%. Among the types of syntax, 60.26% of the total number of collocation errors was object-predicate. As for the congruency of the collocation errors, the number of L1 interference errors are 84 out of 174 un-congruency collocation, accounting for 48.28%, and there are 114 L1 interference errors out of 372 congruent collocation, accounting for 30.65%. This proved that learners are more likely to be involved in L1 interference in the use of non-congruent collocation and are affected by this congruency in causing errors. The overall rate of collocation errors showed a U-shaped pattern in basic, intermediate and advanced proficiency, but it continued to rise as proficiency increases in written production.
This study is meaningful in the sense that it analyzed the collocation uses and errors of Chinese-speaking learners from a connectionism perspective, proposed a new method of contrasting Korean-Chinese collocation based on congruency, and revealed that the input of collocation has a high correlation with the use of collocation, as well as revealed that first language is causing collocation errors in two ways of semantic negative transfer and pattern negative transfer based on connectionism and Jiang(2000, 2004), then identified the causes of the collocation errors based on this.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)