한국어 표준 발음의 계량언어학적 연구
저자
발행사항
서울 : 韓國外國語大學校 大學院, 2019
학위논문사항
학위논문(박사) -- 韓國外國語大學校 大學院 국어국문학과 2019. 8
발행연도
2019
작성언어
한국어
주제어
DDC
895.1 판사항(22)
발행국(도시)
서울
기타서명
A quantitative linguistics study on standard Korean pronunciation
형태사항
xiii, 261 p. : 삽도 ; 26 cm
일반주기명
한국외국어대학교 논문은 저작권에 의해 보호받습니다.
지도교수: 허용
참고문헌: p. 179-187
UCI식별코드
I804:11059-200000223045
소장기관
This is a quantitative linguistics study on standard Korean pronunciation, utilizing quantitative methods to examine the frequency of phonemes, which constitute the lexicon of the Korean language, as well as phonemic contrast, and analyzing the linguistical characteristics of Korean phonemes.
Quantitative linguistics is a field of study that interprets specific linguistic phenomena based on sufficient data on the language from a linguistic viewpoint. Quantitative studies assume that differences in frequency in a given language system are not random or coincidental, but based on a general principle of the language as well as its individual structures. As such, quantitative studies complement qualitative studies and can be used as basic data in many fields of language studies.
This study determines the frequency of phonemes and discusses the frequency differences based on their position within syllables, by parts of speech, and by the origins of words. Furthermore, by measuring the number of minimal pairs and changes in entropy, this study analyzes the phonemic contrasts. Studies on phonemic contrast are rare, even though they are an important subdomain of phonology along with phoneme frequencies. Related studies are conducted using dictionaries; however, analyzing dictionaries is a substantial task, and practical difficulties have led to the absence of studies. Therefore, this study utilizes the pronunciation in the entries of the Korean dictionary 『Urimalsaem』 to conduct a quantitative linguistics study on standard Korean pronunciation, and the results are summarized below.
First, phoneme frequencies were measured. The ranking of phonemes from highest to lowest was turned out to be as follows: /ㄱ/ > /ㅈ/ > /ㅅ/ > /ㅎ/ > /ㅂ/ … /ㅆ/ > /ㅌ/ > /ㄸ/ > /ㅋ/ > /ㅃ/ in the onset, /ㅏ/ > /ㅣ/ > /ㅜ/ > /ㅗ/ > /ㅓ/ … /ㅝ/ > /ㅢ/ > /ㅙ/ > /ㅞ/ > /ㅒ/ in the nucleus, /ㅇ/ > /ㄴ/ > /ㄹ/ > /ㄱ/ > /ㅁ/ > /ㅂ/ > /ㄷ/ in the codas.
Utilizing the phonemes with the highest frequencies in the onset, nucleus, and codas to create syllables for each part of speech results in 강 for nouns, 곤 for pronouns, 산 for numerals, 항 for verbs, 항 for adjectives, 적 for determiners, 갈 for adverbs, 란 for particles, and 강 for exclamations. Similarly, showing the results for the origins of words in terms of phonemes result in 갈 for native-Korean 강 for the Sino-Korean, and 항 for the hybrid word. This confirmed that there are differences between phoneme frequency by the position within the syllable, by part of speech, and by the origins of words.
Second, the number of minimal pairs were measured. The ranking of phoneme pairs from highest to lowest was turned out to be as follows: /ㅅ/‒/ㅈ/ > /ㄱ/‒/ㅈ/ > /ㄱ/‒/ㅅ/ > /ㄱ/‒/ㅎ/ > /ㄱ/‒/ㅂ/ … /ㅆ/‒/ㅋ/ > /ㅉ/‒/ㅋ/ > /ㄸ/‒/ㅋ/ > /ㄹ/‒/ㅃ/ > /ㅃ/‒/ㅋ/ in the onset, /ㅏ/-/ㅗ/ > /ㅏ/-/ㅣ/ > /ㅏ/-/ㅜ/ > /ㅏ/-/ㅓ/ > /ㅗ/-/ㅜ/ … /ㅒ/-/ㅓ/ = /ㅒ/-/ㅟ/ > /ㅝ/-/ㅞ/ > ㅒ-ㅝ/ > /ㅒ/-/ㅞ/ = /ㅒ/-/ㅡ/ in the nucleus, /ㄴ/-/ㅇ/ > /ㄴ/-/ㄹ/ > /ㄴ/-/ㅁ/ > /ㄹ/-/ㅇ/ > /ㄱ/-/ㅇ/ … /ㄷ/-/ㄹ/ > /ㄴ/-/ㄷ/ > /ㄷ/-/ㅇ/ > /ㄷ/-/ㅂ/ > /ㄷ/-/ㅁ/ in the codas. However, this study compared the number of minimal pairs and frequency of occurrence by phoneme, and found that while high-frequency phonemes were largely associated with minimal pairs, there were phonemes that showed differences between the two results. They were generally phonemes that had differences in frequency according to the position within words or had high frequency of occurrence in a specific part of speech.
As in frequency, there were differences based on the position within the syllable and by part of speech, and by the origins of words. By part of speech, /ㅅ/-/ㅈ/, /ㅏ/-/ㅗ/, and /ㄴ/-/ㅇ/ were the most frequent minimal pairs for nouns, /ㄱ/-/ㅈ/, /ㅓ/-/ㅗ/, /ㄱ/-/ㄴ/ for pronouns, /ㄴ/-/ㅅ/, /ㅐ/-/ㅗ/, /ㄱ/-/ㄴ/ for numerals, /ㅅ/-/ㅈ/, /ㅏ/-/ㅗ/, /ㄴ/-/ㅇ/ for verbs, /ㅅ/-/ㅈ/, /ㅏ/-/ㅓ/, /ㄴ/-/ㅇ/ for adjectives, /ㅅ/-/ㅈ/, /ㅏ/-/ㅣ/, /ㄴ/-/ㅇ/ for determiners, /ㅂ/-/ㅃ/, /ㅏ/-/ㅓ/, /ㄱ/-/ㅇ/ for adverbs, /ㄱ/-/ㄷ/, /ㅏ/-/ㅗ/, /ㄴ/-/ㄹ/ for particles, and /ㄴ/-/ㅈ/, /ㅏ/-/ㅓ/, /ㅁ/-/ㅇ/ for exclamations (in the order of onset, nucleus, and coda). By the origins of words, /ㅂ/-/ㅃ/, /ㅏ/-/ㅣ/, and /ㄷ/-/ㄹ/ were the most frequent minimal pairs for native-Korean, /ㅅ/-/ㅈ/, /ㅏ/-/ㅗ/, /ㄴ/-/ㅇ/ for the Sino-Korean, and /ㅅ/-/ㅈ/, /ㅏ/-/ㅣ/, /ㄴ/-/ㅇ/ for the hybrid word.
Third, the changes in entropy of phoneme pairs were measured. The ranking of phoneme pairs from largest to smallest was turned out to be as follows: /ㅅ/-/ㅈ/ > /ㄱ/-/ㅅ/ > /ㄱ/-/ㅈ/ > /ㄱ/-/ㅎ/ > /ㄱ/-/ㅂ/ … /ㄴ/-/ㅃ/ > /ㅉ/-/ㅋ/ > /ㄸ/-/ㅋ/ > /ㅃ/-/ㅋ/ > /ㄹ/-/ㅃ/ in the onset, /ㅏ/-/ㅗ/ > /ㅏ/-/ㅣ/ > /ㅏ/-/ㅓ/ > /ㅏ/-/ㅜ/ > /ㅗ/-/ㅜ/ … /ㅒ/-/ㅓ/ > /ㅒ/-/ㅙ/ > /ㅒ/-/ㅝ/ > /ㅒ/-/ㅞ/ = /ㅒ/-/ㅡ/ in the nucleus, /ㄴ/-/ㅇ/ > /ㄴ/-/ㄹ/ > /ㄴ/-/ㅁ/ > /ㄹ/-/ㅇ/ > /ㄱ/-/ㅇ/ … /ㄷ/-/ㄹ/ > /ㄴ/-/ㄷ/ > /ㄷ/-/ㅇ/ > /ㄷ/-/ㅂ/ > /ㄷ/-/ㅁ/ in the codas. This study examined the correlation coefficients between changes in entropy and the raw count of minimal pairs and found very high correlations, with r = 0.999 for onsets, r = 0.998 for nucleus, and r = 1.000 for codas. The results were quite similar despite differences in the two methods of calculating the trends of phonemic contrasts.
On the other hand, measurements of average changes in entropy of phonemes indicated that the ranking of phoneme from largest to smallest was /ㄱ/ > /ㅈ/ > /ㅅ/ > /ㅂ/ > /ㅎ/ … /ㄲ/ > /ㅆ/ > /ㄸ/ > /ㅋ/ > /ㅃ/ for onsets, /ㅏ/ > /ㅗ/ > /ㅣ/ > /ㅜ/ > /ㅓ/ … /ㅝ/ > /ㅢ/ > /ㅙ/ > /ㅞ/ > /ㅒ/ for nucleus, and /ㄴ/ > /ㅇ/ > /ㄹ/ > /ㄱ/ > /ㅁ/ > /ㅂ/ > /ㄷ/ for codas. This study measured the correlation coefficients between changes in entropy of phonemes and its frequency, and found very high correlations, with r=0.923 for onsets, r=0.963 for nucleus, and r=0.940 for codas. However, to measure functional load in a single language, that is, the extent to which the phoneme or phonemic contrasts are involved to differentiate meaning, this study concluded that the method of utilizing changes in entropy, which reflect both occurrence frequency and positioning, was more appropriate.
This study analyzed the pronunciation of the Korean language using diverse methods, thereby broadly examining the distributional trends and trends of contrast shown by Korean phonemes when they are used to form words. Data presented in this study are sourced from the largest amount of data and the most diverse methodologies among quantitative studies of Korean phonemes till date. As such, data from this study could be used as reliable data in various fields of linguistics that require quantitative data. Therefore, it is hoped that this study marks the beginning of expanding the domain of quantitative research in the field of Korean phonemics.
본 연구는 한국어 표준 발음에 대한 계량언어학적인 연구로 한국어의 어휘부를 구성하는 음소의 빈도와 음소 대립이 사용되는 양상을 계량적 방법으로 연구하여 음소의 언어학적 특성을 분석하는 것을 목적으로 하였다.
계량언어학이란 언어 사실에 대한 충분한 양의 자료를 바탕으로 언어학적 관점에서 특정 언어 현상을 해석하는 분야이다. 계량적 연구는 한 언어 체계에서 발생하는 빈도 차이가 무의미하고 우연한 것이 아니라 언어 보편적인 원리와 언어 개별적인 구조가 반영된 결과라는 점에 기초한다. 그럼으로써 계량적 연구는 질적 연구와 상호보완적인 가치를 갖고, 언어 연구의 여러 분야에서 기초 자료로 활용될 수 있다.
본 연구에서는 음소 출현 빈도를 산출하고, 음절 내 위치별, 품사별, 원어별 빈도의 차이에 대해 논의하였다. 또한 최소대립쌍의 개수와 엔트로피 변화의 측정을 통하여 음소 대립이 사용되는 양상을 분석하였다. 음소 대립 양상에 대한 연구는 음소 빈도에 대한 연구 못지않게 중요한 음운론의 하위 분야이지만 종합적으로 연구된 바가 없다. 이에 대한 연구는 기본적으로 사전을 통해서 이루어져야 하지만 사전의 분석은 방대한 작업이기에 현실적 어려움으로 인해 연구가 이루어지기 쉽지 않았다. 따라서 본 연구에서는『우리말샘』의 표제어 발음을 자료로 삼아 한국어 표준 발음에 대한 계량언어학적 연구를 하였고, 연구 결과는 다음과 같이 요약된다.
첫째, 음소 출현 빈도를 산출한 결과, 초성은 /ㄱ/ > /ㅈ/ > /ㅅ/ > /ㅎ/ > /ㅂ/ … /ㅆ/ > /ㅌ/ > /ㄸ/ > /ㅋ/ > /ㅃ/ 순, 중성은 /ㅏ/ > /ㅣ/ > /ㅜ/ > /ㅗ/ > /ㅓ/ … /ㅝ/ > /ㅢ/ > /ㅙ/ > /ㅞ/ > /ㅒ/ 순, 종성은 /ㅇ/ > /ㄴ/ > /ㄹ/ > /ㄱ/ > /ㅁ/ > /ㅂ/ > /ㄷ/ 순으로 높았다.
각 품사에서 초성, 중성, 종성별로 빈도가 가장 높게 나타난 음소를 사용하여 음절을 만들면 명사는 ‘강’, 대명사는 ‘곤’, 수사는 ‘산’, 동사는 ‘항’, 형용사는 ‘항’, 관형사는 ‘적’, 부사는 ‘갈’, 조사는 ‘란’, 감탄사는 ‘강’이 되었다. 같은 방식으로 원어 정보에 따른 결과를 음절로 나타내면 고유어는 ‘갈’, 한자어는 ‘강’, 혼종어는 ‘항’이었다. 이를 통해 품사별, 원어별로 각기 다른 발음상의 특징을 지니고 있음을 확인할 수 있었다.
둘째, 최소대립쌍의 개수를 센 결과, 초성은 /ㅅ/‒/ㅈ/ > /ㄱ/‒/ㅈ/ > /ㄱ/‒/ㅅ/ > /ㄱ/‒/ㅎ/ > /ㄱ/‒/ㅂ/ … /ㅆ/‒/ㅋ/ > /ㅉ/‒/ㅋ/ > /ㄸ/‒/ㅋ/ > /ㄹ/‒/ㅃ/ > /ㅃ/‒/ㅋ/ 순, 중성은 /ㅏ/-/ㅗ/ > /ㅏ/-/ㅣ/ > /ㅏ/-/ㅜ/ > /ㅏ/-/ㅓ/ > /ㅗ/-/ㅜ/ … /ㅒ/-/ㅓ/ = /ㅒ/-/ㅟ/ > /ㅝ/-/ㅞ/ > ㅒ-ㅝ/ > /ㅒ/-/ㅞ/ = /ㅒ/-/ㅡ/ 순, 종성은 /ㄴ/-/ㅇ/ > /ㄴ/-/ㄹ/ > /ㄴ/-/ㅁ/ > /ㄹ/-/ㅇ/ > /ㄱ/-/ㅇ/ … /ㄷ/-/ㄹ/ > /ㄴ/-/ㄷ/ > /ㄷ/-/ㅇ/ > /ㄷ/-/ㅂ/ > /ㄷ/-/ㅁ/ 순으로 많았다. 최소대립쌍의 개수와 음소의 출현 빈도를 비교해 본 결과 출현 빈도가 높은 음소는 대체로 최소대립쌍도 많이 만들었지만 차이를 보이는 음소들도 상당수 발견되었다. 이에 해당하는 음소들은 주로 단어 내 위치별로 출현 빈도에 차이를 보이거나 특정 품사에서 출현하는 빈도가 높은 것이었다.
또한 품사와 원어별로 최소대립쌍을 분석해 본 결과 다른 특징을 지니고 있음을 확인할 수 있었다. 품사별로 최소대립쌍이 가장 많은 음소 쌍은 초성, 중성, 종성의 차례대로 명사는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅗ/; /ㄴ/-/ㅇ/, 대명사는 /ㄱ/-/ㅈ/; /ㅓ/-/ㅗ/; /ㄱ/-/ㄴ/, 수사는 /ㄴ/-/ㅅ/; /ㅐ/-/ㅗ/; /ㄱ/-/ㄴ/, 동사는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅗ/; /ㄴ/-/ㅇ/, 형용사는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅓ/; /ㄴ/-/ㅇ/, 관형사는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅣ/; /ㄴ/-/ㅇ/, 부사는 /ㅂ/-/ㅃ/; /ㅏ/-/ㅓ/; /ㄱ/-/ㅇ/, 조사는 /ㄱ/-/ㄷ/; /ㅏ/-/ㅗ/; /ㄴ/-/ㄹ/, 감탄사는 /ㄴ/-/ㅈ/; /ㅏ/-/ㅓ/; /ㅁ/-/ㅇ/이었다. 그리고 원어별로 최소대립쌍이 가장 많은 음소 쌍은 고유어는 /ㅂ/-/ㅃ/; /ㅏ/-/ㅣ/; /ㄷ/-/ㄹ/, 한자어는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅗ/; /ㄴ/-/ㅇ/, 혼종어는 /ㅅ/-/ㅈ/; /ㅏ/-/ㅣ/; /ㄴ/-/ㅇ/이었다.
셋째, 음소 쌍의 엔트로피 변화를 측정한 결과, 초성은 /ㅅ/-/ㅈ/ > /ㄱ/-/ㅅ/ > /ㄱ/-/ㅈ/ > /ㄱ/-/ㅎ/ > /ㄱ/-/ㅂ/ … /ㄴ/-/ㅃ/ > /ㅉ/-/ㅋ/ > /ㄸ/-/ㅋ/ > /ㅃ/-/ㅋ/ > /ㄹ/-/ㅃ/ 순, 중성은 /ㅏ/-/ㅗ/ > /ㅏ/-/ㅣ/ > /ㅏ/-/ㅓ/ > /ㅏ/-/ㅜ/ > /ㅗ/-/ㅜ/ … /ㅒ/-/ㅓ/ > /ㅒ/-/ㅙ/ > /ㅒ/-/ㅝ/ > /ㅒ/-/ㅞ/ = /ㅒ/-/ㅡ/ 순, 종성은 /ㄴ/-/ㅇ/ > /ㄴ/-/ㄹ/ > /ㄴ/-/ㅁ/ > /ㄹ/-/ㅇ/ > /ㄱ/-/ㅇ/ … /ㄷ/-/ㄹ/ > /ㄴ/-/ㄷ/ > /ㄷ/-/ㅇ/ > /ㄷ/-/ㅂ/ > /ㄷ/-/ㅁ/ 순으로 컸다. 엔트로피 변화와 최소대립쌍의 절대수치 사이의 상관계수를 구한 결과 초성은 r=0.999, 중성은 r=0.998, 종성은 r=1.000으로 매우 높은 상관관계를 보였다. 음소의 대립 양상을 계산하는 두 방법이 다름에도 불구하고 결과가 거의 같았다.
한편 음소의 평균 엔트로피 변화를 측정한 결과, 초성은 /ㄱ/ > /ㅈ/ > /ㅅ/ > /ㅂ/ > /ㅎ/ > … /ㄲ/ > /ㅆ/ > /ㄸ/ > /ㅋ/ > /ㅃ/ 순, 중성은 /ㅏ/ > /ㅗ/ > /ㅣ/ > /ㅜ/ > /ㅓ/ … /ㅝ/ > /ㅢ/ > /ㅙ/ > /ㅞ/ > /ㅒ/ 순, 종성은 /ㄴ/ > /ㅇ/ > /ㄹ/ > /ㄱ/ > /ㅁ/ > /ㅂ/ > /ㄷ/ 순으로 컸다. 음소의 엔트로피 변화와 출현 빈도 사이의 상관계수를 구한 결과 초성은 r=0.923, 중성은 r=0.963, 종성은 r=0.940으로 높은 편이었다. 하지만 한 언어에서 음소 또는 음소의 대립이 단어의 의미 구별에 관여하는 정도인 기능부담량을 측정하기 위해서는 출현 빈도와 출현 위치가 모두 반영된 엔트로피 변화를 이용한 방식이 더 적합하다고 본다.
이상으로 본 연구에서는 한국어의 표준 발음을 다양한 방법으로 분석하여 한국어의 음소들이 단어를 형성할 때 보이는 분포적, 대립적 양상을 살펴봄으로써 그 일단을 알아볼 수 있었다. 본 연구에서 제시한 자료들은 지금까지 있었던 한국어 음소의 계량적 연구 중 가장 큰 자료를 대상으로 가장 다양한 방법론을 적용해 뽑은 결과물이다. 따라서 이 자료는 계량적 정보가 필요한 언어 연구의 각 분야에서 신뢰할 만한 자료로 활용될 수 있을 것이다. 이 연구가 한국어 음운론 분야에서 계량적 연구의 영역을 넓히는 계기가 될 수 있기를 기대한다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)