모음 생성과 모음의 공명주파수 변화에 관한 음향학적 연구 = (An) acoustical study on vowel production and variation in resonance frequency of vowels for forensic application
저자
발행사항
서울 : 성균관대학교, 2007
학위논문사항
학위논문(박사)-- 성균관대학교 일반대학원 : 물리학과 2006
발행연도
2007
작성언어
영어
주제어
DDC
530 판사항(22)
발행국(도시)
서울
형태사항
xx, 105 p. : 삽도 ; 26 cm.
일반주기명
지도교수:윤석왕
참고문헌: p. 99-102
DOI식별코드
소장기관
There is less than perfect agreement in the acoustic parameters measured in speech materials that a person pronounces the same words several times. In the forensic speaker identification, the limited speech materials are used and it is very important to understand the origin of common point and individuality in the measured acoustic parameters, in order to distinguish between the intraspeaker variation and the interspeaker variation in the parameters.
Vowel formants representing the acoustic characteristics of the vocal tract and fundamental frequencies of the vibration of vocal folds are very crucial features for the speaker identification. The goal of this study was to compensate the acoustic rationale for vowel production through an acoustic resonance experiment and one-dimensional plane wave theory, which apply to any dimension of the vocal tract. The other goal was to propose a method to predict the cause of the variation in the resonance frequencies of vowels for forensic application.
The relation between the constriction shape factors and the natural frequency of the tube was investigated to better understand vowel production mechanism. An acoustic resonance experiment was performed with a cylindrical tube with a constrictor in it as a vocal tract model. As a result, the same relative constriction factors, position, length, and cross-sectional area, of the tubes produced an identical shift rate of the natural frequency regardless of the dimensions of the tube. It was also observed that the relative constriction length played an important role in modifying the structure of the resonance frequency. When the constriction length was less than a quarter of the wavelength, the amplitude of the natural frequency shift rate (shift %) increased with the increasing constriction length. When the constriction length was larger than half of the wavelength, the polarity of the shift % was reversed. Perturbation theory was used for demonstrating that the resonance frequency structures in the production of vowels were determined by the relative constriction position of the vocal tract. In this study, however, it was verified that perturbation theory was valid only for a relatively small variation (less than 20%) in the cross-sectional area of the vocal tract. Conclusively, the relative position and the relative length of the constriction played key roles in determining the resonance frequency structure of the vowels. The high resonances were changed more sensitively than the lower resonances owing to their high frequencies and short wavelengths.
In forensic speaker identification, the formant frequencies of the vowel measured by a spectrographic method or a linear prediction coding (LPC) method are often different even though the vowels are pronounced by the same speaker. When the formant frequencies measured in several voice materials are different, there is not a clear decision criterion whether the discrepancy is due to a different vocal tract or a different fundamental frequency (F0) of vocal folds. In order to provide a method to confirm the cause of the discrepancy, we experimentally investigated the correlation between the natural frequency of the vowels and the F0. First, acoustic resonance phenomena were confirmed through the experiments with three kinds of sound materials: the resonance sounds of two cylindrical tubes driven by the periodic sound sources with different F0, eight cardinal vowels pronounced with almost invariant vocal tract in rising and falling intonation by a phonetician, and five Korean vowels produced in two different larynx positions by a male singer. The resonance frequency range (RFR) of the forced vibrating system (tube or vocal tract) by the sound source including a fundamental and its harmonics was converged on the specific frequency region (SFR). It was observed that the natural frequency of the driven system was contained within the SFR. The correlation between the natural frequency and the formant measured by the LPC method was not found. Then, with the six Korean vowels spoken by five male speakers, it was observed that more than 80% of the peak harmonics in the resonance range were converged on the SFR. The deviation of the RFR from the threshold of the SFR was usually less than half of the F0. The RFR deviated by more than half of the F0 was only about 5%. This convergence was also confirmed for the criminal’s and suspect’s voices in real forensic cases. Using various suspects’ voices, the intraspeaker variation of the suspect can be confirmed and it is possible to explain quantitatively whether the cause of the variation is due to the different vocal tract or due to the acoustic phenomena by the different F0.
일반적으로 동일한 사람이 같은 말을 여러 번 반복하여 발성하여도 측정된 음향 변수들이 완전히 일치하는 경우는 매우 드물다. 대부분 한정된 음성 자료만을 이용할 수 있는 법과학 분야에서의 화자식별에서는 측정된 음향 변수들의 변화가 개인내 변화인지 개인간 변화인지를 구별하기 위해서는 이 변수들의 공통점과 개인적인 특징의 근원을 정확히 이해하는 것이 매우 중요하다.
성도의 음향특성을 나타내주는 모음의 공명주파수와 성대 진동의 기본주파수는 화자식별에서 매우 중요한 요소들이다. 본 연구의 첫 번째 목적은 음향 공명 실험과 일차원 평면파 이론을 이용하여 성도의 크기에 관계없이 모든 사람들에게 적용될 수 있는 모음 생성에 관한 음향학적 근거를 제시하는 것이다. 두 번째는 법음성학에서의 활용을 목적으로 모음의 공명주파수 변화의 원인을 예측할 수 있는 방법을 제안하는 것이다.
성도 모델로써 좁힘이 있는 원통형 튜브를 이용하여 음향공명 실험을 하였고, 좁힘이 튜브의 고유진동수 변화에 미치는 영향에 대하여 조사하여 모음 생성 메커니즘을 이해하고자 하였다. 결과로써 튜브 전체에 대한 좁힘의 위치, 길이, 및 단면적의 비율이 같은 경우 튜브의 크기에 관계없이 튜브의 고유진동수 변화 비율이 동일하였다. 또한 상대적인 좁힘의 길이가 공명주파수 구조 변화에 중요한 역할을 한다는 것이 관찰되었다. 좁힘의 길이가 고유 진동의 1/4 파장 보다 짧은 경우는 좁힘의 길이가 증가함에 따라 고유진동수의 변화율이 증가하였고, 반파장 보다 긴 경우는 짧은 경우의 고유진동수 변화율 방향과 반대가 되었다. 섭동 이론에 의하여 모음의 공명주파수 구조는 상대적인 좁힘점 위치에 의하여 결정된다고 설명되어 왔다. 그러나 본 연구에서는 섭동 이론에 의한 좁힘의 위치에 따른 성도 고유진동수 변화는 좁힘의 단면적 변화가 전체 튜브의 약 20 % 이하인 경우만 잘 일치한다는 것이 확인되었다. 그러므로 결론적으로 성도의 고유진동수 변화 방향을 결정하는 상대적인 좁힘의 위치와 길이가 모음 생성에 결정적인 역할을 한다. 그리고 파장이 짧고 높은 주파수를 갖는 높은 공명들은 고유진동수의 작은 변화율에도 주파수가 많이 변화하게 되고 좁힘의 길이 변화에 더 민감하게 변화되므로 이들이 낮은 공명에 비하여 변화하기 쉽다는 것이 확인되었다.
실제 범죄 사건에서의 화자식별시에는 동일한 사람이 발음한 모음들에서 스펙트로그래픽 방범이나 선형예측 방법으로 측정된 포만트 주파수들이 다른 경우가 종종 있다. 음성자료에서 측정된 모음의 포만트 주파수들이 다른 경우 그 근원이 성도의 변화인지, 성대의 기본주파수 변화인지를 판단할 수 있는 기준을 제시하기 위하여 모음의 고유진동수와 성대의 기본주파수와의 상관관계가 실험적으로 조사되었다. 우선적으로 음향공명 현상이 세 종류의 소리 자료들을 이용한 실험으로 확인되었다: 기본주파수가 다른 음원에 의한 두 개의 원통형 튜브의 공명음들, 음성학자가 성도를 거의 변화시키지 않고 성대의 기본주파수만 변화시키면서 발음한 8개의 표준 모음들, 성악가가 후두 위치를 다르게 하여 발음한 5개의 한국 모음들. 기본음과 배음들로 구성된 음원에 의해 공명 시스템인 튜브나 성도의 공명 가능 주파수 대역들은 특정한 주파수 지역으로 수렴하였다. 시스템의 고유진동수는 그 특정 주파수 범위 내에 포함되어 있었다. 선형 예측 방법에 의하여 측정된 포만트와 시스템의 고유진동수와는 일정한 상관관계가 확인되지 않았다. 또한 일반인들이 기본주파수를 변화시켜가면서 6개의 한국 모음을 발음한 경우 공명 가능 주파수 대역들의 80 % 이상이 하나의 특정된 주파수 근처로 수렴하였고, 이 특정된 주파수 범위로부터 기본주파수의 절반보다 더 큰 차이를 나타낸 공명 가능 주파수 대역들은 단지 약 5 % 미만이었다. 그리고 실제 범죄 사건에서 채취된 음성 자료들에서도 유사한 현상들이 확인되었고, 다양한 용의자들의 음성 자료를 이용하여 개인의 변화를 확인할 수 있고, 그 변화의 근원이 성도의 변화에 의한 것인지 단지 기본주파수 변화에 의한 음향공명 현상인지를 수치적으로 설명할 수 있다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)