KCI등재
한국어 반어 탐지를 위한 이종 코퍼스 통합과 활용 가능성 모색 = Integrating Two Distinct Corpora for Korean Irony Detection: Exploring the Potential for Practical Use
저자
발행기관
학술지명
한국차세대컴퓨팅학회 논문지(The Journal of Korean Institute of Next Generation Computing)
권호사항
발행연도
2025
작성언어
Korean
주제어
등재정보
KCI등재
자료형태
학술저널
수록면
68-85(18쪽)
DOI식별코드
제공처
최근 자연어처리(NLP) 기술의 발전과 더불어, 대화형 AI 시스템이 언어의 함축적 의미를 파악하는 능력의 중요성이 부각되고 있다. 이 가운데 반어(irony)와 빈정거림(sarcasm)과 같은 비유적 표현은 문맥 의존성이 높고 표현 방식이 다양하여 자동 탐지가 쉽지 않다. 한편, 이와 같은 언어 현상의 자동 탐지를 위한 학습에 필요한 자원은 충분치 않다. 본 연구는 이러한 언어 현상을 보다 심도 있고 정확하게 처리하고자, 기존에 구축된 두 종류의 한국어 반어 코퍼스, 수작업 기반의 코퍼스와 GPT 기반 자동 생성 코퍼스를 통합하여 단일 코퍼스로 구성하고, 그 특성을 비교·분석하였다. 통합 코퍼스를 활용한 일련의 실험 결과, 각 코퍼스가 반어 표현의 유형과 구축 방식에 있어 본질적인 차이를 지니고 있어 단일 코퍼스로 통합하여 사용하는 데에는 한계가 있음이 확인되었다. 그러나 두 코퍼스 간 반어 표현 유형은 명확히 구분 가능하였으며, 감성 인식과의 다중 과제 학습 결과에서도 상이한 상관관계가 관찰되었다. 이러한 분석을 바탕으로, 본 연구는 코퍼스 병렬 구조 확장 및 표현 방식 변환을 통해 통합형 반어 코퍼스 구축 방안을 제안한다. 또한, 본 연구는 한국어 반어 표현의 정밀한 분석을 위한 언어 자원 개발에 기여하며, 향후 감성 분석 및 대화형 인공지능 등 다양한 NLP 응용 분야에서의 활용 가능성을 제시한다.
더보기With the recent advancement of NLP technologies, the ability of conversational AI systems to interpret implicit meanings in language has become increasingly important. Among various linguistic phenomena, figurative expressions such as irony and sarcasm pose particular challenges for automatic detection due to their high contextual dependency and diverse surface realizations. However, resources for training models to detect such expressions remain insufficient. This study aims to improve the depth and accuracy of irony detection by integrating two previously developed Korean irony corpora, one of which is based on manual annotation and the other generated automatically using a GPT-based model, into a single unified corpus. Through a series of experiments, we found that each corpus reflects fundamentally different types of ironic expressions and construction methodologies, which limit the effectiveness of their integration into a single resource. Nevertheless, the types of irony in the two corpora were clearly distinguishable, and multi-task learning with sentiment analysis revealed differing correlations depending on the corpus. Based on this analysis, the study proposes strategies for building an integrated irony corpus by extending its parallel structure and transforming expression styles across corpora. This research contributes to the development of linguistic resources for the fine-grained analysis of Korean irony and offers practical implications for various NLP applications such as sentiment analysis and conversational AI.
더보기분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
| 주요 개정내역 | 변경 사유 |
|---|---|
| · 수탁업체 콘소시엄 기관명 및 위탁기간 명시 | · 제6조(개인정보 처리업무의 위탁) 구체화 |
한국교육학술정보원은 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
제1조(개인정보의 처리 목적)
제2조(개인정보의 처리 및 보유 기간)
제3조(처리하는 개인정보의 항목)
제4조(개인정보파일 등록 현황)
제5조(개인정보의 제3자 제공)
제6조(개인정보 처리업무의 위탁)
제7조(개인정보의 파기 절차 및 방법)
제8조(정보주체와 법정대리인의 권리·의무 및 그 행사 방법)
제9조(개인정보의 안전성 확보조치)
제10조(개인정보 자동 수집 장치의 설치·운영 및 거부)
제11조(개인정보 보호책임자)
제12조(개인정보의 열람청구를 접수·처리하는 부서)
제13조(정보주체의 권익침해에 대한 구제방법)
제14조(추가적 이용·제공 판단기준)
제15조(개인정보 처리방침의 변경)
제1조(개인정보의 처리 목적)
제2조(개인정보의 처리 및 보유 기간)
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)
제3조(처리하는 개인정보의 항목)
제4조(개인정보파일 등록 현황)
개인정보파일 검색(privacy.go.kr)| 개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 |
보유기간 | |
|---|---|---|---|---|
| 학술연구정보서비스 이용자 가입정보 | 한국교육학술정보원법 정보추제 동의 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
| 선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 | |||
제5조(개인정보의 제3자 제공)
제6조(개인정보 처리업무의 위탁)
제7조(개인정보의 파기 절차 및 방법)
제8조(정보주체와 법정대리인의 권리·의무 및 그 행사 방법)
제9조(개인정보의 안전성 확보조치)
제10조(개인정보 자동 수집 장치의 설치·운영 및 거부)
제11조(개인정보 보호책임자)
| 구분 | 담당자 | 연락처 |
|---|---|---|
| KERIS 개인정보 보호책임자 | 정보보호본부 안재호 |
- 이메일 : jinuk@keris.or.kr - 전화번호 : 053-714-0158 - 팩스번호 : 053-714-0195 |
| KERIS 개인정보 보호담당자 | 개인정보보호부 송진욱 | |
| RISS 개인정보 보호책임자 | 교육학술데이터본부 정광훈 |
- 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
| RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
제12조(개인정보의 열람청구를 접수·처리하는 부서)
제13조(정보주체의 권익침해에 대한 구제방법)
제14조(추가적인 이용ㆍ제공 판단기준)
제15조(개인정보 처리방침의 변경)
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)