빅데이터 분석을 이용한 한국어 고정관념 구조화 = Structuring Stereotypes in Korean Language Using Big Data Analysis
저자
발행사항
서울 : 서울대학교 대학원, 2023
학위논문사항
학위논문(석사)-- 서울대학교 대학원 : 심리학과 2023. 8
발행연도
2023
작성언어
한국어
주제어
DDC
150
발행국(도시)
서울
형태사항
iv, 54 ; 26 cm
일반주기명
지도교수: 김청택
UCI식별코드
I804:11032-000000179731
DOI식별코드
소장기관
최근 심각해지는 사회갈등의 양상을 이해하기 위해 현재 한국사회에 존재하는 고정관념을 내용에 따라 구체적으로 범주화하고, 각 범주에 대한 문장들로 구성된 대규모 데이터셋을 구축했다. 이를 위해 9개의 온라인 커뮤니티(디시인사이드, 일베, 네이트판, 더쿠, 뽐뿌, 루리웹, 웃긴대학, 워마드, 블라인드)와 4개의 웹사이트(유튜브, 네이버뉴스, 네이버영화, 다음뉴스)로부터 댓글을 수집했고, 크라우드소싱을 통해 댓글에 대한 고정관념 유무, 고정관념 대상, 심리적 친밀감의 평정 자료를 수집했다. 문장의 고정관념 포함 여부를 객관적으로 판단하기 위해 심리적 친밀감을 가중치로 활용하여 평정자 4명의 고정관념 유무 응답을 병합했다.
연구 1에서 고정관념 대상에 대한 응답 데이터를 일부 활용한 Ko-Sentece-Transformer 모델의 미세조정을 통해 응답 데이터를 효과적으로 임베딩했고, 가우시안 혼합 모형과 BERTopic을 사용하여 11개의 대범주와 99개의 소범주를 규명하였다. 11개의 대범주는 사건/사고, 산업/직업, 국제사회, 지역, 대인관계, 인터넷 사이트, 연령, 정치이념, 엔터테인먼트 산업, 종교/사상, 기타이다. 또한 연구 2에서 대범주 간 유사도, 범주 간 조합 양상, 부정적이지 않은 고정관념을 확인하여, 연구 1에서 규명한 범주들의 특성을 살펴보았다.
본 연구는 사람들의 실제 행동을 반영한 빅데이터인 온라인 댓글을 심리학 영역에서 활용한 점과 자료주도적 접근을 통해 한국사회의 고정관념을 구체적이고 구조적으로 규명한 점에서 의의가 있다.
To gain a comprehensive understanding of the recent escalation of social conflicts, this study aimed to categorize the objects of stereotypes, specifically within contemporary Korean society and construct an extensive dataset comprising sentences related to each identified category. The study utilizes online comments collected from nine online communities (DC Inside, Ilbe, Nate Pann, Theqoo, Ppomppu, Ruliweb, Humor University, Womad, Blind) and four websites (Youtube, Naver News, Naver Movies, Daum News). Crowd-sourcing was employed to collect data on the presence of stereotypes, the objects of stereotypes, and psychological intimacy associated with the comments. To objectively determine the inclusion of stereotypes in sentences, the presence of stereotype responses of four assessors were consolidated by weighting them based on the psychological intimacy ratings.
In study 1, the objects of stereotype responses were effectively embedded by fine-tuning the Ko-Sentence-Transformer model using a subset of the response data. Gaussian Mixture Models and BERTopic were employed to identify 11 major categories and 99 subcategories. The 11 major categories include Incidents, Industry/Occupation, International, Region, Interpersonal, Website, Age, Politics, Entertainment Industry, Belief, and Others. In Study 2, we explore the characteristics of the categories identified in Study 1 by analyzing the similarities among major categories and examining potential combinations between them. Additionally, the infrequent occurrence of non-negative stereotypes is discussed.
The contribution of this research lies in utilizing big data from online comments, which provides insights into the actual behaviors of individuals, enabling a data-driven structural investigation of stereotypes in Korean society.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)