KCI등재
텍스트 마이닝을 이용한 KBO 구단별 언론보도 행태 연구 : 2020시즌 KBO구단 NC, 롯데를 중심으로 = A Study on Press Reporting Trend by KBO Club using Text Mining: Focus on NC and Lotte in 2020 Season
저자
발행기관
학술지명
Journal of the Korean Data Analysis Society(Journal of The Korean Data Analysis Society)
권호사항
발행연도
2022
작성언어
-주제어
KDC
310
등재정보
KCI등재
자료형태
학술저널
수록면
23-35(13쪽)
KCI 피인용횟수
0
DOI식별코드
제공처
본 연구의 목적은 우리나라 스포츠 언론이 KBO 참가 구단에 대해 어떻게 보도하고 있는지를 살펴보는 것에 있다. 이를 위해 텍스트 마이닝 기법을 활용하여 KBO 참가 구단 10개를 보도하는 기사를 비교 분석을 진행할 예정이었으나 보다 명확한 비교를 위해 10개 구단 중 구단 역사, 인기, 성적 등에서 가장 이질적이면서 대표적인 라이벌 관계인 ‘NC 다이노스’와 ‘롯데 자이언츠’를 다루는 언론 기사만을 분석하기로 하였다. 연구에 사용할 데이터는 네이버 스포츠에서 서비스한 기사만을 수집하였다. 이는 인터넷 언론의 특성상 같은 기사를 여러 언론사가 복제하는 이른바 ‘복제 기사’를 최대한 배제하기 위한 것이다. 또한 수집한 기사를 전처리(preprocessing)하여. KBO와 관련 없는 기사를 최대한 배제하였으며, 혹시나 있을 중복 기사 또한 제거하여 데이터에 기인하는 노이즈(noise)를 최대한 제거하였다. 수집한 데이터는 크게 3가지 방법으로 분석하였다. 첫번째 방법은 시기별 가사량 추이 추적이다. 기사량을 월별로 파악하여 특히 높은 시기의 기사를 워드 클라우드(word cloud)로 해당 기간의 주제를 확인 할 것이다. 두 번째 방법은 감성 분석(sentiment analysis)으로 월별 감정 추이(trend), 두 구단의 긍정, 부정기사 비율차이를 검정하였다. 세 번째 방법은 네트워크 분석(network analysis)으로 단어 동시 출현 빈도 분석(co-occurrence analysis), 연이은 단어 쌍 분석(n-gram analysis)을 실시하여 단어 간 관계를 분석하였다. 종합적으로 결론을 내리자면 ‘NC’의 언론보도 행태는 주로 ‘성적’에 맞추어져 있는 경향이 강했다. 월별, 일별 기사량이 가장 많은 시기가 ‘한국시리즈‘가 열린 11월에 집중되어 있었으며, 단어 간의 관계를 파악하는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’과 ‘연이은 단어 쌍 분석(n-gram analysis)’에서 이런 경향이 매우 두드러졌다. ‘롯데’의 언론보도 행태는 ‘선수‘와 ‘타 구단‘의 비중이 높았다. 일별 기사량이 가장 많은 상위 3개 날짜 모두 선수, 타 구단과 관련 있었으며, 이는 ‘단어 동시 출현 빈도 분석(co-occurrence analysis)’ 이러한 경향이 강하게 드러났다.
더보기The purpose of this study is to examine how Korean sports media are reporting KBO participating clubs. For the Study, we planned to conduct a comparative analysis of articles using text mining. ‘NC Dinos’ and ‘Lotte Giants’ were decided to analyze articles. Only articles provided by Naver Sports were collected for data to be used in the study. The collected data was analyzed in three main ways. The first way is to track the trend of article volume by period. Articles from a period when the monthly and daily article volume is particularly high will be checked by word cloud. The second way is sentiment analysis, examine including monthly sentiment trends and 2-sample test for equality of proportions in positive and negative. The third way is network analysis, and a total of three relational analyzes are performed: co-occurrence analysis, coefficient analysis, and n-gram analysis. In conclusion, the press reporting trend of ‘NC’ has a strong tendency to focus on ‘ranking’. The period with the highest amount of monthly and daily articles was concentrated in November, when ‘Korea Series’ was held. This trend was very prominent in ‘co-occurrence analysis’, ‘co-occurrence analysis’, ‘coefficient analysis’, and ‘n-gram analysis,’ which identifies the relationship between words. Press reporting trend of ‘Lotte’ had a high proportion of ‘players’ and ‘other clubs’. All of the top 3 dates with the highest daily article volume were related to players and other clubs, and this trend was stronger than ‘NC’ in ‘co-occurrence analysis’ and ‘co-occurrence analysis’.
더보기분석정보
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 유지 (재인증) | KCI등재 |
2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | KCI등재 |
2013-01-01 | 평가 | 등재학술지 유지 (등재유지) | KCI등재 |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | KCI등재 |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | KCI등재 |
2005-01-01 | 평가 | 등재학술지 선정 (등재후보2차) | KCI등재 |
2004-01-01 | 평가 | 등재후보 1차 PASS (등재후보1차) | KCI후보 |
2002-07-01 | 평가 | 등재후보학술지 선정 (신규평가) | KCI후보 |
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 1.26 | 1.26 | 1.15 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
1.05 | 0.98 | 0.956 | 0.4 |
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)