KCI등재
근대 신문자료 공간분석을 위한디지털인문학 워크 플로우― 『황성신문』(1898~1904) 잡보란 일본 관련 기사를 중심으로 = A Digital Humanities Workflow for the Spatial Analysis of Modern Korean Newspapers― Focusing on Japan-Related Articles in the Miscellany Section of Hwangseong Sinmun (1898~1904)
저자
전성규 (가천대학교)
발행기관
학술지명
권호사항
발행연도
2026
작성언어
Korean
주제어
등재정보
KCI등재
자료형태
학술저널
수록면
209-258(50쪽)
DOI식별코드
제공처
논문은 『황성신문』 창간호부터 1904년 12월 30일까지 일본 관련 잡보란 기사를 대상으로 원시 코퍼스의 구조화, 토픽모델링, 개체명 인식 그중 지명 태깅, QGIS를 활용한 공간 시각화 과정까지의 워크플로우를 제시하고 이를 통해 일본의 대한정책이 공간 점유와 긴밀히 연동하는 과정을 검토하고자 하였다.
분석은 다음과 같은 단계를 거쳐 이루어졌다. 우선 한글파일로 입력된 원시 코퍼스를 분석 가능한 형태로 변환하기 위해 정규화 과정을 거친 후, 날짜, 제목, 본문을 순차적으로 추출하는 방식으로 파싱을 진행하였다. 본격적인 분석은 토픽모델링을 통한 주제적 분포 확인, 개체명 인식(NER)을 활용한 태깅, 지역명(LC) 정보를 보완, 관련 데이터셋을 재구축하여 지리정보처리 도구 QGIS를 활용해 시기별 공간 분포에 대한 변화를 추적하였다. 이미 원시코퍼스 단계에서부터 주요 토픽이 설정되었기 때문에 토픽모델링은 분석 대상이 되는 전체 1,679개 기사의 주제 지형도를 확인하는 차원에서 보조적으로 사용하였다. 연도별과 월별로 기사 빈도표를 작성하고 농업, 임업, 어업 관련한 기사 등장 연월 구분표를 작성하여 계절별로 수탈 물자와 장소가 변화하는 양상을 지도 자료로 시각화하였다. 또한 1898년부터 1904년까지 기사 중 시간이 구체적으로 언급된 기사를 대상으로 타임라인을 작성하여 1904년 러일전쟁을 전후로 하여 시간적 리듬에 변화가 발생함을 관찰하였다.
1898년부터 1904년까지 일본의 대한정책 관련 잡보 기사에서 언급된 지명을 지도상에 표시한 결과, 점의 분포가 해안가를 따라 집중적으로 생성된 후 내륙으로 점차 들어오며 한반도 전역을 뒤덮는 양상을 띠고 있음을 확인할 수 있다. 이러한 결과는 1904년 무렵 이미 일본의 식민화 과정이 상당부분 이뤄졌다고 판단할 수 있는 근거가 될 수 있다.
특히 러일전쟁 시기 기사를 공간적으로 분석한 결과 평양-함흥-단천-길주를 잇는 최북단 연결선을 중심으로 일본과 러시아가 형성한 전선, 일본의 한반도 장악 범위를 확인할 수 있다. 평안북도 의주, 함경북도 경성 등지는 러시아군의 근거지로 활용되는 곳이었고 북진하는 일본군과 남하한 러시아군이 정주, 영변, 박천, 성진 등지에서 국지적 교전을 벌이며 세력을 다퉜다.
1904년 7월을 전후로 서울 종로에서는 보안회를 중심으로 조직화된 형태의 저항이 등장하였으며 압록강 일대에서는 저항군이 통신선, 철도 노선을 차단하는 등 게릴라 활동을 전개하였다. 1904년까지의 시기는 일본의 군사적, 행정적 공간 점유가 집중적으로 전개된 시기로 그 일방성과 폭력성, 가속성 속에서 조선 사회 전반이 구조적인 충격을 경험하였다. 하지만 1904년 7월 이후로 가면 이에 대응하는 조선인의 다양한 형태의 저항이 맞물리며 공간적 동역학이 본격화하는 양상을 확인할 수 있다.
This article proposes a digital humanities workflow encompassing corpus structuring, topic modeling, named entity recognition―specifically place-name (LC) tagging―and spatial visualization using QGIS, based on Japan-related articles in the miscellany section of Hwangseong Sinmun from its inaugural issue through December 30, 1904. Through this workflow, the study examines how Japan's Korea policy was closely intertwined with processes of spatial occupation.
The analysis proceeded through several stages. First, the raw corpus, originally entered as Hangul text files, was normalized and parsed into analyzable units by sequentially extracting dates, titles, and main text. The core analytical process then consisted of identifying thematic distributions through topic modeling, applying named entity recognition (NER) for tagging, supplementing and correcting place-name (LC) information, reconstructing the dataset, and tracing temporal changes in spatial distributions using the geographic information processing tool QGIS. Because key thematic domains had already been delineated at the raw corpus stage, topic modeling was employed primarily as an auxiliary method to obtain an overview of the thematic landscape of the entire set of 1,679 articles. Frequency tables by year and month were compiled, along with monthly distributions of articles related to agriculture, forestry, and fisheries, enabling visualization of seasonal shifts in extracted resources and their locations. In addition, a timeline was constructed using articles that explicitly referenced dates and times, revealing a noticeable change in temporal rhythm around the outbreak of the Russo-Japanese War in 1904.
When the place names mentioned in Japan-related miscellany articles from 1898 to 1904 were plotted on a map, the resulting distribution showed a pattern in which points initially clustered along coastal areas and then gradually expanded inland, eventually covering the entire Korean Peninsula. This spatial pattern suggests that by around 1904, Japan's colonialization process had already progressed to a considerable extent.
Spatial analysis of articles from the Russo-Japanese War period further reveals a northernmost line connecting Pyongyang, Hamheung, Dancheon, and Gilju, corresponding to the frontline formed between Japanese and Russian forces and indicating the extent of Japanese control over the peninsula. Areas such as Uiju in Pyeonganbuk-do and Gyeongseong in Hamgyeongbuk-do functioned as Russian strongholds, while advancing Japanese forces and southward-moving Russian troops engaged in localized battles in regions including Jeongju, Yeongbyeon, Bakcheon, and Seongjin.
Around July 1904, organized resistance emerged in Seoul's Jongno district, centered on the Boanhoe (Security Association), while guerrilla activities intensified along the Yalu River, where resistance groups sabotaged communication lines and railway routes. Up to 1904, Japan's military and administrative occupation of space unfolded with marked unilaterality, violence, and rapid acceleration, producing profound structural shocks across Korean society. From mid-1904 onward, however, these processes increasingly intersected with diverse forms of Korean resistance, giving rise to a more dynamic and contested spatial configuration.
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
| 주요 개정내역 | 변경 사유 |
|---|---|
| · 수탁업체 콘소시엄 기관명 및 위탁기간 명시 | · 제6조(개인정보 처리업무의 위탁) 구체화 |
한국교육학술정보원은 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
제1조(개인정보의 처리 목적)
제2조(개인정보의 처리 및 보유 기간)
제3조(처리하는 개인정보의 항목)
제4조(개인정보파일 등록 현황)
제5조(개인정보의 제3자 제공)
제6조(개인정보 처리업무의 위탁)
제7조(개인정보의 파기 절차 및 방법)
제8조(정보주체와 법정대리인의 권리·의무 및 그 행사 방법)
제9조(개인정보의 안전성 확보조치)
제10조(개인정보 자동 수집 장치의 설치·운영 및 거부)
제11조(개인정보 보호책임자)
제12조(개인정보의 열람청구를 접수·처리하는 부서)
제13조(정보주체의 권익침해에 대한 구제방법)
제14조(추가적 이용·제공 판단기준)
제15조(개인정보 처리방침의 변경)
제1조(개인정보의 처리 목적)
제2조(개인정보의 처리 및 보유 기간)
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)
제3조(처리하는 개인정보의 항목)
제4조(개인정보파일 등록 현황)
개인정보파일 검색(privacy.go.kr)| 개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 |
보유기간 | |
|---|---|---|---|---|
| 학술연구정보서비스 이용자 가입정보 | 한국교육학술정보원법 정보추제 동의 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
| 선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 | |||
제5조(개인정보의 제3자 제공)
제6조(개인정보 처리업무의 위탁)
제7조(개인정보의 파기 절차 및 방법)
제8조(정보주체와 법정대리인의 권리·의무 및 그 행사 방법)
제9조(개인정보의 안전성 확보조치)
제10조(개인정보 자동 수집 장치의 설치·운영 및 거부)
제11조(개인정보 보호책임자)
| 구분 | 담당자 | 연락처 |
|---|---|---|
| KERIS 개인정보 보호책임자 | 정보보호본부 안재호 |
- 이메일 : jinuk@keris.or.kr - 전화번호 : 053-714-0158 - 팩스번호 : 053-714-0195 |
| KERIS 개인정보 보호담당자 | 개인정보보호부 송진욱 | |
| RISS 개인정보 보호책임자 | 교육학술데이터본부 정광훈 |
- 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
| RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
제12조(개인정보의 열람청구를 접수·처리하는 부서)
제13조(정보주체의 권익침해에 대한 구제방법)
제14조(추가적인 이용ㆍ제공 판단기준)
제15조(개인정보 처리방침의 변경)
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)