맥락정보를 이용한 기록 자동분류시스템 설계
저자
발행사항
서울 : 명지대학교 기록정보과학전문대학원, 2009
학위논문사항
학위논문(석사)-- 명지대학교 기록정보과학전문대학원 : 기록관리전공 2009. 2
발행연도
2009
작성언어
한국어
주제어
DDC
025.171 판사항(22)
발행국(도시)
서울
형태사항
vi, 83 p. ; 26cm
일반주기명
명지대학교 논문은 저작권에 의해 보호받습니다.
지도교수:이해영
참고문헌 : p.77-80
소장기관
There have been continuous researches in various fields to study the automatic classification of documents to increase the quality of classification as if such classification is done by people while minimizing our efforts because the limits of manual classification have been revealed at the same time along with productions of massive web-based resources or electronic documents. However, there is little research on the automatic classification of records in the records and archives studies up to now. The awareness of importance on the records with the computerization of business has brought us the rising production of records while strategies have been established to include paper records, email records, web records and others in the management of records, which have not been managed in the record management system until now. Facing such circumstances, the project to look for possibilities of automatic records classification is thought to be a useful task in practice.
There exist various gaps for the automatic records classification to adopt those methods to automatically classify documents as they were, since they have been studied around the library information or knowledge information. The most fundamental difference lies in that the classification in the records and archives studies focuses on the contextual information in producing and utilizing records rather than their contents while the general classification emphasizes the contents of documents. Subsequently, this study aimed at designing an automatic records classification system to enable an automatic classification focusing on the aggregational context of records rather than the contents of individual record in the classification scheme structured on the basis of business activities analyses for records reflecting the business activities. The key features of the designed automatic records classification system are as follows.
It is proposed that the contextual information should be established as the classification reference. Rather than the classification is carried out with using similarities in the contents of documents as reference to determine what category should classify records appropriately, it is designed to perform the classification by calculating both how much records to be classified are sharing the contextual information of each classification category and how much the contextual information represents the classification category.
The contextual information used in the classification is the information to best express the content, structure and context of records under the demonstration of specialties by business managers or record managers in accordance with rules or business guidelines. The use of such information in the automatic classification ensures the system to enhance the accuracy of classification and provide foundations to simply design the classification methods.
Records of other organizations cannot be used in classifying records using not any standard classification scheme but the classification scheme unique to the organization although there occurs serious unbalance in the classification reference by category from uncertain number of records in the existing classification by category. This is worsening the quality of any automatic classification. In order to solve such problem, the automatic records classification system was designed to have mutual supplements by constructing the classification scheme and thesaurus together as the classification reference, as well as the aggregation of records that have been already classified. Also, additionally included are plans to apply the classified contextual information of records to the classification reference on the real-time base right after the category assignment of records to be classified.
Possibilities of automatic classification for records could be found through this study, which has not been introduced in the records and archives studies so far. The automatic records classification system is expected to make contributions to securing the objectivity based on the preparations of objective classification standards along with the business efficiency and convenience of either business managers or record managers if it is actually constructed.
대량의 웹 자원이나 전자문서가 생산되면서 수작업 분류의 한계를 드러냄과 동시에 사람의 노력을 최소화하면서 마치 사람이 분류하듯이 분류 품질을 높이고자 하는 문서 자동분류에 대한 연구가 여러 분야에서 꾸준히 진행되어 왔다. 하지만 아직까지 기록학 분야에서 기록의 자동분류에 대한 연구는 미비한 실정이다. 업무의 전산화와 기록의 중요성에 대한 자각은 기록 생산의 증대를 가져왔으며 그동안 기록관리시스템으로 관리되고 있지 않았던 종이기록이나 이메일기록, 웹기록 등을 기록관리 대상에 포함시키려는 전략이 수립되고 있다. 이러한 때 기록 자동분류의 가능성을 찾는 작업은 실무적으로 유용한 과제라 할 수 있다.
지금까지 문헌정보나 지식정보를 중심으로 연구되어 온 문서 자동분류방법을 그대로 기록의 자동분류에 적용하기에는 여러 간극이 존재한다. 가장 근본적인 차이점은 일반적인 문서의 분류는 문서의 내용에 초점을 두지만 기록학에서의 분류는 기록 자체의 내용보다는 기록이 생산되고 활용되는 맥락에 초점을 둔다는 사실이다. 이에 따라 업무활동이 반영된 기록을 업무활동 분석에 기반하여 구축된 분류체계에 개별 기록의 내용이 아닌 기록의 집합적 맥락을 중심으로 자동분류 할 수 있는 기록 자동분류시스템을 설계하였다. 설계한 기록 자동분류시스템의 핵심 사항은 다음과 같다.
맥락정보를 분류기준으로 설정할 것을 제안하였다. 분류대상기록을 어느 범주로 분류하는 것이 적합한지 판단하는 기준으로 문서의 내용의 유사성을 이용해 분류하는 것이 아니라, 분류대상기록이 각 분류범주의 맥락정보를 얼마나 공유하고 있고 그 맥락정보는 분류범주를 얼마나 대표하고 있는지를 계산하여 분류를 수행할 수 있도록 설계하였다.
분류에 이용한 맥락정보는 규칙이나 업무지침에 따라 업무담당자나 기록관리자가 자신의 전문성을 발휘하여 기록의 내용, 구조, 맥락을 가장 잘 표현하고자 한 정보이다. 이를 기록의 자동분류에 이용하는 것은 분류의 정확도를 향상시켜 주고 분류방법을 간단하게 설계할 수 있는 토대를 제공한다.
표준 분류체계가 아닌 기관 고유의 분류체계를 사용하는 기록의 분류에서는 범주별 기 분류된 기록의 수가 일정하지 않아 각 범주별 분류기준에 심한 불균형이 발생하더라도 타 기관의 기록을 이용할 수 없다. 이것은 자동분류의 품질에 악영향을 가져온다. 이러한 점을 해결하고자 기 분류된 기록집합체뿐 아니라 분류체계와 시소러스를 분류기준으로 같이 구축하여 상호보완 할 수 있도록 기록 자동분류시스템을 설계하였다. 추가적으로 분류대상기록의 범주를 할당한 후 바로, 분류된 기록의 맥락정보를 실시간으로 분류기준에 반영할 수 있는 방안도 포함시켰다.
본 연구를 통해 아직까지 기록학 분야에서 도입하지 않고 있었던 기록의 자동분류에 대한 가능성을 찾을 수 있었다. 기록 자동분류시스템이 실제로 구축된다면 업무담당자나 기록관리자의 업무 효율성과 편의성, 객관적 분류기준 마련에 의한 객관성을 확보하는데 기여할 것으로 기대된다.
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)