맵리듀스 기반 분산 워크플로우 이벤트 로그 패턴 클러스터링 프레임워크
저자
발행사항
수원 : 경기대학교 대학원, 2019
학위논문사항
학위논문(석사)-- 경기대학교 대학원 : 컴퓨터과학과 2019. 2
발행연도
2019
작성언어
한국어
주제어
발행국(도시)
경기도
기타서명
MapReduce-based distributed workflow event log pattern clustering framework
형태사항
ⅸ, 61 p. : 삽도 ; 26 cm
일반주기명
경기대학교 논문은 저작권에 의해 보호받습니다.
지도교수:김광훈
참고문헌 : p. 56-59
UCI식별코드
I804:41002-000000054139
소장기관
A workflow is a stream of serial tasks for performing business processes. It defines a stream of tasks that occur within an organization or enterprise, effectively allocates the resources required for the task, and ensures that tasks can be performed automatically within a set amount of time to be.
Recently, the complexity of workflow processes is rapidly increasing as organizations and companies are becoming larger. Accordingly, many organizations have introduced distributed workflow management systems that perform process management such as execution, monitoring, logging, and analysis of workflow processes in a distributed computing environment in order to efficiently manage large-scale workflow processes. As a result of these changes, workflow mining techniques for discovering the control flow of the process model and performer information from the event log which is the result of process execution are becoming important as techniques for optimizing a large-scale workflow process based on distributed environment. Workflow mining consists of preprocessing workflow event logs and rediscovering workflow intelligence by applying various mining algorithms.
In this paper, we define a process-aware data cube conceptually as a method for efficiently preprocessing large event logs generated in a distributed workflow execution environment. Also, we design and implement a MapReduce-based distributed workflow event log pattern clustering framework. In other words, a process-based data cube is a concept for integrating and managing distributed event logs, and conceptually defines a workcase, a work-transference, and a role-transition data cube as its detailed types. The event log pattern clustering tool based on these data cubes effectively clusters the workflow process control flow and resource point of view patterns using MapReduce.
In this paper, we perform pattern clustering using the BPI Challenge data set published in 4TU as a verification step of the proposed framework. As a result, the proposed framework is expected to be useful for event log preprocessing for mining distributed environment workflow processes.
워크플로우는 비즈니스 프로세스를 수행하기 위한 일련의 업무 흐름으로, 조직 또는 기업 내에서 발생하는 일련의 업무들을 정의하고 업무에 필요한 자원을 효과적으로 할당하여 정해진 시간 내에 업무가 자동적으로 수행될 수 있도록 보장하는 기술이다. 워크플로우는 프로세스 모델링과 워크플로우 마이닝으로 나누어 볼 수 있다. 프로세스 모델링은 워크플로우 모델링 도구를 이용하여 업무의 흐름을 정의하는 것을 말한다. 프로세스 모델링을 표현하기 위한 방법으로는 패트리넷 모델과 정보제어넷 모델이 있다. 워크플로우 마이닝은 프로세스 모델링 도구로부터 정의된 모델을 워크플로우 엔진에서 수행함으로써 얻어지는 이벤트 로그로부터 다양한 인텔리전스를 발견하는 것을 말한다. 워크플로우 마이닝에는 대표적으로 업무의 제어흐름을 발견하는 제어흐름 마이닝, 업무를 수행하는 수행자들 간에 관계를 발견하는 소셜 네트워크 마이닝 등이 있다.
최근 조직 및 기업의 규모가 대규모화되면서 워크플로우 프로세스의 복잡성 또한 빠르게 증가하고 있다. 이에 따라, 대규모 워크플로우 프로세스를 효율적으로 관리하기 위해 워크플로우 프로세스의 실행, 모니터링, 로깅, 그리고 분석 등의 프로세스 관리 활동들을 분산 컴퓨팅 환경 위에서 수행하는 분산 워크플로우 관리 시스템이 많은 조직에서 도입되고 있다. 이러한 변화에 따라, 분산 환경 기반 대규모 워크플로우 프로세스를 최적화하기 위한 기술로서, 프로세스의 수행 결과인 이벤트 로그로부터 프로세스 모델의 제어흐름 및 수행자 정보를 발견하는 워크플로우 마이닝 기술이 중요해지고 있다. 워크플로우 마이닝은 워크플로우 이벤트 로그를 전처리하는 단계와 다양한 마이닝 알고리즘을 적용하여 워크플로우 인텔리전스를 재발견하는 단계로 이루어진다.
본 논문에서는 분산 워크플로우 수행 환경에서 발생한 대규모 이벤트 로그를 효율적으로 전처리하기 위한 방법으로서, 프로세스 기반 데이터 큐브를 개념적으로 정의하고, 맵리듀스 기반 분산 워크플로우 이벤트 로그 패턴 클러스터링 프레임워크를 설계 및 구현한다. 즉, 프로세스 기반 데이터 큐브는 분산된 이벤트 로그들을 통합 및 관리하기 위한 개념이며, 이의 세부 유형으로서 워크케이스, 업무전달, 그리고 역할전이 데이터 큐브를 개념적으로 정의한다. 이러한 데이터 큐브를 기반으로 하는 이벤트 로그 패턴 클러스터링 도구는 분산 처리 기술인 맵리듀스를 바탕으로 워크플로우 프로세스 제어흐름 및 자원 관점의 패턴들을 효과적으로 클러스터링을 수행한다. 제안 프레임워크의 검증 단계로서, 4TU에서 공개한 이벤트 로그인 BPI Challenge 데이터 세트에 대해서 패턴 클러스터링을 수행한다. 결과적으로, 제안 프레임워크는 분산 기반 워크플로우 프로세스를 마이닝 하기 위한 이벤트 로그 전처리 작업에 유용하게 쓰일 것으로 기대된다.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)