데이터 과학 교육을 위한 데이터 전처리 교육 프로그램에 관한 연구
저자
발행사항
서울 : 성균관대학교 일반대학원, 2023
학위논문사항
학위논문(석사)-- 성균관대학교 일반대학원 : 컴퓨터교육학과 2023. 8
발행연도
2023
작성언어
한국어
주제어
발행국(도시)
서울
기타서명
A study on the data preprocessing education program for data science education
형태사항
viii, 139 p. : 삽화 ; 30 cm
일반주기명
지도교수: 안성진
참고문헌: p. 80-83
UCI식별코드
I804:11040-000000175306
DOI식별코드
소장기관
현대 사회는 정보통신기술의 급속한 발전으로 산업 전 영역에서 폭발적으로 데이터가 생성되면서 데이터로부터 가치를 발견하여 데이터를 이해하고 분석하는 능력이 중요시됨에 따라 데이터 과학 교육에 대한 중요성이 강조되었다. 이러한 시대의 흐름을 반영하듯 2022 개정 교육과정에서는 기존의 정보 교과의 핵심 역량 중 하나로 데이터 문해력을 선정하고 고등학교 진로 선택과목으로 데이터 과학 과목을 신설하였다. 데이터 전처리는 오픈 데이터를 데이터 분석 및 기계학습에 활용하기 전 데이터의 품질을 높이기 위한 사전 과정을 의미한다. 수집한 오픈 데이터를 사전 가공 없이 데이터 분석에 바로 활용할 수 없으므로 실제 데이터 과학 교육에서 중요도가 높다. 하지만 데이터 전처리는 인공지능, 데이터 과학이라는 큰 주제 안에서 부분적으로 활용하는 정도에 그쳐 그 중요성에 비해 자세히 교육하지 못하는 경우가 많다.
따라서 데이터 과학 교육에 적용할 수 있는 파이선 기반의 데이터 전처리 교육 프로그램을 개발하였다.
이 논문에서의 연구 결과를 요약하면 다음과 같다.
첫째, 데이터 전처리 방법론에 관한 선행 연구 고찰을 통해 데이터 전처리 방법을 4개의 대주제로 분류하였다. 기존의 데이터 전처리 교육에 관한 선행 연구 고찰과 2022 개정 교육과정의 성취기준 분석을 통해 데이터 전처리 교육을 위한 세부 학습 주제를 제안하였다. 이는 데이터 전처리를 처음 접하는 학습자가 전처리 과정을 실습하는 데 도움이 되고, 교수자가 데이터 전처리 수업을 설계하는 데 가이드라인으로 사용될 수 있다.
둘째, 데이터 과학 교육을 위한 파이선 기반의 데이터 전처리 교육 프로그램을 개발하였다. 학습자가 파이선 프로그래밍을 통해 데이터 전처리 과정을 실제 경험하고 데이터 가공 능력을 함양할 수 있도록 설계하였다. 이는 수업을 통해 수집한 오픈 데이터를 학습자가 스스로 가공하여 데이터 과학 프로젝트에 활용할 수 있는 초석을 마련하는 데 도움이 될 것이다.
셋째, 교육 프로그램과 설계 과정 및 전문가 타당화 도구에 대한 FGI를 진행하였고, 검토 결과를 반영한 정보 교사 설문을 진행한 결과 모든 항목에서 타당도와 신뢰도를 확보하였으며 개방형 문항을 통해 다양한 의견을 논의하였다. 결론적으로 교육 프로그램이 데이터 전처리 교육을 위해 유용하게 활용될 수 있음을 보였다.
이 논문 데이터 과학 교육을 위해 파이선 프로그래밍 기반의 데이터 전처리 교육 프로그램을 개발하여 데이터 전처리 교육이 어떻게 데이터 전처리 교육이 어떻게 이루어져야 하는지에 대한 방향을 제시할 수 있다. 이러한 연구 결과로 개발한 교육 프로그램 통해 학습자의 데이터 가공 능력이 향상되어 데이터 분석 및 활용 능력이 신장할 계기가 될 것으로 기대된다.
With the rapid advancement of information and communication technology in modern society, there has been an explosive generation of data across all industries. As a result, the ability to discover value from data, understand it, and analyze it has become increasingly important, highlighting the significance of data science education. Reflecting this trend, the revised 2022 curriculum has designated data literacy as one of the core competencies in the existing information curriculum and introduced data science as an elective subject in high school career selection.
Data preprocessing refers to the preliminary process of enhancing data quality before utilizing open data for data analysis and machine learning. Since collected open data cannot be directly utilized for data analysis without prior processing, data preprocessing holds great importance in practical data science education. However, despite its significance, it often receives limited attention and detailed instruction within the broader subjects of artificial intelligence and data science.
Therefore, a Python-based data preprocessing education program applicable to data science education has been developed.
The following is a summary of the research results in this paper.
First, through a review of previous studies on the data preprocessing methodology, the data preprocessing method was classified into four main themes. Detailed learning topics for data preprocessing education were proposed through a review of previous studies on existing data preprocessing education and analysis of achievement standards for the 2022 revised curriculum. This helps learners who are new to data preprocessing practice the preprocessing process, and can be used as guidelines for instructors to design data preprocessing classes.
Second, a Python-based data preprocessing education program was developed for data science education. It is designed so that learners can actually experience the data preprocessing process and cultivate data processing skills through Python programming. This will help lay the foundation for learners to process open data collected through classes on their own and use it in data science projects.
Third, FGI was conducted on educational programs, design processes, and expert validation tools, and information teacher surveys reflecting the results of the review secured validity and reliability in all items, and various opinions were discussed through open questions. In conclusion, it was shown that education programs can be useful for data preprocessing education.
In this paper, we can develop a Python programming-based data preprocessing training program for data science training to give directions on how data preprocessing training should be conducted. Through the educational program developed as a result of these studies, it is expected that learners' data processing ability will be improved, which will serve as an opportunity to increase their data analysis and utilization ability.
분석정보
서지정보 내보내기(Export)
닫기소장기관 정보
닫기권호소장정보
닫기오류접수
닫기오류 접수 확인
닫기음성서비스 신청
닫기음성서비스 신청 확인
닫기이용약관
닫기학술연구정보서비스 이용약관 (2017년 1월 1일 ~ 현재 적용)
학술연구정보서비스(이하 RISS)는 정보주체의 자유와 권리 보호를 위해 「개인정보 보호법」 및 관계 법령이 정한 바를 준수하여, 적법하게 개인정보를 처리하고 안전하게 관리하고 있습니다. 이에 「개인정보 보호법」 제30조에 따라 정보주체에게 개인정보 처리에 관한 절차 및 기준을 안내하고, 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리방침을 수립·공개합니다.
주요 개인정보 처리 표시(라벨링)
목 차
3년
또는 회원탈퇴시까지5년
(「전자상거래 등에서의 소비자보호에 관한3년
(「전자상거래 등에서의 소비자보호에 관한2년
이상(개인정보보호위원회 : 개인정보의 안전성 확보조치 기준)개인정보파일의 명칭 | 운영근거 / 처리목적 | 개인정보파일에 기록되는 개인정보의 항목 | 보유기간 | |
---|---|---|---|---|
학술연구정보서비스 이용자 가입정보 파일 | 한국교육학술정보원법 | 필수 | ID, 비밀번호, 성명, 생년월일, 신분(직업구분), 이메일, 소속분야, 웹진메일 수신동의 여부 | 3년 또는 탈퇴시 |
선택 | 소속기관명, 소속도서관명, 학과/부서명, 학번/직원번호, 휴대전화, 주소 |
구분 | 담당자 | 연락처 |
---|---|---|
KERIS 개인정보 보호책임자 | 정보보호본부 김태우 | - 이메일 : lsy@keris.or.kr - 전화번호 : 053-714-0439 - 팩스번호 : 053-714-0195 |
KERIS 개인정보 보호담당자 | 개인정보보호부 이상엽 | |
RISS 개인정보 보호책임자 | 대학학술본부 장금연 | - 이메일 : giltizen@keris.or.kr - 전화번호 : 053-714-0149 - 팩스번호 : 053-714-0194 |
RISS 개인정보 보호담당자 | 학술진흥부 길원진 |
자동로그아웃 안내
닫기인증오류 안내
닫기귀하께서는 휴면계정 전환 후 1년동안 회원정보 수집 및 이용에 대한
재동의를 하지 않으신 관계로 개인정보가 삭제되었습니다.
(참조 : RISS 이용약관 및 개인정보처리방침)
신규회원으로 가입하여 이용 부탁 드리며, 추가 문의는 고객센터로 연락 바랍니다.
- 기존 아이디 재사용 불가
휴면계정 안내
RISS는 [표준개인정보 보호지침]에 따라 2년을 주기로 개인정보 수집·이용에 관하여 (재)동의를 받고 있으며, (재)동의를 하지 않을 경우, 휴면계정으로 전환됩니다.
(※ 휴면계정은 원문이용 및 복사/대출 서비스를 이용할 수 없습니다.)
휴면계정으로 전환된 후 1년간 회원정보 수집·이용에 대한 재동의를 하지 않을 경우, RISS에서 자동탈퇴 및 개인정보가 삭제처리 됩니다.
고객센터 1599-3122
ARS번호+1번(회원가입 및 정보수정)