제목 | Power Query 실무 활용 테크닉 | ||
---|---|---|---|
역량 | Business IT | 구분 | 데이터 분석, 시각화 |
과정번호 | WT-190903 | 등급 | 고급 |
주/야 | 기간 | 일수 | 교육시간 | 환급여부 | 교육비 | 환급금액 우선대상 (대기업) |
신청 |
---|---|---|---|---|---|---|---|
주간 | 2025-06-12 ~ 2025-06-13 (09:00~18:00) |
2 일 | 16 시간 | 비환급 |
₩600,000 교육쿠폰: 3일 |
₩0 (₩0) |
교육개요 |
데이터가 편만한 시대에 살고 있으며, 데이터를 가치 있는 값으로 만들어 낼 수 있는 능력이 기본이 되고 있다. 그러나 처리해야 하는 데이터의 종류는 다양하며, 정돈되어 있지 않다. 그 데이터가 유의미한 값이 되기까지 꼭 필요한 작업이 데이터를 정돈하는 것이다. 이 과정은 데이터 분석에서 80%까지 소요된다는 데이터 클리닝 과정을 확 줄이는 것을 목표로 한다. 파워 쿼리가 당신에게 필요한 데이터를 다양한 곳으로부터 쉽게 수집, 빠른 시간에 정돈하여 원하는 곳으로 로드할 수 있도록 할 것이다. 그 결과 당신의 분석 시간과 결과의 질을 한껏 높여 줄 것으로 기대한다. |
---|---|
교육대상 |
많은 양의 데이터를 처리 및 관리하는 분들 다양한 곳(웹, 엑셀, 데이터베이스, SNS 등)에서 데이터를 수집하려는 분들 - 특히 웹 자료의 수집(Crawling)이 빈번한 분들 수집한 데이터를 편집하는 과정에 많은 시간을 보내는 분들 데이터 분석의 과정에서 데이터를 준비하는 역할을 담당하는 분들 |
1일차
1. 파워 쿼리 개요
- ETL 프로그램이란?
- 쿼리 편집기 소개
- M-Script 소개
- 쿼리 편집기로 데이터 클리닝한 사례 소개
2. 데이터 크롤링
- 웹 정보를 크롤링하는 방법으로 보는 파워 쿼리의 작업 흐름
- 고급 편집기에 기록된 M-Script 문
- [새로 고침] 클릭으로 어제 정보는 오늘의 정보로 바뀌는 파워 쿼리의 기적
3. 다양한 프로그램 파일의 데이터 수집 및 로드
- 엑셀에 모든 시트의 데이터를 하나로 추출
- 관계형 데이터베이스에서 필요한 테이블 추출
- CSV/텍스트에서 내용 추출
- 폴더에서 여러 종류의 파일을 하나로 추출
- 생성하여 테이블을 쿼리 병합 및 추가 기능으로 하나로
4. 데이터 클리닝 및 전처리
- 중복(Duplicate) 행 처리
- 결측 값(Missing Value) 처리, 이상치(Outlier) 제거
- 텍스트 나누기 및 병합
- 열 피벗 해제
- 새로운 변수 추가를 위한 다양한 새 열 추가 방법
- 테이블 요약(집계)
5. 고급 쿼리
- 두 개 이상의 쿼리(테이블)의 조인
- 매개 변수 생성 및 활용한 수집 및 편집의 자동화
- 기록한 과정을 함수로 변환하여 수집 및 편집의 자동화
- MS 도움말 활용법
2일차
1. M Script
- 정의
- 구조: Let구문(표현)
- 단계별 편집
- 고급 편집기 읽기
- ‘원본’ 경로 수정 요령
2. M Script ‘값’ 종류 및 생성 방법
- 값(Primitive)
- 리스트(List)
- 레코드(Record)
- 테이블(Table)
- 함수(Function)
- 바이너리(Binary)
3. M Function
- ‘= #shared’으로 전체 리스트를 DB로 만들어 함수 목록 확인
- 파워 쿼리에 새로운 함수 생성하여 등록
4. 쿼리 편집 및 데이터 검색
- 쿼리 삭제 및 복제
- 검색: Square Brackets [ ]
5. 새로운 열 생성
- 인덱스 열
- 조건 열 and 조건 문: If then Else
- 사용자 지정 열
6. 구체적인 활용 사례
- 이전 행 값 얻어 ‘어제와의 차이’ 계산
- [그룹화] 활용하여 관련 item 뽑아 새로운 열로 구성
- 기록된 변형 과정을 [함수로 전환]하여 다른 작업에 재활용
- HTML 탐색하여 웹 정보 가져오는 요령
- 웹 데이터 크롤링 시 [매개 변수]를 만들어 반복 작업 해결