- 조직이 데이터 기반 의사 결정을 빠르게 할 수 있도록 돕는 비즈니스 분석, 데이터 마이닝, 데이터 시각화 등 도구
- BI 도구를 활용해 드래그앤 드랍으로 손쉽게 데이터 분석 및 시각화 가능(노 코드 툴)
2) 일상 속 데이터기반 의사결정
- 예시) 인포그래픽, 건강앱 메인 대시보드, 기상청 날씨예보 등
통계청 인포그래픽
3) 실무 BI 프로세스 - (현실) 각 팀마다 흩어져있는 Excel 데이터 트래킹 (이상) 전사 BI 자동화 작업을 통한 전체 대시보드 활용
- 현업에서는 Ad-hoc 업무가 많고, 각 팀이나 담당자에게 수많은 업무 요청이 들어옴
└ Ad-hoc 업무는 한 번 쓰이고 버려지는 업무로 주로 데이터 추출이나 쿼리 작성 등 업무를 일컫음
- 대시보드 생성을 위해 어떤 지표를 추가하면 좋을지 타 팀과 싱크를 맞추고, 데이터 엔지니어와 커뮤니케이션도 필요
4) BI 워크 플로우
- 데이터 인프라: 데이터 레이크 → 데이터 웨어하우스 → 데이터 마트 → BI 툴
└ 데이터 레이크: 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등) 저장할 수 있는 스토리지
└ 데이터 웨어하우스(DW): 데이터를 장기적인 보존용으로 통합, 정제, 분석하여 정리한 저장소
· 예시) AWS Redshift, Snowflake, Google Bigquery └ 데이터 마트(DM): 부서별, 목적별 분석용으로 만든 데이터 웨어하우스의 데이터 일부분
- BI 설계 및 생성 내 주요 담당자
└ 데이터 마트 설계 및 구축: 데이터 엔지니어/백엔드 엔지니어/Analytics Engineer/BI 엔지니어 등
└ 대시보드 구축: 데이터 분석가/BI 분석가 등
└ 대시보드 뷰어: 경영진/Product Owner/Product Manger 등
5) 왜 Tabelau인가?
① 장점 - Excel, CSV, 스프레드시트 등 다양한 형식의 파일을 대시보드로 생성해 쉽게 공유 가능 - 손쉬운 Drag & Drop으로 인터랙티브한 대시보드와 그래프 시각화 - 최근 많은 회사들이 태블로를 BI툴로 활용 - 무료로 글로벌 커뮤니티와 템플릿, 강의 참고 가능 ② 단점 - 데이터 용량이 크거나 개발 대시보드 양이 많아지면 대시보드 로딩 속도 저하 - 다른 BI툴과 비교해 가격이 비쌈
└ 추출 필터: 데이터 소스에서 추출된 데이터 필터링(데이터 연결을 추출로 선택했을때만 사용 가능) └ 데이터 원본 필터: 데이터 원본 소스에서 일부 데이터만 필터링 └ 컨텍스트 필터: 특정값에 대한 데이터만 필터링 └ 차원 필터: 차원을 기준으로 데이터 필터링 └ 측정값 필터: 측정값을 기준으로 데이터 필터링 └ 테이블 계산 필터: 특정 계산 결과를 기준으로 데이터 필터링
② 계산과 필터의 작동 순서
- 계산과 필터의 태블로 작업 순서(쿼리 파이프 라인)
└ 필터를 추가할 때 해당 필터가 항상 작업 순서에 따라 설정된 순서대로 실행
└ ex. FIXED 계산은 컨텍스트 필터보다 순서가 늦어 이점을 유의해서 작업 필요
③ 필터 활용법: Top N 필터와 차원 필터
- 지역별(차원 필터) 고객별 상위 매출 Top N 필터링 하려면?
└ Top N 필터는 차원 필터보다 위에서 먼저 작동되기 때문에 지역별 필터(차원 필터)가 적용되지 않는 문제 발생
└ (해결방안) 차원 필터를 컨텍스트 필터로 추가해 작동 우선 순위 변경: 컨텍스트 필터 > Top N > 차원 필터
└ (참고) 컨텍스트 필터는 필터링된 데이터에 대해서만 필터링 적용되어 원본이 클 때도 자주 사용
(실습) 지역별 매출 Top 10 고객 막대 그래프 시각화
3) 기본 계산식 활용
① 계층과 드릴 다운
- 계층: 위계가 있는 차원. ex. Product > Category/Sub-Category
- 드릴다운: 계층이 있는 경우 '+/-' 아이콘을 클릭해서 하위 계층 항목(날짜-년/분기/월 등) 드릴 다운 가능
② 퀵테이블 계산
- 누계, 차이, 비율, 순위, 백분위수, 이동 평균 등을 빠르게 계산해주는 기능
- 연도별/월별/주별/일별 비즈니스 지표 증감을 비교할 때 유용하게 사용
└ LOD식을 활용해 YTD(연초 대비 증감률) / YoY(전년 대비 증감률) / MoM(전월 대비 증감률) 등 계산
(실습) 각 카테고리별로 서브 카테고리 매출 비중을 100% 스택플랏으로 시각화 > 기기 카테고리에서 핸드폰 매출이 차지하는 비율은 39.51%로 확인 - 차원별 비중 구하기
③ 태블로 함수
(1) 논리 함수
# IF
IF SUM([Sales]) >= 10000
THEN '상위 매출'
ELSEIF [Sales] < 10000 AND [Sales] > 0
THEN '하위 매출'
ELSE '미판매' END
# Case when
CASE [측정값]
WHEN 'Sales' THEN [매출]
WHEN 'Profit' THEN [수익]
...
END
# ZN
# IFNULL과 유사
ZN([Sales]) # null이 아니면 [Sales], null 이면 0을 반환
# DATEDIFF
# 두 날짜 사이의 차이를 반환
DATEDIFF(단위, 시작 날짜, 끝 날짜)
DATEDIFF('day', [Order Date], [Ship Date]) #배송 기간
# DATEADD
# 날짜 더하기
DATEADD(단위, 간격, 기준 날짜)
DATEADD('day, 7, [Order Date]) #주문 7일 이후