* 수강 강의명: 데이터 분석 종합반 - 1주차
[요약]
1. 기초 개념
1) 파이썬(Phython)이란?
프로그래밍 언어의 한 종류로, 컴퓨터와 쉽게 소통하도록 도와주는 번역팩 역할을 함
2) 파이썬 라이브러리란?
- 데이터 분석 시 특정 동작을 가능하게 하는 코드 모음집
- 주요한 라이브러리
① pandas(판다스): 데이터 분석에 사용되는 라이브러리로, 여러 형태의 데이터 파일을 읽어내는 것은 물론, 데이터 편집 및 가공, 필터링, 조회 등이 가능
② matplotlib(맷플롯립): 데이터를 시각화 해주는 라이브러리
2. 데이터 분석 맛보기
- 데이터 분석 기본 구조
① 문제 정의 및 가설 설정하기
② 데이터 분석 기본 세팅 하기
③ 데이터 분석하기
④ 분석 결과 시각화 하기
⑤ 최종 결론 내리기
- 구글 스프레드 시트를 활용한 데이터 상관관계 분석 과정
└ 문제 정의 및 가설 설정
└ 데이터 가져오기 & 전처리
└ 확장 프로그램 [xlminer analysis toolpak]을 활용해 correlation 값 도출
└ 삽입> 차트 기능을 활용해 데이터 시각화
└ 가설에 대한 결과값 도출
[정리]
개념 설명 위주 강의라 이슈 없음
1) 어떤 문제가 있었나
2) 내가 시도해본 건 무엇인가
3) 어떻게 해결했나
4) 무엇을 새롭게 알았나
- 구글 스프레드시트에서 확장 프로그램을 통해 손쉽게 상관관계 도출이 가능했음
- 파이썬은 라이브러리를 활용하는 점을 미루어 보아, SQL보다 훨씬 자유도가 높은 언어로 판단됨
> SQL은 초반에 주요 문법을 최대한 외우려고 했다면, 파이썬은 기본 규칙을 파악하고 최대한 많은 코드를 접하는 방향으로 학습 필요
'TIL' 카테고리의 다른 글
[231212] Phython: 요일/시간대/지역별 데이터 분석 및 지도 라이브러리 활용법 (0) | 2023.12.12 |
---|---|
[231211] Phython: 변수, 리스트, 딕셔너리, 조건/반복/비교연산자, 상관관계 (1) | 2023.12.11 |
[231207] SQL: 데이터 가공, pivot table 생성, window function, date 포맷 (2) | 2023.12.07 |
[231206] SQL: Subquery, JOIN (2) | 2023.12.06 |
[231205] SQL: REPLACE, SUBSTRING, CONCAT, IF/CASE, CAST (1) | 2023.12.05 |