본문 바로가기

TIL

(97)
[231213] Phython: 실습 - 광고 효율, 상품 기획, 할인율 분석 * 수강 강의명: 데이터 분석 종합반 - 4주차 [요약] 1. 좋은 가설이란? ① 풀고자 하는 문제의 방향성과 일치하는 가설 ② 테스트 가능한 가설 ③ 액션으로 이어질 수 있는 가설 2. 광고 효율이 나지 않는 매체를 찾아라! - 가설 : 여러 매체 중 광고 효율이 낮은 매체에 사용한 비용을 가장 효율이 좋은 매체에 집행한다면 기존 대비 50%의 광고효율을 증대시킬 수 있을 것이다. #라이브러리 불러오기 import pandas as pd import matplotlib.pyplot as plt plt.rc('font', family='NanumBarunGothic') #분석할 데이터 불러오기 sparta_data = pd.read_csv('파일 경로') #데이터 확인하기 sparta_data.tail(..
[231212] Phython: 요일/시간대/지역별 데이터 분석 및 지도 라이브러리 활용법 * 수강 강의명: 데이터 분석 종합반 - 3주차 [요약] 1. 요일/시간대별 데이터 분석 1) 데이터 전처리 ① 판다스 선언 및 데이터 불러오기 import pandas as pd sparta_data = pd.read_table('/content/access_detail.csv', sep=',') ② 날짜 데이터 타입 확인하기 print(type(sparta_data['access_date'][1])) # type() 함수를 사용해 데이터의 종류 확인 가능. str은 문자열, 시간은 timestamp로 표기됨 # sparta_date 정보에서 access_date 열에서 데이터 첫번째 부분만 확인 하면 되겠죠? ③ 데이터 포맷 변경하기 format='%Y-%m-%dT%H:%M:%S.%f' sparta_..
[231211] Phython: 변수, 리스트, 딕셔너리, 조건/반복/비교연산자, 상관관계 * 수강 강의명: 데이터 분석 종합반 - 2주차 [요약] 0. 구글 Colab 시작하기 - 온라인 파이썬 데이터 분석을 학습 플랫폼 https://colab.research.google.com/notebooks/welcome.ipynb 1. 데이터 분석에 필요한 파이썬 문법 1) 변수 - 특정한 이름이 있는 데이터를 담는 컨테이터로, 변수를 통해 데이터를 쉽게 불러올 수 있음 ex. 변수 = 값 x = 5, y = 2, z = "hello" print(x) print(z) print(x+y) ------------result------------ 5 hello 7 * x, y, z가 변수에 해당되며, 변수에 속한 데이터가 숫자일 경우 기본 사칙 연산 적용 가능 2) 리스트 - 순서가 있는 데이터들의 모음..
[231207] Phython: 기초 개념, 데이터 분석 맛보기 * 수강 강의명: 데이터 분석 종합반 - 1주차 [요약] 1. 기초 개념 1) 파이썬(Phython)이란? 프로그래밍 언어의 한 종류로, 컴퓨터와 쉽게 소통하도록 도와주는 번역팩 역할을 함 2) 파이썬 라이브러리란? - 데이터 분석 시 특정 동작을 가능하게 하는 코드 모음집 - 주요한 라이브러리 ① pandas(판다스): 데이터 분석에 사용되는 라이브러리로, 여러 형태의 데이터 파일을 읽어내는 것은 물론, 데이터 편집 및 가공, 필터링, 조회 등이 가능 ② matplotlib(맷플롯립): 데이터를 시각화 해주는 라이브러리 2. 데이터 분석 맛보기 - 데이터 분석 기본 구조 ① 문제 정의 및 가설 설정하기 ② 데이터 분석 기본 세팅 하기 ③ 데이터 분석하기 ④ 분석 결과 시각화 하기 ⑤ 최종 결론 내리기 ..
[231207] SQL: 데이터 가공, pivot table 생성, window function, date 포맷 * 수강 강의명: 엑셀보다 쉽고 빠른 SQL - 5주차 [요약] 1. 데이터 가공팁 ① null 값 - null 값 포함 여부에 따라 평균값이나 개수 등이 바뀌므로 원하는 결과값에 따라 가공이 필요할 수 있음 - null 제외하는 법 └ where 절에 [is not null] 을 적거나 join 시에는 inner join을 활용 - null 대체값으로 변경하는 법 └ coalesce(칼럼명, 대체값) * ex. coalesce(age, 20) / age 칼럼에 null 값은 모두 '20'으로 넣어줘 cf) COUNT(*) : NULL 값을 포함한 모든 행의 개수를 카운트 COUNT(컬럼명) : NULL 값을 제외한 행의 개수를 카운트 ② 비상식적인 데이터 - if 나 case when 절을 통해 값의 ..
[231206] SQL: Subquery, JOIN * 수강 강의명: 엑셀보다 쉽고 빠른 SQL - 4주차 [요약] 1. Subquery - Query 안에 sub로 들어간 구문으로 쿼리 속의 쿼리를 의미함 - 서브쿼리( Subquery )가 필요한 경우는? └ ① 연산을 여러 번 하거나 ② 조건문에 연산된 결과값을 활용하거나 ③ 조건에 쿼리 결과값을 추가하고 싶을 때 - 기본 구조 ① 예시 select column1, special_column from (/* subquery */ select column1, column2 special_column from table1 ) a ③ 예시 select column1, column2 from table1 where column1 = (select col1 from table2) 2. JOIN 절 - JOIN..
[231205] SQL: REPLACE, SUBSTRING, CONCAT, IF/CASE, CAST * 수강 강의명: 엑셀보다 쉽고 빠른 SQL - 3주차 [요약] 1. 문자열 가공하는 법 (REPLACE, SUBSTRING, CONCAT + CAST) - REPLACE : 특정 문자를 다른 것으로 바꿀 수 있는 명령어 └ REPLACE(변경할 칼럼, 현재값, 변경값) └ ex) 식당명에 blue 표기된 값을 red로 바꾸고 싶다면, REPLACE(restaurant_name, 'Blue', 'Red') - SUBSTRING : 원하는 문자만 남기는 명령어 └ substr(변경할 칼럼, 시작 위치, 남기고 싶은 음절수) * substring 으로 표기해도 무방 └ ex) 주소에서 '서울' '경기' 등 앞음절 2개만 남기고 싶다면, substr(addr, 1, 2) - CONCAT : 여러 칼럼을 하나로..
[231204] SQL: 기본연산/함수, GROUP BY, ORDER BY * 수강 강의명: 엑셀보다 쉽고 빠른 SQL - 2주차 [요약] 1. 기본 연산 및 함수 종류 - 엑셀과 유사하게 연산식 및 함수 사용 가능. 연산자 함수 기호 설명 함수 설명 비고 + 더하기 SUM(칼럼) 합계 - 빼기 AVG(칼럼) 평균 * 곱하기 COUNT(칼럼) 개수 칼럼 대신 * 혹은 1 사용 가능 / 나누기 MIN(칼럼) 최소값 MAX(칼럼) 최대값 DISTINCT 중복 제외 2. GROUP BY 절 - 원하는 단위(범주)로 나누는 명령어. 카테고리별로 연산을 가능하게 함. - 기본 구조 select cuisine_type, sum(price) sum_of_price from food_orders group by cuisine_type 3. ORDER BY 절 - 카테고리 내 칼럼을 오름차순 ..