본문 바로가기

전체 글

(131)
[240122주차] 본캠프 W6 WIL : Weekly I Learned 지난 일주일을 돌아봄으로써 나의 현재 상태를 파악하고 더 나은 다음 주를 만들기 위해 어떤 부분을 어떻게 채워나갈지 고민하는 것 내가 한 일(Facts) - SQL 코드카타 110~115, 파이썬 코드카타 21~24 문제풀이 - 통계학 기초, 데이터 전처리 & 시각화 강의 수강 - TIL 작성 느낀점(Feelings) - 통계학 기초 강의가 너무 어려웠다. 학부 때 배운 t-test 개념도 전혀 기억이 안 난다. 빠른 속도의 수업을 따라가기에 급급하다보니, 큰 틀에서도 이해를 제대로 못하고 넘어갔다. 특히 실습 부분은 전혀 못 보고 다 건너 뛰었는데, 시간 내서 꼭꼭 복습이 필요할 듯하다. - 데이터 전처리 & 시각화는 통계학 강의에 비해 재밌었다. 강의 수강 중..
[240124-26] 데이터 전처리 & 시각화 [데이터 전처리 & 시각화 by 박성원 튜터] 00. 데이터 분석가란? 1) 데이터 분석가 유형 - 비즈니스 분석가 (Business Analyst, BA) : 주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석 : 비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원 : 주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행 - 프로덕트 분석가 (Product Analyst, PA) : 제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석 : 사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여 : 주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당 - BI 분석가 : 기업의 ..
[240125] SQL: 코드카타 115 & 파이썬: 코드카타 24 [SQL 코드카타] 1341. Movie Rating https://leetcode.com/problems/movie-rating/ 1) 어떤 문제가 있었나 평점이 가장 높은 영화 '제목'과 가장 많은 점수를 부여한 '사람 이름'을 하나의 열에 추출하는 문제 값이 같으면 제목 및 이름 오름차순 기준으로 정렬하여 앞에 오는 것으로 추출 주어진 3개의 테이블을 하나로 join이 좋을지, 2개씩 join하면 속성이 상이한 최종값을 어떻게 하나의 열로 추출할지 고민 2) 내가 시도해본 건 무엇인가 movie, user, MovieRaing 3개를 모두 조인해보고 rank 함수 등 적용해보았으나 실패 2개의 별도 쿼리문 union 필요하다는 것을 깨닫고 with 절과 윈도우 함수 활용해 임시 테이블 생성하여 결과..
[240124] SQL: 코드카타 113~114 & 파이썬: 코드카타 23 [SQL 코드카타] 626. Exchange Seats https://leetcode.com/problems/exchange-seats/ 1) 어떤 문제가 있었나 연속되는 id의 학생끼리 자리를 바꾸되, 전체 학생이 홀수일 경우 마지막 학생은 그대로 두는 문제 2) 내가 시도해본 건 무엇인가 case when을 활용해 좌석 교체 조건을 넣어 with 절로 빼고, 원본 table과 left join 진행 with절 테이블 값이 있으면 with절 테이블 값으로, 없으면 원본 table 값으로 추출해 마지막 홀수 학생ID 그대로 나오게 함 3) 어떻게 해결했나 with swap_table as (SELECT id, student, case when id%2 0 then id+1 when id%2 = 0 the..
[240119-23] 통계학 기초 [통계학 기초 by 안창배 튜터] 1. 왜 통계일까 1) Case Study - 광고 클릭률은 높은데 전환율이 낮다? 상세 페이지를 변경하자! (잘못된 의사결정) └ 클릭률의 평균적인 수준은 얼마인지, 또 어느 정도 차이까지 용인할 것인지? └ 구매수 3건인데 전환율이 낮다? 주어진 데이터 양은 신뢰할 만한 수준일지? ▶ 구매수가 충분한지, 또 구매전환율이 낮다면 실제 원인이 무엇인지 추가 분석 필요 - 개인화 추천 모델을 서비스에 적용하기 위해 모델은 주기적으로 업데이트 하자! (데이터 설정 오류) └ 문제: 업데이트 하는 사이에 새로 가입한 유저는 추천 결과를 못받음 └ 해결: 모델 업데이트 시각을 적절하게 조절해 문제 최소화 └ 판단 지표: 신규 가입으로 추천이 나가지 못하는 사람의 수(daily ..
[240123] SQL: 코드카타 111~112 & 파이썬: 코드카타 22 [SQL 코드카타] 1907. Count Salary Categories https://leetcode.com/problems/count-salary-categories 1) 어떤 문제가 있었나 급여 구간을 나눠서 각 구간별 숫자를 구하는 것인데, 0인 구간 값 도출이 어려웠음 2) 내가 시도해본 건 무엇인가 accounts_count 부분에 *, ifnull 등을 시도해보았으나 0 값은 안 나옴 #오답 #Average Salary 0 값이 안 나옴 select case when income 50000 then "High Salar..
[240122] SQL: 코드카타 110 & 파이썬: 코드카타 21 [SQL 코드카타] 1164. Product Price at a Given Date https://leetcode.com/problems/product-price-at-a-given-date/description/ 1) 어떤 문제가 있었나 날짜별 가격 정보를 토대로 특정일자(2019-08-16)의 가격을 추정해야 하는 것으로 이해했으나, 2019-08-16에 수정된 가격이 있으면 해당 날짜 가격으로, 그전에 수정되었으면 가장 나중에 수정된 가격으로, 수정 안됐으면 가격을 10으로 추정해야 했음 2) 내가 시도해본 건 무엇인가 with 절로 고유 product_id 테이블 및 각 날짜별 테이블을 생성 후 left 조인해 case when 문으로 추정값을 넣으려 했지만 실패 3) 어떻게 해결했나 다른 사람 ..
[240115주차] 본캠프 W5 WIL : Weekly I Learned 지난 일주일을 돌아봄으로써 나의 현재 상태를 파악하고 더 나은 다음 주를 만들기 위해 어떤 부분을 어떻게 채워나갈지 고민하는 것 내가 한 일(Facts) - SQL 코드카타 105~109, 파이썬 코드카타 17~20 문제풀이 - 기초 프로젝트 데이터 분석 및 자료 준비, 발표 등 └ (주)머천재 매출 극대화를 위한 매출 분석 보고서 - 통계 기초 강의 수강 - TIL 작성 느낀점(Feelings) - 금주 본격적으로 기초 프로젝트 세부 분석 내용을 다듬고, 자료 준비 및 발표 등을 진행하였다. 중간 중간 지정 튜터님에게 방향성이나 분석 내용에 대해 피드백을 받은 것이 준비에 많은 도움이 되었다. 개인적으로는 SQL를 활용해 직접 고객 세그먼트를 나누고 코호트 분석..