# sparta_data['group'] ==1 는 group의 값이 1과 동일하다는 의미 파이썬에서는 = 은 변수를 지정할 때만 사용하므로, == 이 "equal"임
#각 결제 인원에서 실제 실험 인원인 12000명을 나누고 각 퍼센테이지 구하기percent_of_students_by_not_discounted = sum_of_students_by_not_discounted/12000 *100 percent_of_students_by_discounted = sum_of_students_by_discounted/12000 *100 print(percent_of_students_by_not_discounted , percent_of_students_by_discounted )
plt.figure(figsize=(3,5)) x_list =["정가 구입 그룹", "할인 적용 그룹"] y_list = [percent_of_students_by_not_discounted ,percent_of_students_by_discounted] plt.bar(x_list, y_list, width = 0.8) plt.title('할인 여부 결제 전환율 비교 분석') plt.xlabel('할인 적용 여부') plt.ylabel('결제 전환율') plt.show()
- 결론 : 할인 적용 신청 그룹과 미적용 그룹의 결제율은 각각 46%, 20%로 할인 적용 시 결제 완료 비중이 높으므로, 할인 제공은 전환율 개선에 효과적이다.
5. 시각화 디테일 바꾸기 1) 막대그래프 색상 변경 - 전체 색상 변경: plt.bar(X, Y, color='원하는 색상 컬러') - 각 바 마다 다른색 지정 : plt.bar(X, Y, color = ['gold', 'b', '#FF0000']) - 투명도 설정: plt.bar(X, Y, color = 'gold', alpha = 0.3)
2) 막대그래프 테두리 변경 - 테두리 색 변경: plt.bar(X, Y, edgecolor = '원하는 색상') - 테두리 두께 변경: plt.bar(X, Y, linewidth = 원하는 두께)
3) 그래프 너비 바꾸기 - 바 두께 변경(기본 0.8): plt.bar(X, Y, width=원하는 두께)
5) 바에 수치 나타내기(데이터 레이블 추가) * 반복문 활용 #그래프를 bar라는 변수에 넣고, bar = plt.bar(access_media.index,access_media.values) #for 반복문으로, for rect in bar: #각 바의 세로길이 값을 구하고, height = rect.get_height() #bar의 가장 정 가운데 x 좌표 구하기 : get_x()로 x축의 가장 왼쪽 부분 + get_width의 절반 값 plt.text(rect.get_x() + rect.get_width()/2.0, height, '%.1f' % height, ha='center', va='bottom', size = 12)
** 결측치란?
- 누락 데이터를 말하며, None, NaN, 빈칸 등으로 표시됨. 명확한 결과를 얻기 위해 결측치 제거가 필요함
- 결측치 확인 및 제거 방법
① 전체 데이터 확인 : sparta_data.info()
② 결측치 확인 : sparta_data.isnull().sum()
③ 결측치 제거 : sparta_data = sparta_data.dropna()
[정리]
1) 어떤 문제가 있었나
2) 내가 시도해본 건 무엇인가
3) 어떻게 해결했나
4) 무엇을 새롭게 알았나
- 파이썬으로 그래프 디자인을 디테일하게 수정할 수 있는 법과 2개 이상 지표를 하나의 그래프로 넣는 법을 새롭게 배움