빅데이터
-
실전 예제 - 코로나 데이터 분석 08빅데이터/Data-Analysis 2022. 2. 28. 19:27
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 기초적인 folium을 사용하여 전 세계 코비드 현황을 시각화해보고 방안을 떠올려 보자 01 환경설정 'folium' 설치 install pip folium 필수 라이브러리 # 환경설정 import pandas as pd import matplotlib as npl import matplotlib.pyplot as plt import folium import seaborn as sns # 경고창 무시 import warnings warnings.filterwarnings('ignore') 데이터 세팅 * 데이터 다운로드 https://www.kaggle.com/imdevskp/corona-virus-report # 데이터 로..
-
실전 예제 - 유투브 채널 및 영상 분석 07빅데이터/Data-Analysis 2022. 2. 26. 12:58
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 유투브 인기 채널 순위 시각화, 인기 영상 타이틀을 분석해 볼 예정 * 필수 라이브러리 및 경고창 제거 # 필수 라이브러리 import pandas as pd import seaborn as sns # 한글 폰트 설치 from matplotlib import rc import matplotlib.font_manager as fm # # 설치된 폰트 출력, 여기서 나눔이나 맑은 고딕을 찾아야함 없으면 설치 # font_list = [font.name for font in fm.fontManager.ttflist] # font_list # 한글 폰트 테스트 import matplotlib as mpl import matplotl..
-
실전 예제 - 마케팅 데이터 분석 06 (Referral)빅데이터/Data-Analysis 2022. 2. 25. 15:51
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 AARRR의 Referral 부분을 진행 해 볼 예정 Referral은 고객들이 다른 사람에게 자사 회사의 제품을 소개하는지 혹은 자사 회사 제품에 어떤 인식을 가지고있는지 등을 조사함 두 영양제 회사의 리뷰 데이터를 가지고 진행 01 전처리 리뷰들을 스크래핑해서 .txt파일로 저장해놓았다. 열어보면 아래와 같은 상태라 전처리가 필수이다. from konlpy.tag import Kkma kkma = Kkma() line_list = [] f = open("centrum_review.txt", encoding='utf-8') for line in f: line = kkma.nouns(line) line_list.append(..
-
실전 예제 - 마케팅 데이터 분석 05 (Revenue - 03)빅데이터/Data-Analysis 2022. 2. 24. 17:38
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 01 해지 여부 각각의 컬럼에 따라 해지여부가 어떤지를 보자 def barplot_percentages(feature, orient='v', axis_name="percentage of customers"): ratios = pd.DataFrame() g = df.groupby(feature)["Churn"].value_counts().to_frame() g = g.rename({"Churn": axis_name}, axis=1).reset_index() g[axis_name] = g[axis_name]/len(df) if orient == 'v': ax = sns.barplot(x=feature, y= axis_name, ..
-
실전 예제 - 마케팅 데이터 분석 04 (Revenue - 02)빅데이터/Data-Analysis 2022. 2. 24. 15:58
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 지금까지 K군집으로 고객세그먼트를 나누어 보았다. 또 다른 방법의 하나로 '실루엣'이라는 계수가 있다. 실루엣 계수를 구하는 방법은 각 샘플의 클러스터(군집) 내부 거리의 평균 (a)와 인접 클러스터와의 거리 평균(b)를 사용하여 계산. 즉 (b-1) / max(a,b) 로 계산 가장 좋은 값은 1, 최악은 -1로 나옴. 0 근처의 값은 클러스터가 오버랩이 되었다는 의미이며 음수값은 샘플이 잘못된 클러스터에 배정이 되었다거나 다른 클러스터가 더 유사한 군집이라는 의미 실무에서는 도메인에 따라서 스코어와 상관없이 적절한 K가 있을 수 도 있음 01 실루엣 계수 보기 from sklearn.metrics import silhou..
-
실전 예제 - 마케팅 데이터 분석 03 (Revenue)빅데이터/Data-Analysis 2022. 2. 24. 11:52
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 AARRR의 'Revenue' 파트를 공부 해 볼 예정. 어떻게 'Revenue(수익)'을 극대화 할 수 있는지를 알아 보자 이번에는 쇼핑몰 데이터로 고객 데이터 분석을 통해 고객 세그먼트를 도출하고 그 사용법을 고려해볼 예정 ▶ 마케팅에서 흔히 듣는 용어 고객 세그먼트와 페르소나. 이 둘을 간단히 이해 해 보자 세그먼트(Segment) 정량화 할 수 있는 같은 속성을 공유하는 그룹을 나누는 의미. 대부분의 마케팅 담당자는 하나의 방식으로 고객을 세분화하는것이 아닌 비지니스 목적에 따라 여러가지 방식으로 세분화하는 방식을 주로 사용. 예로 라이프스타일, 취향, 성별 등등. 세그먼트에도 여러 종류가 있다. 내부, 외부, 전술적..
-
실전 예제 - 마케팅 데이터 분석 02 (Activation/Retention)빅데이터/Data-Analysis 2022. 2. 23. 19:26
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 01 Activation 지금까지 'Acquisition' 부분에서 세일즈가 어떻게 매체광고를 통해 영향을 받는지 알아 보았다. 다음 AARRR의 부분은 'Activation' 부분 이다. 이 부분에서는 Acquisition을 통해 매출을 올리고 그렇게 확보된 고객들을 계속해서 꾸준히 우리 제품에 'Active'하게 만드는 작업이다. 우리가 했던 매체광고를 예로 들면 고객들이 이 매체광고를 얼마나 자주 듣는지, 광고의 길이는 어떻게 되는지, 다음날에는 광고를 듣는지 등이 있다. 02 Retention 문제 정의 Acquisition → Activation 을 거쳤다면 이제는 그 고객들을 계속해서 유지하는 단계가 필요하다. 즉..
-
실전 예제 - 마케팅 데이터 분석 01 (Acquisition)빅데이터/Data-Analysis 2022. 2. 21. 20:27
패스트캠퍼스 '직장인을 위한 파이썬 데이터분석 올인원 패키치 Online' 참조 대부분의 사람들은 데이터 분석에 있어 하나의 언어를 배우고 기초 문법들을 배우면서 어떻게 하나의 언어 프로그램으로 데이터를 만질 수 있는지 배웠을 것이다. 하지만 그 이후 나 처럼 어느정도 개발도 해보고 언어도 좀 만져보고 이제 어느정도 익숙해진 사람들은 그 다음은 무엇을 해야하는지 막막하기 마련이다 이번 강의는 실무에 쓸 수 있는 기술들을 알아 볼 예정이다. 대부분의 IT강의들은 아래와 같은 형태로 이루어진다. 문제는 실무 근처에는 가보지 못하고 간단한 조리법들을 배우고 어떤 언어가 어떻게 쓰이는지만 배우는것에 그친다. 이 강의는 재료부터 조리법 그리고 요리까지 하나하나 실무에 필요한 과정들을 다 해 볼 예정이다. 특히 마..