Python (57) 썸네일형 리스트형 <마케팅 데이터 사이언스> Chapter 02-4 KPI를 계산하고 비주얼화하기 02-4 KPI를 계산하고 비주얼화하기 마케팅 캠페인¶ 마케팅 캠페인을 벌이고 나면 마케팅이 얼마나 효과가 있었는지 평가해야한다. 더 나아가 캠페인의 장점과 단점을 파악하는일 역시 중요하다. 이때 성과 평가를 위해 KPI, Key Performance Indicator를 사용한다. KPI CPA, cost per acquisition digital marketing KPIs site tracffic 이번 장에서는 bank marketing dataset을 사용한다. 모든 마케팅은 비용이 든다. 그렇기 때문에 마케팅의 성과를 비용 대비로 보는 게 중요하다. 따라서 ROI, Return on Investments를 측정해야 한다. Sales Revenue¶ROI를 측정하기 위해서는 먼저 Sales Reven.. <파이썬 판다스> Chapter 09-2 문자열 메서드 09-2 문자열 메서드 지금까지 인덱스 슬라이싱으로 문자열을 추출하는 방법을 알아보았다. 그런데 문자열이 너무 길어서 내가 원하는 문자가 몇 번째 인덱스에 있는지 파악하기 어렵거나 문자열에 포함된 소문자를 모두 대문자로 바꾸고 싶다면 어떻게 해야 할까? 이런 경우에는 문자열 메서드를 사용하면 된다. 자주 사용하는 문자열 메서드와 간단한 실습 코드를 다음 표에 정리했다. 문자열 표 아래에 있는 실습 코드를 정리한 표도 함께 읽어보자. 문자열 메서드¶ 메서드 설명 capitalize 첫 문자를 대문자로 변환한다. count 문자열의 개수를 반환한다. startswith 문자열이 특정 문자로 시작하면 참이 된다. endswith 문자열이 특정 문자로 끝나면 참이 된다. find 찾을 문자열의 첫 번째 인덱스를.. <파이썬 판다스> Chapter 09-1 문자열 다루기 09-1 문자열 다루기 파이썬과 문자열¶문자열은 작은따옴표나 큰따옴표로 감싸서 만든다. 다음은 작은따옴표로 grail, a scratch라는 문자열 데이터를 만들어 변수 word, sent에 저장한 것이다. In [1]: word = 'grail' sent = 'a scratch' 인덱스로 문자열 추출하기 데이터프레임에서 인덱스를 이용하여 원하는 데이터를 추출했던 것을 기억해보자. 문자열도 인덱스를 사용하여 추출할 수 있다. 문자는 길이가 1인 문자열로 생각하면 된다. 다음은 문자열과 인덱스를 함께 나타낸 표이다. 간단하게 살펴보고 실습으로 넘어가자. 문자열 grail과 인덱스¶ 인덱스 0 1 2 3 4 문자열 g r a i l 음수 인덱스 -5 -4 -3 -2 -1 문자열 .. <마케팅 데이터 사이언스> Chapter 01-3 모델과 모델링 이해하기 데이터 사이언스에서는 '모델'이나 '모델링'이라는 단어가 자주 등장한다. 모델을 쉽게 예를 들어보자면, 아파트 모델하우스와 비유할 수 있다. 아파트 모델하우스는 실제 아파트 내부와 똑같은 모습을 모형으로 만든 것이다. 모델은 이와 같이 실체와 똑같이 만들어진 결과물의 의미로 여러 곳에서 사용된다. 데이터 사이언스에서 모델은 실체를 설명하거나 예측하기 위해 만들어진 수학 공식 정도로 생각할 수 있습니다. 그리고 이러한 관계를 유추하는 과정을 모델링이라고 한다. 모델에는 크게 두 가지 종류가 있다. 모델의 종류 기술모델(Descriptive Model) 목적 : 현재 현상에 대한 이해 향상 평가 : 얼마나 데이터를 이해하고 설명하는가 예측모델(Predictive Model) 목적 : 미래에 일어날 일을 예측.. <파이썬 판다스> Chapter 08-2 카테고리 자료형 08-2 카테고리 자료형 판다스 라이브러리는 유한한 범위의 값만 가질 수 있는 카테고리라는 특수한 자료형이 있다. 만약 10종류의 과일 이름을 저장한 열이 있다고 가정할 경우 문자열 자료형보다 카테고리 자료형을 사용하는 것이 용량과 속도 면에서 더 효율적이다. 카테고리 자료형의 장점과 특징은 다음과 같다. 카테고리 자료형의 장점과 특징 - 용량과 속도 면에서 매우 효율적이다. - 주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용한다. 문자열을 카테고리로 변환하기¶sex 열의 데이터는 남자 또는 여자만으로 구성되어 있다. 그래서 카테고리 자료형으로 저장되어 있다. 만약 sex 열의 자료형을 문자열로 변환하면 어떻게 될까? sex 열의 자료형을 문자열로 변환한 다음 데이터프레임의 용량을 info .. <파이썬 판다스> Chapter 08-1 자료형 다루기 08-1 자료형 다루기 자료형 변환하기 자료형 변환은 데이터 분석 과정에서 반드시 알아야 하는 요소 중 하나이다. 예를 들어 카테고리는 문자열로 변환해야 데이터 분석을 더 수월하게 할 수 있기 때문에 자주 변환하는 자료형이다. 또 다른 예는 전화번호이다. 전화번호는 보통 숫자로 저장한다. 하지만 전화번호로 평균을 구하거나 더하는 등의 계산은 거의 하지 않는다. 오히려 문자열처럼 다루는 경우가 더 많다. 다음 실습을 통해 여러 가지 자료형을 문자열로 변환하는 방법에 대해 알아보겠다. 자료형을 자유자재로 변환하기 - astype 메서드¶이번에 사용할 데이터 집합은 seaborn 라이브러리의 tips 데이터 집합이다.¶ In [19]: import pandas as pd import seaborn as sns.. <파이썬 판다스> Chapter 07-4 중복 데이터 처리하기 07-4 중복 데이터 처리하기¶ 이번에 다룰 빌보드 차트 데이터 artist, track, time, date.entered 열의 데이터가 반복된다. 이런 반복되는 데이터는 따로 관리하는 것이 좋다. 왜 따로 관리하는 것이 좋을까? 그리고 따로 관리하려면 어떻게 해야 할까? 다음 실습을 통해 중복 데이터를 처리하는 방법에 대해 알아보겠다. 빌보드 차트의 중복 데이터 처리하기¶다음은 빌보드 차트 데이터를 불러온 것이다.¶ In [1]: import pandas as pd billboard = pd.read_csv('doit_pandas_data/data/billboard.csv') billboard_long = pd.melt(billboard, id_vars=['year', &.. <파이썬 판다스> Chapter 07-3 여러 열을 하나로 정리하기 07-3 여러 열을 하나로 정리하기¶ 보통 데이터프레임의 열은 파이썬의 변수와 같은 개념으로 사용한다. 하지만 비슷한 성질의 데이터를 관리하기 위해 열이 여러 개로 분리되어 있는 경우도 있다. 다음 실습을 통해 여러 개로 분리된 열을 정리하는 방법에 대해 알아보겠다. 기상 데이터의 여러 열을 하나로 정리하기 - melt, pivot_table 메서드¶ 다음은 기상 데이터를 불러와 출력한 것이다. 날짜 열(d1, ..., d31)에는 각 월별 최고, 최저 온도 데이터가 저장되어 있다. 지금은 날짜 열이 옆으로 길게 늘어져 있어 보기 불편하다. 먼저 날짜 열을 행 데이터로 피벗하겠다. In [2]: import pandas as pd weather = pd.read_csv('doit_pandas_da.. 이전 1 2 3 4 5 6 ··· 8 다음