02-4
그래프 그리기¶
그래프와 같은 데이터의 시각화는 데이터 분석 과정에서 가장 중요한 요소이다. 데이터를 시각화하면 데이터를 이해하거나 추이를 파악하는 등의 작업을 할 때 많은 도움이 된다. 여기에서는 간단한 그래프를 그려보고 데이터 시각화가 무엇인지 알아보겠다. 자세한 내용은 04장에서 더 자세히 설명하겠다.
그래프 그리기¶
- 먼저 그래프와 연관된 라이브러리를 불러온다.
In [4]:
%matplotlib inline
import matplotlib.pyplot as plt # %matplotlib inline은 주피터 노트북에서 그래프를 그리기 위해 사용하는 매직 함수이다.
- df를 불러온 뒤 year 열을 기준으로 그룹화한 데이터프레임에서 lifeExp 열만 추출하여 평균값을 구한다.
In [7]:
import pandas as pd
df = pd.read_csv('doit_pandas_data/data/gapminder.tsv', sep='\t')
global_yearly_life_expectancy = df.groupby('year')['lifeExp'].mean()
print(global_yearly_life_expectancy)
year 1952 49.057620 1957 51.507401 1962 53.609249 1967 55.678290 1972 57.647386 1977 59.570157 1982 61.533197 1987 63.212613 1992 64.160338 1997 65.014676 2002 65.694923 2007 67.007423 Name: lifeExp, dtype: float64
- 과정 2에서 구한 값에 plot 메서드를 사용하면 다음과 같은 그래프가 그려진다.
In [8]:
global_yearly_life_expectancy.plot()
Out[8]:
<AxesSubplot:xlabel='year'>
마무리하며
이 장에서는 데이터 집합을 불러오는 방법과 데이터를 추출하는 방법 등을 알아보았다. 다음 장에서는 기본 자료형은 데이터 프레임과 시리즈를 좀 더 자세히 알아보겠다.
출처 : Do it! 데이터 분석을 위한 판다스
'Python > Pandas' 카테고리의 다른 글
<파이썬 판다스> Chapter 03-2 시리즈 다루기 - 기초 (0) | 2023.04.28 |
---|---|
<파이썬 판다스> Chapter 03-1 나만의 데이터 만들기 (0) | 2023.04.28 |
<파이썬 판다스> Chapter 02-3 기초적인 통계 계산하기 (0) | 2023.04.26 |
<파이썬 판다스> Chapter 02-2 데이터 추출하기 (0) | 2023.04.26 |
<파이썬 판다스> Chapter 02-1 데이터 집합 불러오기 (0) | 2023.04.26 |