파워 파이썬/패키지

판다스를 활용한 데이터 시각화

상선약수64 2023. 10. 1. 22:44
반응형

판다스는 matplotlib와 결합되어 있어 손쉽게 시각화를 할 수 있습니다. plot이라는 시각화 메서드가 내장되어 있으며, plot은 matplotlib를 내부에서 임포트 하여 사용됩니다.

 

 

 

판다스는 
matplotlib와 결합되어 있어
plot() 메소드를 이용하여 시각화할 수 있음


 

plot 메소드의 kind라는 인수를 바꾸면 다양한 차트를 그릴 수 있습니다. 다양한 인수값을 지원합니다.

  • bar
  • pie
  • hist
  • box
  • kde
  • scatter
  • area
막대 그래프(bar)
import pandas as pd
import matplotlib as plt

plt.rc('font', family='NanumBarunGothic')  #사용하는 폰트는 나눔고딕체 
file="/content/drive/MyDrive/ML Lecture/data/vehicle.csv"
df= pd.read_csv(file, encoding='CP949', index_col=0) #한글
df['2023'].head()

df['2023'].plot(kind='bar', color=('orange', 'r', 'b','m', 'c', 'k')) #막대그래프 작성

원그래프(pie)
df['2023'].plot(kind='pie')

 

선그래프(line)
df.plot(kind='line') 

 

Kernel Density Plot(kde)
df.plot(kind='kde')

상자 그림(box)
df.plot(kind='box')

산점도(scatter)
df = df.transpose() #행렬 변경
df.plot(kind='scatter', x='한국', y='미국')

 

참고 : https://github.com/sense64/data_viz/blob/main/pandas_viz.ipynb