파워 파이썬/패키지

데이타 시각화를 위한 도구 matplotlib

상선약수64 2023. 9. 26. 07:41
반응형

데이터 시각화를 위한 파이썬 패키지는 matplotlib이고 그 하위 모듈 중 pyplot 이라나는 서브모듈 pyplot 모듈을 주로 사용합니다. 이 서브 모듈은 시각화를 위한 핵심적인 함수와 클래스들이 정의되어 있습니다.

 

matplotlib패키지는
데이터 시각화 도구 이다.

https://matplotlib.org/2.0.2/api/pyplot_api.html
 

pyplot — Matplotlib 2.0.2 documentation

Parameters:X : array_like, shape (n, m) or (n, m, 3) or (n, m, 4) Display the image in X to current axes. X may be an array or a PIL image. If X is an array, it can have the following shapes and types: MxN – values to be mapped (float or int) MxNx3 – R

matplotlib.org

 

1. 주요 차트
scatter() 산점도, 두변수의 선형관계 확인
bar() 막대그래프 그리기 
barh() 수평막대그래프 그리기
pie() 파이 형태의 그림을 그리기
imshow() 이미지를 화면에 그리기
plot() 실선이나 점섬으로 그리기
boxplot() 상자그림 그리기(분포확인)
hist() 히스토그램 그리기(분포확인)

 

2. bar 차트
import numpy as np
import matplotlib.pylab as plt

y = [10, 13, 15]
x = np.arange(len(y))
xlabel = ['사과', '배', '감']
plt.title("판매개수 Bar Chart")
plt.bar(x, y)
plt.xticks(x, xlabel)
plt.yticks(sorted(y))
plt.xlabel("제품")
plt.ylabel("판매 수량")
plt.show()

- 실행을 하면 한글이 깨어져 나옵니다. 한글이 깨어져 나오는 것은 한글 폰트가 설치되어 있지 않기 때문에 아래와 같이 한글 폰트를 설치합니다. 그리고 설치된 폰트를 사용하기 위해 [런타임] 메뉴-> 런타임 다시 시작을 하시면 됩니다.

 

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

- 설치된 폰트를 사용하기 위해서는 한 줄을 더 추가하여야 합니다.

plt.rc('font', family='NanumBarunGothic')

 

3. 산점도
  • 두 변수 간의 선형 관계를 확인하기 위한 그립니다
N=20
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)

plt.scatter(x, y, c=colors)

 

4. 파이차트
  • 범주형 데이터는 전체적인 비율을 그리는 기능입니다.
data = [5, 4, 6, 11]
c = ['cyan', 'gray', 'orange', 'red']
l=["경영", "경영정보", "회계", "관광경영"]
plt.pie(data, autopct="%.2f", colors=c, labels=l)

5. 히트맵
  • 이미지 위에 열 분포형태로 정보를 표현해 주는 그래프입니다
data = np.random.rand(10, 10)
plt.imshow(data)
plt.colorbar()

6. 히스토그램
  • 계량형 데이터를 구간으로 나누고, 각 구간의 도수를  표현하는 그래프로서 데이터의 분포를 확인해 주는 그래프입니다.
sigma = 2.0
mu = 3.0
data = sigma *np.random.randn(10000) + mu

plt.hist(data, bins=30, color='b')

Tip : 난수 발생하는 내용