반응형
데이터 시각화를 위한 파이썬 패키지는 matplotlib이고 그 하위 모듈 중 pyplot 이라나는 서브모듈 pyplot 모듈을 주로 사용합니다. 이 서브 모듈은 시각화를 위한 핵심적인 함수와 클래스들이 정의되어 있습니다.
matplotlib패키지는
데이터 시각화 도구 이다.
https://matplotlib.org/2.0.2/api/pyplot_api.html
1. 주요 차트
scatter() | 산점도, 두변수의 선형관계 확인 |
bar() | 막대그래프 그리기 |
barh() | 수평막대그래프 그리기 |
pie() | 파이 형태의 그림을 그리기 |
imshow() | 이미지를 화면에 그리기 |
plot() | 실선이나 점섬으로 그리기 |
boxplot() | 상자그림 그리기(분포확인) |
hist() | 히스토그램 그리기(분포확인) |
2. bar 차트
import numpy as np import matplotlib.pylab as plt y = [10, 13, 15] x = np.arange(len(y)) xlabel = ['사과', '배', '감'] plt.title("판매개수 Bar Chart") plt.bar(x, y) plt.xticks(x, xlabel) plt.yticks(sorted(y)) plt.xlabel("제품") plt.ylabel("판매 수량") plt.show() |
- 실행을 하면 한글이 깨어져 나옵니다. 한글이 깨어져 나오는 것은 한글 폰트가 설치되어 있지 않기 때문에 아래와 같이 한글 폰트를 설치합니다. 그리고 설치된 폰트를 사용하기 위해 [런타임] 메뉴-> 런타임 다시 시작을 하시면 됩니다.
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
|
- 설치된 폰트를 사용하기 위해서는 한 줄을 더 추가하여야 합니다.
plt.rc('font', family='NanumBarunGothic')
|
3. 산점도
- 두 변수 간의 선형 관계를 확인하기 위한 그립니다
N=20
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)
plt.scatter(x, y, c=colors)
|
4. 파이차트
- 범주형 데이터는 전체적인 비율을 그리는 기능입니다.
data = [5, 4, 6, 11]
c = ['cyan', 'gray', 'orange', 'red']
l=["경영", "경영정보", "회계", "관광경영"]
plt.pie(data, autopct="%.2f", colors=c, labels=l)
|
5. 히트맵
- 이미지 위에 열 분포형태로 정보를 표현해 주는 그래프입니다
data = np.random.rand(10, 10)
plt.imshow(data)
plt.colorbar()
|
6. 히스토그램
- 계량형 데이터를 구간으로 나누고, 각 구간의 도수를 표현하는 그래프로서 데이터의 분포를 확인해 주는 그래프입니다.
sigma = 2.0
mu = 3.0
data = sigma *np.random.randn(10000) + mu
plt.hist(data, bins=30, color='b')
|
Tip : 난수 발생하는 내용
'파워 파이썬 > 패키지' 카테고리의 다른 글
판다스를 활용한 데이터 시각화 (0) | 2023.10.01 |
---|---|
강력한 pandas를 이용한 데이터 처리 2 (0) | 2023.10.01 |
강력한 pandas를 이용한 데이터 처리 1 (0) | 2023.10.01 |
seoborn 패키지로 멋진 시각화하자 (0) | 2023.09.27 |
numpy 패키지를 활용한 난수 생성 (0) | 2023.09.24 |