반응형
많은 데이터를 정리요약 즉 기술통계 분석을 위해 필요한 패키지가 있습니다.
주요 패키지에 대해 설명하고자 합니다.
주요 패키지 설명
1. numpy 패키지
NumPy(“넘파이”) 패키지는 파이썬에서 선형 대수(linear algebra) 계산 및 통계기능을 제공합니다. 다차원 배열 클래스(n-dimensional array)와 벡터화 연산(vectorized operation)을 지원하며 연산속도를 높여줍니다.
2. pandas 패키지
Pandas(“판다스”) 패키지는 테이블형태와 같은 데이터프레임(DataFrame) 자료형을 제공합니다. 자료의 탐색이나 기술통계를 계산할 때 유용합니다. R 언어에서 제공하는 데이터프레임 자료형을 파이썬에서 제공할 수 있도록 하는 목적이었으나 더 다양한 기능이 추가되었습니다. 외부의 파일을 읽는 메소드는 read_csv("파일명"), read_excel("파일명",sheet_name="시트명") 등 파일을 읽어 데이터프레임 데이터형식으로 저장됩니다.
3. matplotlib 패키지
Matplotlib(“맷플롯리브”) 패키지는 파이썬에서 각종 그래프나 챠트 등을 그리는 시각화 기능을 제공합니다.
4. seabourn 패키지
Seaborn(“시본”) 패키지는 Matplotlib 패키지에서 지원하지 않는 고급 통계용 시각화 기능을 제공합니다
주요 패키지를 import 함
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
데이터 분석을 할 경우는 4개의 패키지를 import하여 작업을 시작합니다.
'파워 파이썬 > 실습환경' 카테고리의 다른 글
파이썬 또는 데이터 분석을 위한 coblab 이해하기 (0) | 2023.09.24 |
---|