반응형
1. 교차분석
- 교차분석은 두 범주 변수 간 관계가 상호 독립 관계인지, 연관성을 맺고 있는지를 검증하는 방법입니다.
- 적합도 검정, 독립성 검정, 동일성 검정에 사용되는데, 카이제곱 검정 통계량을 이용됩니다.
- 이 중 카이제곱 교차분석은 실제로 나온 관찰빈도(observed frequency)와 각 셀에서 통계적으로 기대할 수 있는 빈도, 즉 기대빈도(expected frequency) 간에 얼마만큼의 차이가 있는지를 카이제곱 분포(chi-squared distribution)를 참조해 통계적으로 검증하는 통계 기법입니다.
2. 상관분석
- 두 변수 간의 선형적 관계를 상관 계수로 표현합니다. 상관계수는 -1과 1 사이 값을 가집니다.
- 만약 상관 계수가 1에 가깝다면 서로 강한 양의 상관 관계가 있는 것이고, -1에 가깝다면 음의 상관 관계가 있는 것입니다. 0이면 상관 관계가 없습니다.
'데이터분석 > 데이터 탐색' 카테고리의 다른 글
다양한 데이터 스케일링(Data Scaling) (0) | 2023.11.05 |
---|---|
데이터 전처리 과정 (2) | 2023.10.02 |
데이터 분석의 시작은 데이터 탐색이다. (0) | 2023.09.30 |
두 변수 간의 관련성에 대한 이야기 (0) | 2023.09.27 |