카이제곱(독립성) 검정은 Orange3로 통계강의 따라하기 05 (비율검정 카이제곱 chi2)에서 파이썬 스크립트를 이용하여 구했습니다. 이러한 데이터로 주어질경우에는 다음 방법으로도 할 수 있습니다. 자꾸 햇갈려서....
1. 먼저 연습에서 자주 사용되는 가공되기 전의 Titanic 데이터를 다운받습니다. Titanic
2. 오렌지의 캔바스에 위젯을 아래와 같이 배치하고 연결합니다. 진행해 가면서 연결해도 됩니다.
3. File Wedget을 선택하여 다운받은 Titanic.csv를 불러옵니다. 이미지는 생락합니다.
4. Mosaic Display Wedget을 선택하여 남여 성별로 선실 등급은 차이가 있는지 살펴봅니다. 덩달아서 생존여부와의 관계도 Interior Coloring으로 확인 할 수 있습니다.
5. Box PLot Widget을 선택하여 다음과 같이 설정하여 카이제곱의 P-Value를 구합니다.
카이제곱 통계치 = 20.38, p-Value = 0.000, 자유도 = 2임을 알 수 있으며 귀무가설을 기각하고 선실 등급은 남여 성별로 차이가 있다. 판정합니다. 그런데 구체적인 표가 없이 결과만 알게 되었네요.
6. Pivot Table Wedget을 선택하고 다음과 같이 설정하면 표를 얻을 수 있습니다.
7. 계속하여 파이썬스크립트를 이용할 때의 카이제곱값과 비교하기위하여 Select Columns Widget을 선택하여 다음과 같이 설정하여 Number가 아닌 Feature를 제외시킵니다.
8. Python Script Widget을 선택하고 아래 내용을 복사&붙여넣기를 합니다. [RUN] 버튼을 눌러 실행시키고 결과 값을 5와 비교하여 봅니다.
import Orange.data.pandas_compat as p
import numpy as np
import scipy.stats as ss
print(in_data)
idf = p.table_to_frame(in_data)
arr = np.array(idf, dtype='f')
print(ss.chi2_contingency(arr))
#out_data = p.table_from_frame(idf)
카이제곱 통계값 = 20.378, p-Value = 3.75e-05, df = 2, 그리고 기대값....
댓글 없음:
댓글 쓰기