2022년 5월 16일 월요일

오렌지에서 Missing Data 처리 (Impute Widget)

 오렌지에서 이빨빠진 데이터를 처리하는 위젯은 Impute Widget을 사용합니다.

1. 먼저 연습에서 자주 사용되는 가공되기 전의 Titanic 데이터를 다운받습니다.  Titanic 

2. 오렌지의 캔바스를 아래와 같이 배치하고 연결합니다.


3. File Widget을 선택하고 위에서 불러온 Titanic.csv 데이터를 읽어 옵니다.

(4)에서 이빨 빠진 데이터가 2.5% 임을 확인합니다.

4. Impute Widget을 선택하여 현재 Don't impute 임을 확인합니다.

5. Feature Statistics Widget을 선택하여 이빨 빠진 데이터를 확인합니다. Data Table Widget에서도 확인하세요.


38, 41번째 Age 가 "?"로 되어있슴을 확인하십시요.

6. Impute Widget을 선택하여 Default Method 탭에서 적당한 것을 선택합니다. 저는 Model-vased imputer (simple tree)를 선택했습니다. 개뱔 Feature는 아래쪽 Individual Attribute Settings에서 하면 되겠군요.

7. Feature Statistics Widget을 선택하여 데이터가 채워졌슴을 확인합니다. Data Table Widget에서도 확인하십시요.


(1),(2),(3)에서 Missing data가 채워졌슴을 확인합니다.

38 = 41, 41 =42.166.... 으로 채워졌고 평균은 29.82로 변동이 없습니다.



댓글 없음:

델파이 12.1이냐 11.3이냐?

 델파이가 12.1이 나왔습니다. 혹시 11.3버전의 커뮤니티버전이 필요하시는분이 있을 수 있을 것 같아 https://altd.embarcadero.com/.../RADStudio_11_3_esd_28... 와 이것 찾느랴 엄청고생함.