오렌지에서 이빨빠진 데이터를 처리하는 위젯은 Impute Widget을 사용합니다.
1. 먼저 연습에서 자주 사용되는 가공되기 전의 Titanic 데이터를 다운받습니다. Titanic
2. 오렌지의 캔바스를 아래와 같이 배치하고 연결합니다.
3. File Widget을 선택하고 위에서 불러온 Titanic.csv 데이터를 읽어 옵니다.
(4)에서 이빨 빠진 데이터가 2.5% 임을 확인합니다.4. Impute Widget을 선택하여 현재 Don't impute 임을 확인합니다.
5. Feature Statistics Widget을 선택하여 이빨 빠진 데이터를 확인합니다. Data Table Widget에서도 확인하세요.
38, 41번째 Age 가 "?"로 되어있슴을 확인하십시요.
6. Impute Widget을 선택하여 Default Method 탭에서 적당한 것을 선택합니다. 저는 Model-vased imputer (simple tree)를 선택했습니다. 개뱔 Feature는 아래쪽 Individual Attribute Settings에서 하면 되겠군요.
댓글 없음:
댓글 쓰기