2022년 5월 16일 월요일

오렌지에서 Missing Data 처리 (Impute Widget)

 오렌지에서 이빨빠진 데이터를 처리하는 위젯은 Impute Widget을 사용합니다.

1. 먼저 연습에서 자주 사용되는 가공되기 전의 Titanic 데이터를 다운받습니다.  Titanic 

2. 오렌지의 캔바스를 아래와 같이 배치하고 연결합니다.


3. File Widget을 선택하고 위에서 불러온 Titanic.csv 데이터를 읽어 옵니다.

(4)에서 이빨 빠진 데이터가 2.5% 임을 확인합니다.

4. Impute Widget을 선택하여 현재 Don't impute 임을 확인합니다.

5. Feature Statistics Widget을 선택하여 이빨 빠진 데이터를 확인합니다. Data Table Widget에서도 확인하세요.


38, 41번째 Age 가 "?"로 되어있슴을 확인하십시요.

6. Impute Widget을 선택하여 Default Method 탭에서 적당한 것을 선택합니다. 저는 Model-vased imputer (simple tree)를 선택했습니다. 개뱔 Feature는 아래쪽 Individual Attribute Settings에서 하면 되겠군요.

7. Feature Statistics Widget을 선택하여 데이터가 채워졌슴을 확인합니다. Data Table Widget에서도 확인하십시요.


(1),(2),(3)에서 Missing data가 채워졌슴을 확인합니다.

38 = 41, 41 =42.166.... 으로 채워졌고 평균은 29.82로 변동이 없습니다.



댓글 없음:

tensorflow gpu 사용하기에서

 tensorflow 설치시 주의해야 한다. # Anything above 2.10 is not supported on the GPU on Windows Native python - m pip install "tensorflow<2.11...