오렌지의 많은 기능이 맘에 들지만 Line Plot Wedget은 마음에 들지 않습니다. 직관적이지 않아요. 그러나 타임시리즈에 있는 Line Chart Wedget을 이용하면 땜빵은 됩니다. 다만 0부터 시작한다는 점이 접접...
1. 오렌지의 캔바스에 아래와 같이 배치하고 연결합니다. 2개의 그룹을 하나의 캔바스에 구성하였습니다.
2. File Wedget을 선택하여 앞에서 사용한 diabetes.csv 파일을 읽어 옵니다. 케글에서 다운받으세요. Outcome을 target으로 지정하였습니다.
3. Data Sampler Wedget을 선택하여 Fixed proportion of data = 60% 로 설정합니다.
KNN Wedget의 (1)Number of neighbors 값을 1 ~ 11 까지 변동 시키면서
Test and Score Wedget을 Test on train data 와 Test on test data를 번갈아 가면서 선택 했을 때의 CA 값을 읽어
Create Table Wedget에 입력합니다. Test on train data는 2번컬럼에 Test on test data는 3번 컬럼에 입력합니다.
5. Select Columns Wedget을 선택하고 아래와 같이 설정합니다.
6. Line Chart Wedget을 선택하여 결과를 확인합니다.
이처럼 K 값(이웃의 갯수)을 변경함에 따라 학습때와 테스트때의 차이가 적게 되는 K 값을 KNN Model을 이용한 분석에 사용합니다. 여기서는 K=10 이군요.
댓글 없음:
댓글 쓰기