2023년 1월 29일 일요일

오렌지에서 Outliers는 이상값을 탐지하는 위젯입니다.

0. 오렌지3와 Rapidminer9 으로 이상값을 추출해 보았습니다.

1. 오렌지 캔바스는 아래와 같이 구성하였습니다.


2. 데이터는 이곳에서(wine) 다운로드 받습니다.

3. 원래의 데이터에 오렌지와 래피드마인드를 비교하기위해 ID열을 추가하였습니다. ID특성을 제거하기위하여 Select Columns Widget을 사용하였습니다.

4. 군집화를 위하여 K-Means Widget을 사용하였고, 파라메터는 아래와 같습니다.


5. Box Plot Widget으로 군집화 결과를 확인해보면 래피드마인드와 차이가 납니다.



6. Outliers widget의 파라메터는 아래와 같습니다. Method를 래피드마인드와 같이 Local Outrier Factor(LOF)로 하지 않은 이유를 결과를 최대한 유사하게 하기위해서 입니다.

7. Select by Data Index를 이용하여 이상값의 위치를 확인하였습니다.

8. 래피드마이너와 결과를 비교해봅니다. 2개가 빠집니다.


9. 참고로 래피드마이너의 포로세서구성을 보입니다.







댓글 없음:

tensorflow gpu 사용하기에서

 tensorflow 설치시 주의해야 한다. # Anything above 2.10 is not supported on the GPU on Windows Native python - m pip install "tensorflow<2.11...