본문 바로가기
무모한 도전-주식 인공지능 만들기

모델의 변형 & 적용 -8-

by 인터넷떠돌이 2022. 2. 12.
반응형

안녕하세요?

 

지난번 포스팅에서 막 이상치에 대해서 한번 다루는 시간을 가졌는데, 이번 포스팅에서 본격적으로 다루어서 어떤 다른 결과가 나오는 지에 대해서 이야기를 해 보고자 합니다. 이렇게 이상치를 제거하는 것을 미리 알았으면 좋았겠지만, 제 통계학 지식이 여기에는 미치지 못한 것이 있기는 있었습니다.

 

다음 model로 model02에 대해서 한번 들어가 보도록 했습니다. 여기서 확인할 수 있는 것이라고는 일단 위 스크린샷에서 보이는 것처럼 이상치가 나올 경우 표시할 틈을 먼저 만들어 주도록 했습니다.

 

이렇게 해서 여기서도 Z-score의 값이 절대값으로 2 이상이 나오게 되면, 이상치로 규정을 하였더니, 역시나 이상치가 나오기는 나왔습니다.

 

 

그리고 나서 이어서 이상치로 규정이 된 값을 제거하고 진짜로 평균을 내는 작업에 들어가 보도록 합니다. 여기까지도 스프레드 시트의 기능으로 간단하게 처리가 가능했습니다.

 

그리고 나서 이어서 model03에 대해서 한번 작업에 들어가 보도록 합니다. 여기서도 먼저 이상치로 판정이 나왔을 경우 제거할 수 있도록 준비를 해 주도록 합니다.

 

이렇게해서 model03을 가지고서 얻은 결과에서도 이상치가 나오는 것을 확인할 수 있었습니다. 이제 다음으로 진행해야 할 것으로는 역시나......결과를 종합적으로 보는 것 입니다.

 

여기서 정말 흥미로운 결과는 바로 여기서 나왔습니다. 일단 기존에는 model01에서 2000에포크가 가장 나은 결과였지만, 이상치를 제거한 상황에서는 위 스크린샷에서 볼 수 있는 것처럼 어떻게 model03에서 6000에포크 기계학습을 한 결과가 가장 우수한 것으로 나왔습니다.

반응형