본문 바로가기
무모한 도전-주식 인공지능 만들기

다시한번 들어가는 데이터 분석-11-complete

by 인터넷떠돌이 2020. 6. 9.
반응형

안녕하세요?

 

드디어 길고 긴 이 시리즈의 끝을 보고자 합니다. 일단 bottom 10을 가지고서 한번 작업을 한 것은 좋았는데, 이렇게 해서 일단 결론을 얻기는 얻었습니다. 아무튼 간에 이래저래 11개의 포스팅이 이렇기 길고 긴 질질끄는 시리즈를 생산할 줄은 몰랐습니다만, 그대로 중요한 데이터를 분석해서 다음 스탭을 정하기는 정해야 할 필요성은 있습니다.

 

이제 계속해서 더 알아보는 것만 하지 말고, 일단 3번 매도/매수 룰과 4번 매도/매수 룰을 한번 비교해 보아야 할 차례가 되었습니다.

 

먼저 언제나 그런 것 처럼 F 검정을 먼저 들어가 보도록 합니다. 이 검정에서 우선 두 그룹의 분산이 등분산을 이루고 있다는 것을 알 수 있었습니다.

 

그런데 여기서도 T 검정 결과 P 값이 너무 크게 나와서 둘 사이에 유의차가 없다는 결론이 나오는 것을 확인할 수 있었습니다. 이래서야 이걸 어떻게 설명할 수 있을까요?

 

 

그리고 나서 다음에는 4번 매도/매수 룰과 5번 매도/매수 룰을 이제 비교해 볼 차례가 되었습니다. 우선 account를 모두 범위로 지정해서 F 검정에 들어가 보도록 합니다.

 

F 검정 결과는 위 스크린샷과 같이 P 값이 0.05를 한참이나 넘어가기 때문에, 일단 이에 대해서는 등분산이 성립한다는 가정으로 해서 앞으로 나아가야 합니다.

 

그리고 나서 T 검정을 한번 받아보았는데, 여기서도 그렇게 특별하게 유의차가 있다고 나오지 않는 것을 확인할 수 있었습니다. 이래서야 이걸 어떻게 해석해야 할까요?

 

결국 한 단위를 뛰어 넘어서 3번 조건과 5번 조건을 한번 유의차가 있는지 없는지를 살펴보기 위한 과정에 들어가 보도록 했습니다.

 

먼저 F 검정을 받아본 결과는 P 값이 0.2로 유의수준 0.05를 한참이나 넘어갔기 때문에, 확실하게 등분산이 성립이 된다는 것을 확인할 수 있었습니다.

 

그리고 나서 다음으로 확인을 해야 하는 것으로는 역시 T 검정을 한번 해 보았는데, 여기서도 유의차가 없다는 결론만이 나왔습니다. 이래서야 결국 한 개의 매도/매수룰을 제외하고는 모두 공평하게 손해를 보고 있다는 것을 알 수 있었습니다.

 

결국 마지막 결과를 정리한 그림인데, 맨 위에 있는 이동평균선 - 표준편차 1배수가 제일 많은 손해를 보았다가 아니라 제일 적은 손해를 보았고, 그 외에 나머지는 거의 비등비등한 손해를 보고 있었다는 것을 확인할 수 있었습니다. 이렇게 해서 길고도 긴 이 데이터를 처리하는 과정을 다 확인하는 데 성공했습니다.

반응형