본문 바로가기
무모한 도전-주식 인공지능 만들기

다시한번 들어가는 데이터 분석-1-

by 인터넷떠돌이 2020. 6. 7.
반응형

안녕하세요?

 

어떻게 손절매에 대한 버그가 있어서 이에 대해서 한번 작업을 다시 해야 했었고, 이제 테스트를 다시 진행해서 어떤 차이가 다시 나오는 지에 대해서 한번 생각해 보고자 합니다. 일단 어떻게 이래저래 원인을 찾는다고 많은 작업을 해서 인지 모르겠습니다만, 아무튼 간에 데이터가 많이 불어서 한동안 이 시리즈로 포스팅이 자주 올라올듯 합니다.

 

먼저 위 스크린샷과 같은 것처럼 각각의 결과가 모두 각각의 테스트 결과 폴더에 엑셀파일로 저장이 되어 있는데, 이걸 복사해서 이동하기를 해서 결과를 한개로 정리하고자 하는 엑셀 파일로 복사본만들기로 옮겨 줍니다.

 

그리고 나서 다음으로 해야 하는 작업은 역시나 최종 결과물인 계좌가 큰 순서대로 해서 이 결과들을 한번 내림차순으로 정렬해 보는 것 입니다.

 

그리고 나서 얼마나 많은 종목이 이익을 냈으며, 얼마나 많은 종목이 손해를 냈는지를 한번 살펴 보도록 합니다. 이렇게 해서 결과를 얻는데 성공하기는 성공했습니다.

 

 

그리고 나서 account에 대한 항목에 대해서 F 검정을 먼저 하도록 합니다. 여기서 하나 알 수 있는 것으로는 일단 등분산을 이루고 있는지 아닌지를 알 수 있습니다.

 

이렇게 해서 나온 결과를 보면, 유의수준인 0.05를 넘어간 P값을 가지고 있기 때문에, 등분산이 성립하고 있다는 것을 알 수 있습니다.

 

그렇게 해서 T 검정을 하는 방식을 통해서 일단 1번 조건인 RSI지수를 기반으로 해서 나온 결과를 바탕으로 변동 account Risk가 고정 account risk보다 유의차가 있는 수준으로 더 수익이 증가했다는 것을 알 수 있습니다. 그런데 평균적으로 거의 100만원을 넣어서 200만원 이상 불었다는 것을 알 수 있었습니다.

 

이번에는 위 스크린샷을 보면 알 수 있듯이 일단 WinRate라고 해서 승률이 유의차가 있는 수준으로 서로 차이가 있는지 없는지 알아 보고자 합니다.

 

먼저 나온 F 검정 결과로는 일단 둘다 등분산이 성립한다는 결과를 하나 얻을 수 있기는 있었습니다. 이래서 이제 T 검정을 등분산이 되는 경우를 가정하고 진행해야 합니다.

 

그리고 나서 결과를 보면, 유의수준을 여기서는 넘어가서 어째 유의차기 있는 수준으로 승률이 차이가 난다고 말하기 곤란한 상황이 되었습니다. 그래서 하는 수 없이 어디서 이런 문제가 나온 지에 대해서 한번 더 생각해 보고자 합니다. 일단 1번 조건인 RSI지수를 기반으로 한 가장 널널한 조건에서, 다음 포스팅에서 이어서 여러가지 지수를 가지고 테스트를 진행해 보고자 합니다.

반응형