본문 바로가기
무모한 도전-주식 인공지능 만들기

다시한번 들어가는 데이터 분석-4-

by 인터넷떠돌이 2020. 6. 7.
반응형

안녕하세요?

 

결국 지난번 포스팅을 통해서도 어디서 이런 차이를 만드는 지를 알 수 없었습니다만, 그래도 다음 단계를 확인하기 위해서 일단 이번 포스팅의 내용을 올려 보고자 합니다. 여기서는 다른게 아니라 Top 10이 있으면 반대로 bottom 10이라고 해야 할까요? 수익이 아니라 손해를 본 10개 종목에 대해서 한번 알아 보고자 합니다.

 

먼저 위 스크린샷을 보시면 알 수 있듯이 일단 bottom 10을 한번 작업해 두도록 했습니다. 그렇게 해서 일단 total profit이 -가 된 종목들이 있는 것을 확인할 수 있었습니다.

 

다음으로 한번 작업을 들어가 보기 위해서, 일단 저 마이너스가 난 total profit을 한번 범위로 해서 통계학적 처리를 해 보고자 합니다.

 

일단 F 검정을 한 결과를 보면, 여기서는 우선 위 스크린샷을 보면 알 수 있듯이 일단 등분산이 성립하도록 유의수준 0.05를 훨씬 넘어가는 것을 볼 수 있습니다.

 

이렇게 해서 일단 T 검정을 받아보니, 여기서는 그렇게 좋지 못한 것이 일단 유의차가 있는 수준으로 두 집단의 손해량이 차이가 나는 것이 아니라는 것을 알 수 있었습니다.

 

 

결국 RSI 지수를 기반으로 하는 방법을 뒤로 하고서, 여기서는 이제 이동평균선과 표준편차를 1배 해주는 메서드에서 어떤 차이가 나오는지 한번 알아보고자 합니다.

 

먼저 Account라고해서 테스트를 끝낸고 나서 나온 계좌를 가지고서 한번 작업에 들어가 보고자 합니다. 일단 여기서 하나 알 수 있는 것은...... 이 둘의 차이가 이번 조건에서 유의차 있는 차이를 만들어 냈는가 여부 입니다.

 

그리고 나서 F 검정을 한번 받아보기는 보았습니다. 여기서 나오는 값을 가지고서 한번 보자면, 유의수준인 0.05를 한참 밑돌기 때문에, 하는 수 없이 등분산이 성립하지 않습니다.

 

그래서 이분산 가정으로 해서 나온 T 검정을 한번 받아 봤습니다. 이렇게 해서 나온 결과를 보자면, 유의차가 있는 수준으로 어떻게 해서 변동 Account Risk가 더 큰 수익을 냈다는 것을 알 수 있었습니다.

 

여기서도 한번 WinRate가 어떤 영향을 주었는지 아닌지 알아보기 위해서 일단 범위로 지정을 한 다음에, 한번 작업에 들어가 보고자 합니다.

 

F검정 결과 아슬아슬한듯 한데, 일단 유의수준 0.05를 단측검정만 해도 10배나 넘겼고, 2배를 해주는 양측검정을 하면 확실하게 등분산이 성립하는 것을 알 수 있었습니다.

 

그런데 등분산을 가정해서 나온 결론을 가지고서도 일단 둘은 유의차가 있는 수준으로 다른게 아니라는 것 입니다. 이래서야 이걸 가지고서 어떻게 해야 할지 모르겠다는 생각이 듭니다만, 아무튼 이건 이것이고, 다음의 데이터를 분석하기 위해서 움직여 보아야 겠습니다.

반응형