본문 바로가기
무모한 도전-주식 인공지능 만들기

다시한번 들어가는 데이터 분석-7-

by 인터넷떠돌이 2020. 6. 8.
반응형

안녕하세요?

 

계속해서 이어지는 데이터 분석에 관한 내용을 올리면서, 일단 데이터를 분석하는 중인데, 이제 이 데이터도 상당수 분석이 되기는 되었습니다만, 아직도 남아 있는 내용이 많아서 몇개의 포스팅 시리즈가 더 이어져야 할듯 합니다. 아무튼 이래저래 중간 과정을 기록해야 하기 때문에, 일단 포스팅으로 남겨 놓고자 합니다.

 

먼저 4번째 매도/매수룰을 가지고서 한번 bottom 10이라고 손해만 가장 많이 본 종목만을 골라서 한번 작업을 해 보고자 합니다.

 

그리고 나서 Account를 가지고서 한번 F 검정을 해 보았는데, 여기서 나오는 것을 가지고서 알아보니, 등분산이 성립한다는 것을 알 수 있었습니다.

 

그리고 나서 등분산을 가정해서 나오는 T 검정을 해 보니까, 위 스크린샷에서 볼 수 있는 것처럼 일단 P 값이 유의수준을 한참이나 넘어가서 유의차가 있는 더 많은 손실이 있었다 없었다라고 말하기 곤란한 상황이 되었습니다.

 

 

이제 마자믹 매도/매수 룰을 가지고서 한번 작업을 해 보기 위해서 조건을 가지고서 가장 많은 수익을 냈는 10개의 종목씩 가지고 오도록 합니다.

 

그리고 나서 양측검정을 한번 해 보았더니, 여기서 나오는 값을 가지고서 한번 알아보니, 0.05라는 유의수준을 양측 P 값에서 겨우 넘기는 것을 볼 수 있었습니다. 이래서 등분산이 성립하기는 한다는 것을 알 수 있었습니다.

 

그리고 나서 한번 등분산을 가정한 T 검정을 가지고 보았더니, 여기서 볼 수 있는 것은 겨우겨우 유의수준을 넘어가서 유의수준이 없다는 결론을 낼 수 있었습니다.

 

그리고 나서 다음으로 볼 수 있는 것으로는 승률이 어떤 통계적인 유의차가 있는지 없는지 알아보기 위해서, 한번 범위를 지정해서 F 검정을 받아 봅니다.

 

여기서는 일단 유의수준을 넘어가기 때문에 등분산이 완전히 성립한다는 것을 확인할 수 있었습니다. 이렇게 해서 이제 T 검정을 받아 보도록 하겠습니다.

 

그리고 나서 P 값을 살펴보니, 일단 유의수준을 거의 10배나 넘어가서 둘의 승률에 차이가 유의차가 있게 어떻게 변했다고 말하기가 어렵다는 생각이 듭니다. 일단 이렇게 해서 한개의 포스팅이 끝나기는 끝났는데, 아직도 데이터는 남아 있기 때문에 정리는 계속해서 이어질 듯 합니다.

반응형