본문 바로가기
무모한 도전-주식 인공지능 만들기

1차 테스트의 데이터 분석 -2-

by 인터넷떠돌이 2020. 6. 5.
반응형

안녕하세요?

 

이번 포스팅에서는 기존에 사용한 적이 없었는 엑셀의 사용법을 한번 시도해 보아야 했습니다. 바로 통계처리라는 항목인데, 과거에는 T-test하나만 어떻게 했다면, 이게 생각보다 많은 종류가 있어서 이래저래 헤메이게 되었습니다. 아무튼 헤멘것은 사실이지만, 그래도 어떻게 해서 이걸 사용하고 그 결과를 만들어 보았습니다.

 

먼저 엑셀의 옵션 메뉴를 불러와서, 여기서 있는 개발도구를 체크표시를 하고서 일단 확인을 눌러 주도록 합니다. 이렇게 하면............

 

기존에는 없던 개발도구라는 메뉴가 열리는 것을 확인할 수 있었습니다. 이렇게 해서 일단 하나 나왔으니, 개발도구 안으로 들어가 보도록 합니다.

 

추가기능을 선택해서 여기서 분석도구라는 항목을 일단 그대로 가져 오도록 합니다. 이렇게 해서 가지고 왔으면, 이제 다음 작업에 들어갈 수 있게 됩니다.

 

데이터 항목에 들어가게 되면, 기존에는 없었는 데이터 분석이라는 도구가 새로 생기게 되는데, 여기서 통계처리를 할 수 있도록 도와주는 기능이 있습니다.

 

 

그리고 나서 F검정이라는 것을 먼저 선택하도록 합니다. 아직 제가 통계에 대해서 잘 모르기는 하지만, 들은 바로는 이게 두 상관관계 없는 집단의 분산이 등분산을 따르는지 아닌지를 알아보는 테스트라고 합니다.

 

여기서 변수1은 바로 고정 Account Risk에서 나온 profit을 지정하도록 했습니다. 그리고 나서 변수2은 바로 변동 Account Risk의 profit을 일단 지정해서 작업 하도록 했습니다.

 

이렇게 해서 결과가 나왔습니다. 일단 여기서 헷갈리면 안되는 것이 P단측검정을 2배해서 나온 값이 0.05보다 크면 등분산이 성립한다는 것이고, 아니면 등분산이 아니다 = 즉 미만일 경우에는 아니라고 할 수 있는 것 입니다.

 

그리고 나서 일단 2배를 해 보기는 보았지만, 여전히 0.05라는 유의수준에는 미치지 못합니다. 그러므로 여기서는 등분산이 성립하지 않는다는 것을 볼 수 있습니다.

 

이게 왜 중요하냐 하면, 위 스크린샷에서 볼 수 있는 것과 같이 일단 등분산이 성립하지 않으면 t 검정을 할 때 이분산 가정 두집단을 해야 하기 때문입니다.

 

여기서 하나 알 수 있는 것은 일단 변수1은 고정 Account의 profit을 지정했고, 변수2는 변동 Account의 profit을 지정하는 것으로 했습니다.

 

그렇게 해서 무엇을 알 수 있었냐 하면, P값이 0.05보다 훨씬 작기 때문에 둘의 차이에 유의차가 있으며, 변동 Account Risk를 사용한 경우의 이익이 유의차 있게 더 크다는 것을 확인할 수 있었습니다. 물론 이건 위에서 10개 종목만을 기준으로 했지만, 그래도 이렇게 하는 것이 의미가 있으리라 생각합니다.

반응형