본문 바로가기
무모한 도전-주식 인공지능 만들기

평균회귀 테스트에서 발견한 에러 part1

by 인터넷떠돌이 2019. 8. 29.
반응형

안녕하세요?

 

주식 모의투자 실험도 상당히 중요하기는 중요하지만, 그래도 그 보다 더 중요한 것이 있는데, 바로 평균회귀 성향이 있는 종목을 알아내기 위한 테스트를 들어가는 것 입니다. 그런데 하다보니 예상치 못한 에러를 하나 발견하게 되었습니다. 그래서 잠시 이 에러를 알아내는 작업에 들어가 보고자 합니다.

 

먼저 위 스크린샷과 같이 책에서는 download_stock_data()라는 함수를 이용해서 야후 금융에서 주식의 일봉차트 데이터를 가지고 와서 평균회귀 테스트를 하였습니다.

 

그런데 한가지 문제가 있었습니다. 예제에서 사용을 하였는 데이터는 모두 최신 데이터가 가장 아래에 가는데, 제가 가지고 왔는 데이터는 최신 데이터가 가장 위에 간다는 차이가 있습니다.

 

그래서 위 스크린샷과 같이 한번 뒤집어 주는 과정이 필요하기는 필요해 보입니다. 일단 이렇게 해서 무조건 전체적인 평균회귀 테스트를 들어가기는 무리가 있습니다.

 

 

실제로 이렇게 해서 종목 하나의 데이터를 가지고 오면, 위 스크린샷과 같이 가장 오래전의 데이터가 위에 가는 식으로 만들어는 집니다.

 

다만 어떻게 된 것인지는 모르지만, 에러가 뜨는 것을 확인할 수 있는데, 이래서는 상당히 곤란하다는 생각이 듭니다. 그래서 다음과 같이 수정을 하고자 합니다.

 

위 스크린샷과 같이 sort_values라는 값을 사용한 다음에, set_index를 주도록 합니다. 이런 식을 해서 이제서야 데이터를 제대로 가져오는가 하면........

 

이제서야 제대로 날짜가 찍히면서 가장 오래된 데이터가 가장 위에 가는 식으로 어떻게 만들어 지기는 진다는 것을 알 수 있었습니다.

 

그리고 나서 이제 슬슬 궁금한 것이, 한개의 종목에 대해서 작업이 얼마나 걸리는지 알아보기 위해서 한번 시간을 측정해 보도록 했습니다.

 

일단 종목 하나를 살펴보는 데는 그렇게 많은 시간이 걸리지 않은 것을 확인할 수 있었습니다. 다만 19초라는 시간이 모이면 4시간을 넘어간다는 사실을 생각하면......... 절대로 적은 시간이 아니라는 생각이 듭니다. 일단 급하긴 해도 이 시간을 어떻게 줄이도록 해 보도록 하겠습니다.

반응형