본문 바로가기
무모한 도전-주식 인공지능 만들기

2주차 시험운전을 위한 준비 -3-

by 인터넷떠돌이 2021. 1. 18.
반응형

안녕하세요?

 

이러저러한 사정이 많이 있어서 블로그 포스팅을 올려야 할 내용은 많은데, 올리는 속도는 많이 늦어지고 있습니다. 그래도 일단 1주차 시험운전이 그럭저럭 제대로 에러없이 끝이 났다는 생각이 들어서, 이제는 다음 작업에 들어가 봐야 겠다는 생각이 들었고, 이번 포스팅부터는 그 내용을 올리고자 합니다.

 

일단 위 스크린샷에서 볼 수 있는 것과 같이, 일단은 보기에 무언가 펀드로 보이는 종목들에 대해서는 걸러 주도록 합니다. 그런데 결과론적인 이야기이지만, 여기서 이런 원시적인 방법으로 걸러내는 것은 한계가 있어 보입니다.

 

이렇게 해서 일단 일련의 제거가 끝이 났지만, 그래도 여전히 많은 종목이 남아 있습니다. 이제 현재가가 낮은 종목 - 모의투자에서는 거래도 안되는 1000원 미만인 종목들에 대해서 일단 제거에 들어가 봐야 합니다.

 

그래서 현재가를 기준으로 해서, 일단 정렬을 시켜 보도록 합니다. 그리고 나서 위 스크린샷에서 볼 수 있는 것처럼 천원 미만인 종목들을 모두 제거하고도.......... 코스피에서는 여전히 많은 종목들이 아직 후보로 남아 있습니다.

 

그리고 나서 이제 해야 하는 것은 코스닥인데, 역시 텍스트 파일로 추출된 결과를 위 스크린샷에서 볼 수 있는 것과 같은 엑셀 파일로 만들어 주도록 합니다.

 

 

코스닥에서도 일단 스팩과 같이 펀드로 보이는 종목을 제거하도록 합니다. 이렇게 해서 일정한 종목들을 하나하나 제거해 나가도록 합니다.

 

그런데 제거하고 나서도, 위 스크린샷을 보시면 알 수 있듯이 일단 1300개가 넘는 종목이 아직도 남아 있습니다. 이제 현재가를 기준으로 해서 제거해야 합니다.

 

여기서도 천원 미만이라서 모의투자에서는 거래도 되지 않는 종목에 대해서 일단 제거를 해 주었습니다. 그런데 여기서 확인할 수 있는 결과로는, 우선 위 스크린샷을 보시면 알 수 있듯이 1200개가 넘는 종목이 여전히 남아 있습니다.

 

그렇게 해서 일단 필터링이 된 종목 리스트를 확보할 수 있게 되었습니다. 이제 다음 단계로는 이 종목들 중에서 어느 종목들이 쓸만한지 그 결과를 가지고 오는 것이라고 할 수 있겠습니다.

 

일단 다음으로 진행을 하기 위해서는 역시 분봉차트 데이터 베이스가 필요합니다. 그런데 모든 과정 - 무려 1980년대 데이터 까지 필요한 것은 아니기 때문에, 일단 위 스크린샷의 작년 12월 7일을 기준으로 짤라서 캔들챠트 데이터를 수집하도록 합니다.

 

그리고 나서 다음으로 진행해 보아야 하는 것으로는 위 스크린샷에서 볼 수 있는 것처럼, 일단 데이터를 사냥하기 위한 프로그램을 작동시키는 것 입니다.

 

일단 코스피의 데이터의 확보에만 위 스클니샷에서 볼 수 있는 것처럼, 일단 3시간 넘게 걸리는 것을 확인할 수 있었습니다. 이제 다음으로 넘어 가도록 합니다.

 

이렇게 해서 일단 코스피의 캔들챠트 데이터 베이스를 확보할 수 있는데 성공할 수 있었습니다. 이렇게 하는 것으로 이제 다음으로 해야 할 것은 코스닥의 데이터 베이스 파일을 확보하는 것이고, 다음으로는 효율적 투자선 이론에 따라 종목을 선정하는 것이라고 할 수 있겠습니다.

반응형