본문 바로가기
무모한 도전-주식 인공지능 만들기

코스피(kospi)에서 종목을 선정하는 작업

by 인터넷떠돌이 2020. 1. 6.
반응형

안녕하세요?

 

지난번 포스팅까지 어떻게 해서 작업을 하기는 했는데, 이제 본격적으로 펀드나 1주당 가격이 1000원 미만인 종목에 대해서 한번 쳐낼 종목은 쳐내도록 해야 합니다. 이 작업을 하기 위해서 이번 포스팅에서는 코스피에 한해서 작업을 하였고, 그 내용을 올려 보고자 합니다.

먼저 위 스크린샷과 가팅 일단 txt파일로 되어 있는 종목들을 엑셀에서 열도록 합니다. 당연하다면 당연하게도 ; 로 구분이 되기 때문에 다른 셀에 표시하는 것 까지는 문제가 없습니다. 

먼저 처음 시작하면 얼마나 많은 종목이 코스피에 있는지를 볼 수 있는데, 일단 코스피에서만은 1500개가 넘는 종목이 있다는 것을 먼저 알 수 있었습니다.

 

먼저 해야 할일은 위 스크린샷에서 볼 수 있는 것과 같이 일단 가격을 기준으로 오름차순 정렬을 해서, 1주당 1000원이 되지 않아서 모의투자에 적합하지 않은 종목은 탈락 시키도록 합니다.

다음으로는 하나니켈1호 같은 이름으로 되어 있는 일종의 펀드를 모두 제외하도록 합니다. 굳이 따지자면, 특별한 이유가 없다고 할 수 있지만, 일단 펀드의 경우에는 이전에 종목을 파다가 그냥 해산되어 버리는 경우를 보았기 때문에, 이런 일을 방지하기 위함이 큽니다.

이렇게 해서 쳐낼 종목은 다 쳐낸 결과, 위 스크린샷처럼 겨우 남은 종목은 809개의 종목이 남은 것을 볼 수 있습니다. 이렇게 해서 남았으니, 이제 절반 가까이 줄었다고 할 수 있어 보입니다.

 

그리고 혹시나 중복이 된 종목이 있는가 싶어서, 엑셀에서 조건부 서식을 이용, 중복된 종목의 이름이 있는지에 대해서 한번 알아보고자 합니다.

확인결과 중복된 종목이 없었고, 그래서 이번에는 종목의 코드 리스트만 가지고서 txt파일에 앞으로의 작업을 위해서 한번 저장해 주도록 합니다. 이렇게 하는 것으로 이제 코스피에서 모의투자 대상으로 - 즉 분봉차트를 가지고 올 종목을 일단 선정하는 데 성공했습니다. 이제 코스닥이 남아 있다고 할 수 있습니다.

반응형