본문 바로가기
무모한 도전-주식 인공지능 만들기

코스닥(kosdaq)에서 종목선별을 하는 작업

by 인터넷떠돌이 2020. 1. 6.
반응형

안녕하세요?

 

지난번 포스팅에서는 코스피에서 어떤 종목의 분봉 캔들 차트를 가지고 올지를 계산했는데, 이번 포스팅에서는 한국 주식시장의 또 다른 축이라고 할 수 있는 코스닥(kosdaq)에서 작업을 하도록 해 보고자 합니다. 

먼저 코드 리스트를 생성하는 프로그램으로 가서, 이번에는 코스피가 아니라 코스닥을 한번 지정해서 놓고 난 다음에 작업을 이어가도록 해 봅니다.

일단 이렇게 해서 일단 코스닥의 전체 리스트를 얻기는 얻었습니다. 이제 이 종목에 대한 종목의 명칭과 현재가가 얼마나 되는지를 알아보는 시간이 왔습니다.

이제 information hunter를 작동시켜서, 방금 얻었는 전체 코스닥의 리스트가 들어가 있는 텍스트 파일을 지정하도록 하고, 정보를 얻도록 합니다.

 

 

상당히 오래 걸릴 줄 알았는데, 의외로 10일 이전의 데이터만 가지고 오는 것 때문인지는 몰라도, 그냥 47분 만에 완성이 되는 것을 확인할 수 있었습니다.

이렇게 해서 일단 텍스트 파일 형태로 결과를 얻는데 성공했는데, 이대로만은 그냥 활용할 수는 없으니, 이제 엑셀에서 이 데이터를 열어야 합니다.

엑셀에서 먼저 데이터 정렬을 하는 것으로 일단, 1주당 가격이 그냥 1000원 미만인 코스닥의 종목들을 모두 제거해 버리도록 합니다.

 

그리고 나서 스펙이라고 이름이 뒤에 붙은 이 일종의 펀드같은 종목들을 모두 제거해 주는 단계에 들어가 보도록 합니다. 이 작업은 수작업으로 해서 좀 정확하지 않을 수 있습니다.

모두 제외를 시키고 나니, 위 스크린샷과 같이 1190개의 종목이 남아 있는 것을 볼 수 있습니다. 많이 제거를 한다고 했지만, 상당히 많은 종목인 것은 부인할 수 없습니다.

앞으로 있을 데이터 수집을 위해서, 위 스크린샷과 같이 일단 텍스트 파일에 집어 넣어 보도록 합니다. 이렇게 하는 것으로 일단 다음의 작업을 하기 위한 준비에는 이제 다 들어갔습니다. 문제는 아직 분봉차트를 가지고 올 프로그램이 다 완성이 된 것이 아니어서, 좀 작업이 밍기적 거릴 수 있지만, 아무튼 갈 수 있는 데 까지 가도록 해 보겠습니다.

반응형