본문 바로가기
무모한 도전-주식 인공지능 만들기

효율적 투자선으로 종목을 선정하기 위한 여정 -5-

by 인터넷떠돌이 2020. 8. 29.
반응형

안녕하세요?

 

점점 하면 할수록 처음에는 조금 클릭 몇번이면 끝날 것으로 예상을 했지만, 이게 스케일이 커져서 무언가 특단의 조치를 취해야 할듯 합니다. 거기다가 텍스트 파일을 나눌때 쓴 남이 만든 프로그램도 무언가 버그를 일으켜서, 이대로는 무리라는 생각이 듭니다.

 

문제는 이런 식으로 790개가 넘어가는 이상한 텍스트 파일이 한개가 아니라 2개가 생성이 되었다는 것 입니다. 일단 이건 잠시 옆으로 접어 두도록 하고, 계속해서 수작업을 이어가 보도록 했습니다.

 

일단 이렇게 해서 하나하나 0.10미만의 비중을 가진 종목을 제거해 보도록 했습니다. 이렇게 제거해서 하나씩 필터링을 하는 것은 좋습니다만.........

 

문제는 이렇게 50몇개를 넘어가다 보니 정말로 노가다가 따로 없이 되는 것을 확인할 수 있기는 있었습니다. 이제는 여기서 골라낸 종목을 하나의 리스트로 합쳐야 합니다.

 

 

문제는 이렇게 해서 한번 걸러낸 종목의 갯수도 236개로 만만치 않은 종목의 갯수가 생성이 되었다는 점 입니다. 이 종목의 갯수를 다시금 나누어야 하는데........... 이것도 슬슬 귀찮아 지려고 합니다.

 

일단 80개를 기준으로 해서 3개의 텍스트 파일로 나누는 과정을 거쳐보았습니다. 이렇게 해서 텍스트 파일의 리스트를 생성해 보도록 하고...........

 

3개로 나누어진 결과를 위 스크린샷에서 보이는 것처럼 일단 각각의 폴더에 저장하고자 했습니다. 이렇게 해서 저장한 결과가 좋으냐 하면........

 

일차적으로는 겉으로 보이는 결과는 제대로 생성이 되는 것을 확인할 수 있기는 있었습니다. 문제는 정작 종목의 선택을 하려고 하면 나왔습니다.

 

가장 높은 비율을 지닌 종목이 0.02라고 해서 백분률로 따지면 2%에 지나지 않는 상황이 나오는 것 입니다. 이래서야 이걸 가지고 포트폴리오를 구성하니 마니라고 하기에는 너무 미미합니다.

 

거기다가 처음에 시작한 종목의 갯수가 80개임을 생각하면 너무 한번의 필터링으로 걸러지는 갯수가 많습니다. 67개나 되기 때문에, 이걸 여러번 해야 한다는 것인데, 더 이상은 수작업으로 이걸 반복한다는 것은 매우 힘든 과정이 되었습니다. 그래서 하는 수 없이 프로그램을 이제까지 해왔는 수작을 대신할 수 있도록 만들어 주어야 합니다.

반응형