본문 바로가기
무모한 도전-주식 인공지능 만들기

InformationHunter의 수정

by 인터넷떠돌이 2019. 8. 21.
반응형

안녕하세요?

 

가지가지 사정으로 인해서 20일날 주식 모의투자는 들어가지 못했습니다. 그래도 새로이 자본금 1000만원대 100만원의 차이를 알아보기 위해서 한번 정보를 가지고 와야 하는데, 기존의 InformationHunter에서 가져온 정보가 부정확한 단점이 있었습니다.

 

일단 그전에 코스닥에서 구형 노트북-램이 3기가 짜리로 했더니, 전혀 허스트 지수가 계산이 되지 않았습니다. 그래서 기존의 PC에서 한번 코스닥을 살펴보기로 합니다.

 

이 역시 6시간이 걸리고 나서야 그런데로 쓸만한 자료가 나오는 것을 볼 수 있었습니다. 아무튼 이제 9개의 txt파일이 갖추어 졌으니, 비교 분석을 할 시간입니다.

 

일단 결과가 저장이 되어 있는 폴더를 새로이 지정을 해서 TextComparer를 돌려 보도록 해야 합니다. 당연하지만 당연하게도 이 작업을........... 수작업으로 하긴 너무 힘듧니다.

 

잠시만 기다린 끝에, 위 스크린샷에서 볼 수 있는 것처럼 일단 일련의 파케이 형식의 파일을 얻는데 성공할 수 있었습니다.

 

 

이전까지는 코스피 자료를 한번 비교 분석을 해 보았다면, 이제는 코드닥에서 나온 자료를 한번 비교 분석할 차례입니다. TextComparer에서 한번 폴더 지정을 다르게 해 줍니다.

 

이번에도 잠시 기다린 끝에, 위 스크린샷에서 볼 수 있는 것처럼 일단 파케이 형식의 파일을 얻는데 성공할 수 있었습니다.

 

이제 여기서 중요한데, 기존의 InformationHunter에서 왜 에러가 발생했느냐 했더니, 그동안 까먹은 게 하나 있었습니다. 우선 키움증권 서버에서 ohlcv 를 가지고 오면 순서가 최신이 가장 위에 오는 식으로 나온다는 것 입니다. 그래서 일단 사각 박스안에 있는 내용으로 순서를 바꾸도록 하고, 다음으로 df4[칼럼명']으로 해서 원하는 칼럼만 가지고 오도록 합니다. 그러나 이건 아직 pandas의 dataframe형태이기 때문에, iloc[-1:].values[0] 이라는 값을 넣어서 원하는 데어터만 골라 주도록 하고, 이어 나오는 값을 str()형식으로 만들어 주도록 합니다.

 

이렇게 해서, 일단 바꾼 코드에서는 전혀 에러 없이 실행이 된 것을 확인할 수 있었습니다. 이제 결과가 제대로 나왔는지 확인할 차례입니다.

 

일단 동남합성의 자료입니다. 현재가, 현재 거래량-가장 최신의 거래량과 함께 최근 20일간의 평균 거래량도 표시가 되어 있는 것을 확인할 수 있었습니다.

 

우선 종가라고 해서 가장 최근의 값이 얼마인지는 알 수 있었습니다. 여기서는 큰 문제없이 해결이 되는 것인가 했습니다만.......

 

그런데 20일 평균 거래량은 정확하게 가지고 왔으면서, 정작 문제가 현재 거래량은 틀리게 가지고 온 것을 볼 수 있었습니다.

 

알고 봤어니, df4인데 실수로 4를 빼 놓아서 이런 에러가 발생한 것 이었습니다. 그래서 이 에러를 한번 수정하도록 하고 다시한번 실행시켜 봅니다.

 

이제서야 제대로 된 결과가 나오는 것을 볼 수 있었습니다. 아직까지는 지정된 데이터만 가지고서 했기 때문에, 이제 겨우 InformationHunter의 오류를 수정했지, 진정 쓸만한 데이터를 얻는 단계에는 아직 이르지 못했습니다. 그래서 다음 포스팅 부터는 관련된 내용을 올리도록 하겠습니다.

반응형