안녕하세요?

 

이번 포스팅에서는 역시나 계속해서 데이터의 시각화를 이어서 진행을 해 보고자 합니다. 일단 지난번 까지 해서 어디가 문제인지 몰라도, 손익을 나타내는 차트가 제대로 나오기 시작하니, 이번에는 주식의 분봉차트가 제대로 나오지 못하는 상황이 이어지고 있습니다.

먼저 위 스크린샷에서 볼 수 있는 것처럼 기존에 twinx()라는 명령어가 x축을 공유한다는 명령어인데, 이를 제거해 보도록 합니다.

이렇게 했더니, 봉차트는 그런데로 나오는 것 같기는 합니다만, 문제는 위 스크린샷에서 볼 수 있는 것처럼 손익이 제대로 나오지 못하는 것을 볼 수 있습니다.

그래서 위 스크린샷에서 나와 있는 것처럼 그냥 date를 추출하면 문자열로 나오는데, 이를 datetime의 날짜 형식의 데이터로 바꾸어 주는 작업을 시작해 보도록 합니다.

 

 

그리고 나서 날짜를 지원하기 위해서, 이번에는 matplot에 있는 dates항목을 가지고 오도록 합니다. 이렇게 하는 것으로 일단 작업을 시작할 수 있습니다.

그리고 나서 이 데이터의 형식을 일단은 날짜 형식으로 바꾸어 주어야 할 필요성이 있기 때문에, 위 스크린샷에서 붉을 줄을 친 부분처럼 다시 바꾸어서 에러를 없애줍니다. 이게 왜 생기냐 하면, 기존의 데이터는 YYYYMMDDHHmmSS의 형태로 되어 있어서 이에 맞추어서 바꾸어야 할 필요성이 있습니다.

그리고 나서 위 스크린샷에서 보이는 것처럼 일단 plt에 gca()라는 함수를 추가해 주는 것으로 x축을 날짜로 바꾸어 주는 작업을 시작해 보도록 합니다.

그런데 결과가 그렇게 좋지 않은 것으로 나오는 것을 확인할 수 있었습니다. 이래서야 상황이 더 악화만 되었다고 할 수 있습니다.

 

그래서 이 문제를 해결할 방법으로 혹시나 해서 위 스크린샷의 밑줄 친 부분이 원래는 True인데, 그렇게 하지 않고 False로 바꾸어 보았습니다. 이게 서브 플롯의 x축을 모두 공유하느냐 마느냐 옵션인 것으로 보이는데........

그리고 나서 기존의 date로 되어 있던 x축의 값은 그냥 인덱스의 값으로 바꾸어 주도록 바꾸어 보았습니다. 그냥 날짜를 게속해서 사용하는 것으로는 수지가 맞지 않는다는 생각이 들었습니다.

이렇게 해서 일단 성공적인 작업이 되기는 되었습니다. 비록 분봉차트가 상당히 지저분하게 되기는 되었습니다만, 이건 잠시 접어 두도록 하고, 지금으로서는 이것만으로 만족을 해야만 하는 상황이 되었습니다. 하지만 이것도 일련의 작업을 겨우 시작에 불과합니다. 앞으로 이어지는 포스팅에서 이를 개선하는 과정을 담아 보도록 하겠습니다.

+ Recent posts