인공지능62 RLtrader의 제작 part6-final! 안녕하세요? 이번 포스팅에서 드디어 RLTrader의 마지막 모듈까지 모두 코딩을 하고서, 그 내용을 포스팅 하고자 합니다. 하지만 이러고도 주식 데이터를 가지고 오는 과정이 남아 있고, 또 이걸 HTS와 연계시키는 것 까지도 상당히 중요한 내용이라면 중요한 내용이 아직 남아 있습니다. 아무튼 그 첫 과정인 RLtrader를 구성하는 4가지 모듈을 다 코딩하는 내용을 보여드리겠습니다. 먼저 위 스크린샷은 지연보상이 발생한 경우에 학습을 수행하는 flt()함수의 부분입니다. 여기서는 148번째 줄에서 학습없이 메모리의 최대 크기만큼이나 batch_size가 찼을 경우에 지연보상을 한다고 하는데, 이 부분은 제가 기계학습에 대해서 아직도 잘 모르는 부분이 많아서 잘은 모르겠습니다. 그리고 158번과 160번.. 2018. 10. 22. RLtrader의 제작 part5 안녕하세요? 이번 포스팅에서는 RLtrader의 마지막 남은 모듈인 정책 학습기 모듈을 만드는 과정을 포스팅 하고자 합니다. 그 전에 먼저 정책 학습기라는 것이 무엇이냐 하면, 에이전트, 환경, 정책신경망을 가지고 강화학습을 수행하는 모듈로, RLtrader의 몸통이라고 할 수 있습니다. 먼저 policy_learner.py의 첫 머리에서 위 스크린샷처럼 import를 여러개 만들어 주도록 합니다. 여기서 from이라는 말은 무슨 의미냐 하면, import하고자 하는 모듈이면 상위 패키지, 가져올 것이 클래스라면 상위의 모듈을 지정하는 명령어 입니다. 그리고 as는 import한 모듈, 패키지, 클래스, 함수를 다른 이름으로 사용하기 위한 키워드 입니다. 이어서 위 스크린샷이 클래스의 시작 부분입니다. .. 2018. 10. 21. RLtrader의 제작 part3 안녕하세요? 지난번 포스팅에서 RLtrader의 환경 모듈과 정책 네트워크를 만드는 과정까지를 포스팅 하였습니다. 원래라면 이번 포스팅에서 남은 모듈을 다 만들려고 했습니다만, 너무 내용이 길고 어려워서 다 만드는 것은 어려웠습니다. 그래서 하는 수 없이 남은 모듈을 남겨두고, 포스팅의 내용도 너무 길어서 중간에 끊어야만 했습니다. 먼저 위 그림은 이 RLtrader에서 사용할 기계학습의 모습을 대략적으로 나타낸 모식도입니다. 이 기계학습에서 입력층은 17차원이라고 하는데, 이는 학습 데이터 15개와 에이전트 상태 2개를 합쳐서 17차원이 되었습니다. 그리고 은닉층의 수와 차원은 조절할 수 있으며, 마지막 출력층에서는 투자 행동인 매수나 매도, 2가지 행동이 나오기 때문에 이렇게 지정을 하였습니다. 그래.. 2018. 10. 19. RLtrader의 제작 part2 안녕하세요? 지난번 포스팅에서 RLtrader에서 환경모듈을 만드는 것을 보여주었습니다. 이번 포스팅에서는 에이전트(Agent)모듈이라고 해서 주식을 매수하거나 매도하는 투자자 역할을 하는 모듈을 만들 것인데, 이전에 만들었던 환경 모듈과는 다르게 상당히 길어서 다소 정신이 없을 수도 있습니다. 먼저 import라는 명령어는 다른 모듈을 가져와서, 그 모듈에 있는 함수를 쓸 수 있도록 만들어 줄 수 있습니다. 그리고 이 에이전트 모듈에서는 다음과 같은 속성들이 사용이 됩니다.initial_balance: 초기 투자금, balance: 현금 잔고, num_stocks: 보유 주식수portfolio_value: 포트 폴리오 가치라고 해서, 투자금 잔고+(주식현재가 * 보유 주식수)=포트 폴리오 가치를 나타냅.. 2018. 10. 18. 이전 1 ··· 8 9 10 11 12 13 14 ··· 16 다음