본문 바로가기

강화학습80

수익모델을 또 찾기위한 여정-2- 안녕하세요? 지난번 포스팅에서 보여준 실험결과는 수익은 커녕 손해만 보는 모델을 만들어 주는 것을 볼 수 있었습니다. 그래서 또 다른 수익 모델을 찾기 위해서 계속해서 시도를 해 보겠습니다. 먼저 지연보상 임계치를 15.4%로 설정을 해 주도록 합니다. 그리고 이제서야 알아냈는데, 정책학습기의 모듈도 변화시킬 필요없이 그냥, main모듈에서 지정해 주기만 하면 되는 것 이었습니다. 초반 에포크의 결과인데, 일단 수익이 꾸준히 나오고 있는 것을 알 수 있었습니다. 다만 600에포크에서 후반부에 손해를 많이 보았는 것이 좀 불안요인이기는 하지만, 아무튼 1000에포크까지 학습이 끝이 나기는 났습니다. 학습결과를 요약해준 로그인데, 일단 이것만 보면 학습내내 꾸준히 수익을 올린 것으로 나옵니다. 이제 방금 만.. 2018. 11. 9.
수익모델을 또 찾기 위한 여정 안녕하세요? 지난번 포스팅에서는 원숭이 투자자(MT)가 10개 작동시켜 보니 평균 2.38%의 수익을 올렸다는 것을 보여주었습니다. 그래서 앞으로 수익모델을 또 찾아 보기는 보는데, 적어도 이 원숭이 투자자 보다는 훨씬 더 나오는 모델을 찾아야 한다는 것 입니다. 먼저 지연보상 임계치를 15%로 주어서, 이전에 42.9%의 수익이 나왔는 모델의 학습조건과 동일하게 만들어서, 한번 더 모델을 만드는 과정에 들어가 보고자 합니다. 혹시나 잘못되지는 않을까 해서,정책 학습기 모듈에서도 역시 지연보상 임계치를 같이 맞추어 주도록 합니다. 이제 강화학습에 들어가 보도록 합니다. 그리 길지 않은 시간-1시간 30분이 좀 지나고 나서는 강화학습이 완료가 되는 것을 볼 수 있었습니다. 일단 10 에포크에서는 준수한 성.. 2018. 11. 9.
인공지능 주식투자로 더 많은 수익을 올리기 위한 여정-5- 안녕하세요? 지난번에는 그럭저럭 만족할 만한 수익이 나오기는 나왔는데, 그래도 아직 만족이 다 되지는 않아서, 계속해서 더 높은 수익이 나오지 않는지 한번 찾아보고자 합니다. 이전에는 좀 숫자가 조금 이상한데, 아무튼 15.5%의 지연보상 임계치를 설정해 주고서 한번 강화학습을 진행해 보고자 합니다. 혹시나 해서, 한번 정책 학습기에 있는 fit()함수에서도 바꾸어 주도록 합니다. 일단 강화학습이 제대로 제가 설정한 조건대로 진행이 되는 것을 확인할 수 있었습니다. 이 역시 3시간 넘어 걸린 기계학습 결과 1000에포크의 학습이 완료가 되는 것을 확인할 수 있었습니다. 일단 초반 에포크에서는 그런데로 준수한 수익을 내는 것을 볼 수 있습니다. 그리고 1000에포크가 되면서 수익을 올리는 정도가 최대가 되.. 2018. 11. 9.
인공지능 주식투자로 더 많은 수익을 올리기 위한 여정-4- 안녕하세요? 지난번 포스팅에서는 정말 쥐 꼬리만한 수익이 7개월간 나오는 것을 포스팅 하였는데, 이런 수익에는 만족할 수가 없어서 더 큰 수익을 올리는 모델이 없는지 한번 찾아보고자 나서는 중 입니다. 다음 조건에서 한번 기계학습을 시작하도록 코드를 변형해 봅니다. 혹시 몰라서 정책 학습기에서 fit()함수도 교체를 해 주는데, 일단 여기서는 지연보상 임계치를 15%로 하고 나머지 조건은 건드리지 않고서 그대로 두도록 합니다. 여기서는 변화를 주기 위해서 이전에는 -1로 되어 있는 손실이 났을 경우에 벌점을 더 올려서 한번 -1점에서 -2점으로 만들어 주도록 합니다. 그리고 중요한 기간 필터링도 있는데, 여기를 제대로 설정해 주어서 제대로 학습용 데이터를 지정해 주도록 합니다. 먼저 지정된 조건으로 기계.. 2018. 11. 8.