안녕하세요?


지난번 포스팅에서 보여준 실험결과는 수익은 커녕 손해만 보는 모델을 만들어 주는 것을 볼 수 있었습니다. 그래서 또 다른 수익 모델을 찾기 위해서 계속해서 시도를 해 보겠습니다.



먼저 지연보상 임계치를 15.4%로 설정을 해 주도록 합니다.



그리고 이제서야 알아냈는데, 정책학습기의 모듈도 변화시킬 필요없이 그냥, main모듈에서 지정해 주기만 하면 되는 것 이었습니다.



초반 에포크의 결과인데, 일단 수익이 꾸준히 나오고 있는 것을 알 수 있었습니다.



다만 600에포크에서 후반부에 손해를 많이 보았는 것이 좀 불안요인이기는 하지만, 아무튼 1000에포크까지 학습이 끝이 나기는 났습니다.




학습결과를 요약해준 로그인데, 일단 이것만 보면 학습내내 꾸준히 수익을 올린 것으로 나옵니다.



이제 방금 만들어진 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보도록 합니다.



기간도 제대로 테스트용 데이터 셋이 되도록 설계해 주도록 합니다.



그런데 제 기대와는 다르게 그다지 수익이 나오지 않는 것을 볼 수 있었습니다.




그리고 이번에는 지연보상 임계치를 15.3%로 바꾸어서 한번 시도해 보고자 합니다.



이번에도 강화학습에 들어가 보도록 합니다.



초반 에포크의 결과를 시각화 모듈이 보여준 결과입니다.



다만 어딘지 불길하게도, 1000에포크때 전반부에 손해를 보다가 후반부에 가서야 제대로 수익이 나는 것을 볼 수 있었습니다.




10에포크, 200 에포크, 600 에포크, 1000 에포크의 결과를 요약했는데, 학습 내내 작지만 꾸준한 수익을 내는 것을 볼 수는 있었습니다.



이제 방금 만들어진 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보도록 합니다.



기간도 제대로 설정해 주도록 합니다.



이번에는 15.28%라는 수익을 내는 것을 볼 수 있었습니다. 이렇게 해서 또 다른 수익을 내는 모델을 하나 더 찾아내는 것을 확인할 수 있었는데, 이런 모델이 많이 나와야 하는 이유에 대해서 물어보면, 당연히 수 많은 모델들을 가지고서 나중에 안전성이나 이런 것도 검사를 해 봐야 하기 때문입니다.

+ Recent posts

티스토리 툴바