안녕하세요?


지난번 포스팅에서는 새로운 시도가 그렇게 만족스럽지 않았고, 그런 와중에서도 테스트용 데이터 셋으로 다시 테스트를 했을 경우에는 변하는 것이 없이 제대로 나오는 것을 볼 수 있었습니다. 이번 포스팅에서도 더 많은 수익을 올릴 수 있는지 알아보기 위해서 다양한 조건에서 기계학습을 진행시키고, 이 조건에 맞춰서 테스트용 데이터셋에서 얼마나 수익을 올릴 수 있는지를 알아 보고자 합니다.



이번에는 지연보상 임계치를 13%인 0.13이라는 수치를 지정해 주도록 합니다.



혹시나 해서 한번 정책 학습기에서도 변형을 시켜 주도록 해 줍니다.



기계학습에 들어가 보도록 합니다.



어느정도 시간이 걸리고 나면 기계학습이 끝나는데, 약 3시간 정도 걸린 듯 합니다.



기계학습 결과입니다. 일단 에포크가 높아지면서 수익을 더 내는 것으로 보이기는 합니다.



그런데 에포크가 1000에 가까워 지면 질수록 어째서 인지 몰라도 수익을 못 내고 오히려 손해를 보고 있는 것을 볼 수 있었습니다.



일단 강화학습을 했는 결과를 정리한 표 입니다. 어째서 인지는 몰라도, 초반부에서는 수익을 어느정도 보다가 나중에 가서는 제대로 된 수익을 못내고, 오히려 자본금을 까먹는 것을 볼 수 있었습니다.




어찌되었건 간에 일단 투자 시뮬레이션에 들어가기 위해서 먼저 model_ver를 지정해 주도록 합니다.



그리고 기간도 제대로 정해 주도록 합니다. 실제로 하다가 이걸 헷갈려서 테스트용 데이터셋으로 학습을 하는 불상사가 벌어질 수도 있습니다.



투자 시뮬레이션의 결과입니다. 여기서는 PV가 예상과는 달리 증가한 것을 볼 수 있었습니다. 다만 그 정도가 이전과는 다르게 11.7%의 수익을 거둘 수 있었다는 것을 볼 수 있었습니다.



그리고 한번 또 다른 실험을 위해서 이번에는 17%의 지연보상 임계치에 대해서 한번 기계학습을 진행해 보도록 합니다.



그리고 언제나 그렇듯이 이번에도 정책 학습기에서도 한번 17%로 설정해 주도록 합니다.



기계학습에 들어가는 것 까지는 성공했으며



이번에도 거의 3시간 정도 걸려서 기계학습이 끝나는 것을 확인할 수 있었습니다.




일단 초반 에포크의 모습인데, 그럭저럭 수익이 제대로 나오는 것을 볼 수 있었습니다.



그리고 마지막에 가서는 손해가 적은 상황에서 수익을 많이 올리는 것을 볼 수 있었습니다.



그리고 에포크가 진행이 될때 마다 PV의 가치가 올라가기는 가는 것을 볼 수 있습니다.



그리고 나서 방금 생성된 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보도록 합니다.



여기서 한번 기간을 헷갈려서 이상한 테스트를 하게 되엇는데, 이를 제대로 설정해 주도록 합니다.



수익이 나올 것이라 예상한 제 기대와는 다르게, PV가치가 반토막이 난 것을 확인할 수 있었습니다.



일단 초반부에 수익을 조금 올렸다가 이후에는 완전히 손해만 있는대로 보는 것을 볼 수 있습니다. 어디가 어째서 이런 결과가 나온 것인지는 모르겠습니다만, 그래도 이런 것이 기계학습의 매력인지 특징인지 모르겠습니다. 아무튼 이렇게 결과가 나왔으니, 17% 지연보상 임계치에서는 그다지 좋은 수익을 내는 모델이 나오지 않는 다는 것을 볼 수 있습니다.

+ Recent posts

티스토리 툴바