안녕하세요?


이래저래 뭐랄까 제대로 수익모델이 잘 안나오고 있다는 생각이 듭니다만, 이건 이것이고, 새로운 수익 모델은 계속해서 찾아야 할 필요성이 있기는 있으니, 그래도 어떻게 해서 한번 찾는 여정에 들어가 보고자 합니다.



학습을 하는 조건에서 15%로 지연보상 임계치를 설정해 보도록 합니다.



다만 여기서는 즉시보상을 얻으면 그대로 상점 2를 얻고, 즉시 손해를 보면 -3이라는 벌점을 주도록 합니다.



일단 이 경우에는 어떻게 된 것인지 에포크가 10일때 보다 200일때 PV가 작아지는 것을 볼 수 있습니다.



그래도 어떻게 1000에포크가 되면서 제대로 수익을 내는 것을 볼 수 있습니다.




각 10, 200, 600, 1000 에포크간의 학습 결과를 요약한 로그입니다.



방금 생성된 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보도록 하겠습니다.



기간도 제대로 테스트용 데이터 셋이 되도록 설정해 주도록 해 봅니다.



시뮬레이션 결과, 이익은 커녕 손해가 나오는 것을 볼 수 있었습니다.




다음 시도도 지연보상 임계치는 15%로 두도록 합니다.



다음으로는 action항목에서 if문을 주어서 0.1이라는 값 이하일 경우에는 그냥 관망한 하라=행동할 동기가 확실하지 않으면 행동하지 마라는 명령을 내려 주도록 합니다.



먼저 10에포크에서는 그다지 수익이 없다가 200에포크가 되면서 수익이 크게 증가하는 것을 볼 수 있습니다.



다음으로는 후반 에포크의 학습결과인데, 이익이 점점 더 극대화 하고 있는 것을 볼 수 있습니다.




각각 에포크간의 학습 로그를 나타낸 결과입니다.



방금 만들어진 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보도록 합니다.



일단 기간도 제대로 투자 시뮬레이션이 일어날 수 있도록 한번 설정해 보도록 합니다.



이번에도 수익이 아니라, 그냥 손해만 보는 결과로 나오는 것을 볼 수 있었습니다. 일단 20개의 후보를 만들어 놓고나서, 계속해서 시도를 해보고자 하는 중인데, 이런 상황에서 어떤 결고가 나올 지는 모르겠습니다. 다만 현재까지는 그렇게 만족스런 수익이 나오는 모델은 별로 없다는 것을 알 수 있었습니다.

+ Recent posts

티스토리 툴바