본문 바로가기

강화학습80

수익모델을 또 찾기 위한 여정-7- 안녕하세요? 지난번 포스팅에서는 만족스러운 수익모델이 전혀 발견이 되지 않았습니다만, 그래도 계속해서 수익모델을 찾고자 하는 시도는 계속했었고, 이번 포스팅에서는 수익 모델이 하나 나왔습니다. 이번에는 학습이 일어나는 과정에서 시작하는 무작위 행동의 비율을 100%로 지정을 해주는 것으로 해서, 한번 강화학습에 들어가 보고자 합니다. 역시나 예상대로 초반 행동의 결과에서는 정말로 완전히 노란색이 되어서 전혀 인공지능이 행동을 하지 않은 것을 볼 수 있었습니다. 다만 1000에포크에 이르러서는 전혀 랜덤한 행동이 없는 것을 볼 수 있었습니다. 그리고 마지막 1000에포크에 이르러서는 수익을 크게 올리는 것을 볼 수 있었습니다. 다음으로는 방금 만들어진 모델을 가지고서 한번 투자 시뮬레이션에 들어가 보고자 .. 2018. 11. 11.
수익모델을 또 찾기 위한 여정-5- 안녕하세요? 다시 한번 더 수익모델을 찾기 위해서 또 다른 조건을 바꾸어서 한번 기계학습을 시키고, 여기서 만들어진 모델을 바탕으로 한번 투자 시뮬레이션을 해서 제대로 수익이 나오는 지를 살펴 보고자 합니다. 이전에는 지연보상 임계치를 15%로 동일하지만, 지연보상 규칙에서 그냥 있을 경우 0으로 바꾸어서 다시한번 이 보상규칙을 바꾸어서 강화학습에 들어가 보도록 합니다. 일단 에포크가 초반인데, 더 진행이 되면 될 수록 PV가 증가하는 것을 볼 수 있었습니다. 그리고 나서 600에포크에서 그냥 손해를 있는대로 보기는 했지만, 1000에포크에서 더 많은 수익을 내는 것을 볼 수 있었습니다. 그리고 나서 10, 200, 600, 1000에포크에서 나오는 값을 각각 요약한 요약본입니다. 그리고 나서 방금 만들.. 2018. 11. 10.
수익모델을 또 찾기위한 여정-4- 안녕하세요? 지난번 포스팅에서는 수익을 내는 모델을 찾기는 찾았는데, 정말 쥐꼬리만한 수익만 내는 모델이 나와서 이래저래 실망이 많기는 많았습니다. 그래도 이번에도 또 다른 수익 모뎅을 찾을 수 있으리라 생각을 하고서 한번 찾아 보고자 합니다. 이번에는 지연보상 임계치를 15%로 지난번과 동일하게 지정을 하고 나서, 다시한번 움직여 보도록 합니다. 단, 지연보상 수치에서 상점을 2로 주고, 벌점을 -2, 그리고 그냥 있을 경우에는 0.5점을 주도록 일단 설정을 했습니다. 그런데 문제가 생겼는데 약 5시간 정도로 너무 오랜 시간이 기계학습에 걸린 것 입니다. 일단 PV가치가 나오는 4번째 윈도우에서 보면, 너무 많은 학습이 이루어 지는 것을 볼 수 있는데, 아무래도 이거 좋지 못한 징조가 나오는 듯 합니다.. 2018. 11. 10.
수익모델을 또 찾기 위한 도전-3- 안녕하세요? 지난번 포스팅에서 수익률이 15.28%가 나오는 모델이 나왔는데, 이 모델만 가지고서는 만족할 수는 없어서 이번에도 다양한 시도를 할까 합니다. 이번에는 지연보상 임계치에 대해서 15.2%를 주어서 학습을 시키고자 합니다. 제 조건대로 제대로 기계학습이 이루어 지고 있는 것을 볼 수 있습니다. 먼저 초반 에포트의 결과인데, 200에포스에서 엄청난 손해만 보는 것을 볼 수 있습니다. 그리고 어딘가 불길해 보이게 수익이 1000에포크에 가까워 질수록 더 나오는 것은 볼 수 있었지만, 손해도 그에 만만치 않음을 알 수 있었습니다. 그리고 이어서 에포크간에 나온 학습결과의 로그입니다. 일단 에포크가 증가하는 것과 PV가 크게 관계가 없어 보입니다. 투자 시뮬레이션을 위해서 우선 방금 만든 모델을 지.. 2018. 11. 9.