본문 바로가기

강화학습80

400에포크 강화학습 결과와, 우연히 잡은 오류 안녕하세요? 지난번 포스팅에서 400에포크로 강화학습을 했는 강화학습의 모델이 5개 나왔다는 것을 올렸습니다. 이제 이번 포스팅에서 이 5개의 모델에 대해서 한번 강화학습을 하도록 하고, 다음으로 할 일은 지난번 포스팅에서 우연히 잡은 이 에러를 한번 잡도록 하는 시도를 했는데, 그 과정에서 있었는 줄도 모르는 오류를 하나 잡는데 성공했습니다. 먼저 구글 드라이브에서 5개의 강화학습의 모델을 다운로드 받도록 합니다. 그리고 나서 위 스크린샷처럼 RLTrader를 작동시켜서 백테스트에 들어가 보도록 합니다. 그런에 뭐라고 해야 할까요? 이번 강화학습에서도 그다지 신통치 않게도 결과가 나오는 것을 확인할 수 있었습니다. 역시 2종류의 패턴을 만들어 내기만 하고 있습니다. 실제로 백테스트의 결과를 그래프로 표.. 2019. 3. 3.
400에포크를 늘려서 하는 강화학습과 동시에 발견한 한가지 에러 안녕하세요? 지난번에 300에포크로 강화학습의 횟수를 늘려서 모델에 학습을 시켜 보았습니다만, 그렇게 결과는 좋지는 못했습니다. 그래서 이번에는 400으로 조심스럽게 올려보면서 한번 강화학습을 해 보는데, 문제는 그렇게 강화학습을 진행 시키는 동안에 한번 확인해 볼 것이 있어서 확인을 해 보는 동안 새로운 것을 하나 알게 되었습니다. 그래서 이번 포스팅에서 그 내용을 올리고자 합니다. 먼저 yellowoperation 프로젝트를 열고, 위 스크린샷에서 보이는 것처럼 400에포크로 설정을 한 다음에, 저장을 하고 구글 드라이브에 업로드해 봅니다. 그리고 나서 한번 강화학습에 들어가 봅니다. 다음으로 한번 과거의 데이터를 검색해 보았습니다. 그랬더니, 과거에는 위 스크린샷처럼 처음부터 모델이 제대로 결정을 .. 2019. 3. 2.
300에포크로 올려서 도전해본 수익모델 찾기 안녕하세요? 지난번 포스팅에서 약속드린 바와 같이, 일단 300에포크로 강화핛브의 횟수를 늘려본 다음에 한번 그 결과를 보고자 합니다. 다만 미리 말씀부터 드리자면, 지금은 딱히 이렇다 할만한 강화핛브으로 제대로 된 내용이 나오지는 않았습니다. 먼저 yellowoperation으로 가서, 위 스크린샷과 같이 전체 학습에 사용이 될 에포크의 숫자를 100에서 300으로 늘려 보도록 합니다. 첫번째 강화학습의 결과, 1시간 약 40분 정도 걸린 다음에 구글 코랩에서 강화학습이 완료가 된 것을 확인할 수 있었습니다. 일련의 과정을 거친 다음에, 총 5개의 강화학습이 완료가 된 것을 확인할 수 있었습니다. 다만 이 과정에서 모두 1시간 40분에서 2시간 가까이 걸린 것을 생각해 보면 참 많은 시간이 걸리기는 걸.. 2019. 3. 2.
새로운 agent.py를 가지고서 하는 수익모델 찾기 안녕하세요? 지난번 포스팅에서 프로그램의 묻지마 매수를 막고서, 매수결정을 인공지능에서 내릴 때 움직이도록 만드는 데는 성공했습니다. 이제는 이렇게 나오는 프로그램을 가지고서 어떻게 수익모델을 만들 수 있는지 없는지를 한번 살펴 보고자 합니다. 지난번에 1번의 강화학습으로 모델이 나왔기 때문에 4개의 모델을 더 만들고 나서 백테스트를 하고자 합니다. 두번째 강화학습이 끝나서 나서, 여기서도 제가 의도한 대로 움직여 준다는 것을 확인할 수 있었습니다. 그리고 나서 다음 강화학습의 모델도 제 의도대로 움직여 준다는 것을 확인할 수 있었습니다. 세번째 강화학습의 과정에서는 위 스크린샷에서 보이는 것처럼 묻지마 매수를 하지는 않았는데, 모두 매도 결정만 해서 잘 모르는 형태로 나왔는 것을 볼 수 있었습니다. 다.. 2019. 3. 2.