본문 바로가기

전체 글3551

8개 모델의 추가적인 결과 part2 안녕하세요? 지난번 포스팅에 이어서 이번에도 한번 8개의 모델을 하루종일 작업을 해서 얻었으며, 관련된 내용을 이번 포스팅에서 이어서 올리고자 합니다. 3번째 모델의 강화학습 결과도 역시 마찬가지로 어떻게 된 것인지 에포크가 증가하면 증가할 수록 그냥 주식을 사서 보유만 하고 있는 것을 볼 수 있습니다. 4번째 모델의 강화학습 결과도 다를 것이 없어서, 역시 1000에포크가 되면서 랜덤한 행동이 줄어 들면서, 계속해서 주식을 보유만 하는 현상이 벌어지고 있습니다. 5번째 모델의 결과도 역시 마찬가지라고 할 수 있습니다. 6번째 강화학습이 어떻게 이루어 졌는지 알려주는 결과입니다. 여기서 계속해서 차이가 없는 것 같은 기분이 들기도 합니다. 7번째 강화학습의 결과를 보고 계십니다. 여기서도 역시 1000 .. 2018. 12. 23.
8개 모델의 추가적인 결과 part1 안녕하세요? 이번 포스팅에서는 금요일 밤에 열심히 구글 코랩의 TPU를 돌려서 나온 강화학습의 모델들과, 이 모델들이 어떤 학습을 했으며, 얼마나 수익이 나오는 지를 한번 살펴 보고자 합니다. 그런데 내용이 너무 길다는 생각이 들어서 중간에 한번 잘라야 했습니다. 먼저 1시간 30분 정도 걸려서 첫번째 모델을 얻는데 성공했습니다. 이제 시간이 걸려서 두번째 모델도 얻었습니다. 세번째 모델도 순조롭게 얻는데 성공했습니다. 4번째 모델도 순조롭게 얻어 오는데 성공하기는 했습니다. 이제 계속해서 하루종일 작업을 해서 5번째 모델도 얻는데 성공했습니다. 계속해서 구글 드라이브의 제 폴더 안에 강화학습의 모델이 쌓여가기 시작합니다. 그런데 6번째 강화학습부터 새로운 일이 생긴 듯 했습니다. 뭐냐 하면, 바로 강화.. 2018. 12. 23.
5개의 강화학습 모델의 분석결과 안녕하세요? 지난번 포스팅에서 하루종일 매달려서 절반은 어떻게 구글 코랩을 작동 시키는 줄 몰라서 애를 먹었고, 나머지 절반은 이제 겨우 강화학습의 모델을 5개 얻는다고 시간을 다 썼습니다. 이제 이 강화학습 모델들이 어떤 결과를 줄지 모르기 때문에 일단 한번 가지고 와서 백테스트를 해보고자 합니다. 먼저 1번 모델의 학습결과를 각각 10에포크, 200에포크, 600에포크, 1000에포크로 나누어서 보여준 결과입니다. 일단 학습횟수가 많아져도 그다지 별로 달라지지 않는 것을 볼 수 있었습니다. 다음이 2번 모델의 경우인데, 이 경우에도 그다지 많이 달라지는 것을 볼 수 없었습니다. 그냥 주식이 오랜 시간이 지나면서 꾸준히 상승해서 때문인가요? 계속해서 그냥 주식이 상승하는 것만을 볼 수 있었습니다. 3번.. 2018. 12. 22.
TPU를 이용한 강화학습으로 모델의 작성 안녕하세요? 지난번 시간에는 GPU를 이용해서 2시간 43분의 시간이 걸려서 강화학습의 모델을 하나 만들어 내는 것을 보았습니다. 이번에는 구글에서 TPU라고 해서 기계학습을 위한 전용 보드를 사용해서 기존의 CPU와 GPU에 비해서 훨씬 빠른 연산을 하는 것을 보여 주었다고 하는데, 일단 저로서는 이게 더 빠른 하드웨어라는 것만 알 수 있었습니다. 이번 포스팅에서는 이게 얼마나 더 빨라지는 가를 보면서, 강화학습의 모델을 4개 만들어 보고자 합니다. 먼저 노트설정의 항목으로 가서, 위 스크린샷과 같이 TPU를 하드웨어 가속기로 설정해 주도록 합니다. 그런데 GPU를 사용했던 때에서는 멀쩡했던 코드가 왜인지 모르게 에러를 일으키기 시작하는 것을 볼 수 있었습니다. 그래서 이번에는 matplotlib의 p.. 2018. 12. 21.