본문 바로가기

통계14

모델의 변형 & 적용 -8- 안녕하세요? 지난번 포스팅에서 막 이상치에 대해서 한번 다루는 시간을 가졌는데, 이번 포스팅에서 본격적으로 다루어서 어떤 다른 결과가 나오는 지에 대해서 이야기를 해 보고자 합니다. 이렇게 이상치를 제거하는 것을 미리 알았으면 좋았겠지만, 제 통계학 지식이 여기에는 미치지 못한 것이 있기는 있었습니다. 다음 model로 model02에 대해서 한번 들어가 보도록 했습니다. 여기서 확인할 수 있는 것이라고는 일단 위 스크린샷에서 보이는 것처럼 이상치가 나올 경우 표시할 틈을 먼저 만들어 주도록 했습니다. 이렇게 해서 여기서도 Z-score의 값이 절대값으로 2 이상이 나오게 되면, 이상치로 규정을 하였더니, 역시나 이상치가 나오기는 나왔습니다. 그리고 나서 이어서 이상치로 규정이 된 값을 제거하고 진짜로 .. 2022. 2. 12.
1차 시도는 헛다리 짚기가 되었습니다. 안녕하세요? 라고 인사는 했지만, 저는 안녕하지는 못한 상황이기는 합니다. 우선 '금융 파이썬 쿡북'이라고 에이콘 출판사에서 나온 책을 먼저 읽어보았습니다만, 왜 이렇게 데이터를 전처리 해야 되는지에 대해서는 아직도 모르겠다는 겁니다. 그나마 쓸만한 것은 이제 chapter2부터 시작인데, 여기다가 전처리한 데이터를 쓰는 것 같지는 않아 보입니다. 아무튼 그래도 이게 의미가 없지는 않은게, 일단 기계학습에 사용이 될 데이터 인 것으로 보이기는 합니다. 다만 지금은 이걸 사용하지 않을 것이기 때문에, 지금 당장은 어떻게 쓸만한 내용이 아니라는 판단을 하지만, 이게 맞는지 아닌지는 이 책을 다 읽어봐야 한다는 것이 문제라면 문제입니다. 아무튼 이래저래 무언가 살펴봐야 할 것은 많이 있는데, 제 컨디션은 그걸.. 2021. 2. 21.
다시한번 들어가는 데이터 분석-3- 안녕하세요? 지난번 포스팅에서도 어디서 어떤 요소가 있기에 변동 Account Risk가 고정 Account Risk보다 더 많은 수익을 내는지에 대해서는 알 지 못했습니다. 그래서 하는 수 없이 이번 포스팅에서 이어서 가지가지 수치들을 분석해서 한번 작업을 해 보고자 합니다. 먼저 알아보기 위해서 우선은 Risk Reward Ratio라고해서 1원을 넣을 경우 얼마나 많은 돈을 얻을 수 있는지에 대해서 한번 알아보기 위한 수치를 가지고서 통계학적인 처리를 하고자 합니다. 그리고 나서 다음으로 할 수 있는 것으로는 위 스크린샷을 보시면 알 수 있듯이 어떻게 F 검정을 하니까, 0.05인 유의수준보다 작아서 등분산이 성립하지 않는다는 것을 알 수 있었습니다. 그리고나서 T 검정을 한번 받아보고자 합니다. .. 2020. 6. 7.
1차 테스트의 데이터 분석 -5-complete 안녕하세요? 이번 포스팅에서 다루고자 하는 것은 다른게 아니라, 여전히 이어지고 있는 이 데이터 분석 작업에 대해서 드디어 마무리를 지어 보고자 하는 내용을 올려 보고자 합니다. 이번 포스팅까지 올리고 나서 정리한 다음, 다음 스탭을 한번 세워 보도록 해 보아야 겠습니다. 그리고 나서 마지막 조건에서 한번 어떻게 되는지에 대해서 알아보도록 합니다. 이 조건에서는 순전히 VR이라고 volume만을 가지고 결정을 하는데 어떻게 나올지 모르겠습니다. 먼저 필요로 하는 것은 일단 F 검정에 대한 것을 먼저 시작해 보도록 하는 것 입니다. 일단 여기서는 먼저 T 검정을 어떤 것으로 사용할지 지정하는 단계라고 할 수 있습니다. 그리고 나서 다음으로 할 수 있는 것으로는 일단, 위 스크린샷에서 볼 수 있는 것과 같이.. 2020. 6. 6.