본문 바로가기

스프레드 시트2

모델의 변형 & 적용 -8- 안녕하세요? 지난번 포스팅에서 막 이상치에 대해서 한번 다루는 시간을 가졌는데, 이번 포스팅에서 본격적으로 다루어서 어떤 다른 결과가 나오는 지에 대해서 이야기를 해 보고자 합니다. 이렇게 이상치를 제거하는 것을 미리 알았으면 좋았겠지만, 제 통계학 지식이 여기에는 미치지 못한 것이 있기는 있었습니다. 다음 model로 model02에 대해서 한번 들어가 보도록 했습니다. 여기서 확인할 수 있는 것이라고는 일단 위 스크린샷에서 보이는 것처럼 이상치가 나올 경우 표시할 틈을 먼저 만들어 주도록 했습니다. 이렇게 해서 여기서도 Z-score의 값이 절대값으로 2 이상이 나오게 되면, 이상치로 규정을 하였더니, 역시나 이상치가 나오기는 나왔습니다. 그리고 나서 이어서 이상치로 규정이 된 값을 제거하고 진짜로 .. 2022. 2. 12.
모델의 변형 & 적용 -7- 안녕하세요? 11일날 하루종일 연달아서 포스팅을 올리면서 이상치에 대한 언급을 하기는 했었습니다. 그리고 이번에 올라오는 포스팅에서는 이에 대해서 한번 처리를 하고 나서, 다음으로 평균을 다시금 내 보도록 했습니다. 미리 알여주는 결과지만, 이상치를 제거한 것 만으로 상당한 차이가 나왔습니다. 일단 평균을 내고서 표준점수라고 Z-score를 만들어 내는 것으로 normalize를 한다는 것은 알았는데, 자료를 찾아보니 이걸 이용해서 어떻게 절대값으로 얼마 이상의 경우에는 이상치로 분류한다는 것을 보여주고 있습니다. 이걸 하기 위해서 먼저 model01에서 나온 결과에 적용시켜 보도록 합니다. 일단 여기서 알아볼 수 있는 것으로는 먼저, 평균과 표준편차 - 그것도 모집단의 표준편차라고 stdev.P라고 따.. 2022. 2. 12.