본문 바로가기

무모한 도전-주식 인공지능 만들기1651

웹 크롤링의 실습 -4- 안녕하세요? 일단 그럭저럭 실습이 진도를 나아가서, 어느정도 성과를 내기는 냈습니다. 문제는 이렇게 성과가 나오는 것은 좋은데, 이걸 어떻게 해서 또 포스팅을 잔뜩 올려야 할 정도로 무언가가 많이 밀리기는 밀렸습니다. 다만, 이런다고 해서 실험노트를 정리해야 할 정도로 아직 나온 것이 없어서 이것도 문제라면 문제입니다. 일단 먼저 주목을 한 것은 저 부분에 있는 바로 저 내용입니다. 이 문구가 있는 부분이 실질적으로 무언가 내용을 가지고 올 수 있어 보이기는 보입니다. 그래서 이번에는 위 스크린샷에서 볼 수 있는 것처럼, 일단 실제로 저 문구가 있으면 제대로 내용을 알려주는 것인지 알아보고자 했습니다. 그리고 이것이 사실이라는 것을 알 수 있었습니다. 이제 이를 바탕으로 해서 가지고 있는 내용 중에서 우.. 2022. 7. 27.
웹 크롤링의 실습 -3- 안녕하세요? 일단 한 단계까지 진행을 하였는 이 웹 크롤링에 대해서 한번 정리를 하고자 이 포스팅을 올리기 시작했는데, 아무튼 간에 이렇게 해서건 간에 정리를 정리대로 하고, 나머지 작업을 나머지 작업대로 해 봐야 겠다는 생각이 듭니다. 아무튼 이렇게 해서 하나하나 다른 기능을 배워 나가야 합니다. 먼저 결과를 정리하기 위해서 위 스크린샷과 같은 무언가를 만들어 놓고 나서, 한번 작업을 시작해 보도록 했습니다. 왜 이렇게 했느냐 하면................ 가장 상단에 있는 첫머리인데, 여기서는 다른 것이 아니라 항목의 이름이라고 할 수 있는 정보들이 나오는 것을 확인할 수 있었습니다. 그리고 나서 2번재 항목부터 무언가 증권사의 의견이라고 할 수 있는 내용이 나오는 것을 확인할 수 있었습니다. 이.. 2022. 7. 26.
웹 크롤링의 실습 -2- 안녕하세요? 일단 개인적인 일이 있어서 어떻게 진행이 정체되어 있는 가운데, 그래도 이미 했는 내용에 대해서 일단 포스팅이라도 올려 보고자 해서, 이번 포스팅을 준비하게 되었습니다. 일단 여기서 팍스넷에서 정보를 가지고 오는 것은 그렇게 까지 어렵지 않게 되겠지만, 다른데서 정보를 가지고 오는 것은 좀 어려울 지도 모르겠습니다. 먼저 request와 beutifulsoup를 통해서 가지고 온 결과입니다. 이렇게해서 어떤 웹사이트에 있는 결과든지 가져올 수 있기는 있습니다만, 다만 이 결과물을 바로 읽어서 해석하긴 매우 힘듧니다. 먼저 필요한 부분의 태그만 가지고 올 수 있도록 일단 위 스크린샷에서 보이는 부분을 가지고 오도록 합니다. 이렇게해서 보드 타입만 가지고 오면......... 일단 상당히 많은 .. 2022. 7. 26.
웹 크롤링의 실습 -1- 안녕하세요? 어떻게 해서 이번 포스팅부터 시작을 해서, 웹 크롤링에 관해서 실습을 하기는 해 보고서 어떻게 제 것으로 만드는 과정을 밟아 가고자 합니다. 일단 이 과정을 밟기 위해서는 다른것이 아니라, 책을 보면서 한번 따라하는 과정도 거쳐봐야 하는데, 다소 답답할 수 있으리라 봅니다. 일단 모든 웹사이트는 크롬에서 위 스크린샷에서 볼 수 있는 것처럼, 일단 검사라는 기능을 통해서 어떤 식으로 만들어져 있는지 확인할 수 있습니다. 그리고 나서 위 스크린샷에서 볼 수 있는 것처럼, 특정한 파트에 어떤 코드가 사용이 되었는지 알아보기 위해서는 일단 위 스크린샷에서 볼 수 있는 것처럼 보도록 합니다. 그리고 나서 각각의 항목에 대해서 이렇게 대조를 해 보는 것으로 일단, 어떤 태그를 사용하고 있는지에 대해서 .. 2022. 7. 25.