본문 바로가기

전체 글3569

웹 크롤링의 실습 -8- 안녕하세요? 이제부터 본격적으로 이 웹 크롤링을 어떻게 성공했으며, 그 과정에 대해서 포스팅을 이어서 올리고자 합니다. 일단 지난번 포스팅에서는 그 중간 과정을 보여드렸습니다만, 이번 포스팅에서는 최종 목표지점까지 가기 위해서 이래저래 밟아가는 과정을 한번 표시해 보고자 합니다. 먼저 위 슼릔샷과 같이 일단 escape character를 제거한 다음에, 이 결과에서 어떻게 결과를 추출할 수 있는지에 대해서 알아 보고자 합니다. 일단 적정가격 항목은 무언가 손이 많이 필요해 보이며, 나머지 항목에 대해서는 그렇게 많은 손볼 곳이 없다는 생각이 듭니다. 이제 다음의 과정을 한번 밟으러 가 봅니다. 먼저 첫번째 요소에 대해서 띄어쓰기로 잘라주기를 시도한 다음에, 원이나 쉼표를 없애 주도록 합니다. 그렇게 하.. 2022. 8. 1.
웹 크롤링의 실습 -7- 안녕하세요? 아직까지 무언가가 좋지 않은 가운데, 그래도 어떻게 1일 1포스팅을 지켜보고자 한번 오늘의 포스팅을 시작해 보고자 합니다. 일단 웹 크롤링을 기본적으로 할 수 있는 것을 한번 시도해 봤는데, 일단 여기까지는 그럭저럭 성공적으로 끝이 났습니다. 다만, 이후에는 어떨지 모르겠습니다. 실제로 print(repr())함수를 사용했더니, 위 스크린샷에서 볼 수 있는 것처럼 escape character가 나오는 것을 확인할 수 있었습니다. 그리고 나서 다음으로 진행을 해보고자 하는 것으로는 일단, div중에서 class:line3가 있는 태그를 한번 가지고 올 수 있는 코드를 짜 보았습니다. 그렇게 해서 일단 제대로 가지고 올 수 있는데, 우선 escape character가 상당히 거슬린다면 상당히.. 2022. 7. 31.
웹 크롤링의 실습 -6- 안녕하세요? 이제서야 겨우겨우 실험노트의 정리가 끝이 나서, 본격적으로 포스팅을 해 볼까 했더니, 몸이 많이 지치고 있습니다. 아무튼 지친것은 지친거고, 오늘의 포스팅은 안할 수 없어서 하는 수 없이 이번에 무언가를 해 보아야 겠습니다. 일단 이 작업을 하기 위해서 포스팅을 올려 보고자 합니다. 일단 이렇게 해서 제대로 무언가를 가지고 올 수 있으며, 그 다음으로는 우선 적정가격을 가져올 수 있는지를 한번 실험해 보았습니다. 그렇게 해서, 일단 작업을 하기는 했는데, 제대로 가져올 수 있기는 커녕, 상황이 그리 좋지 못하다는 것을 확인할 수 있었습니다. 그래서 다음으로 시도한 것은 일단 기본적으로 제공이 되는 코드를 잡고서 한번 이걸 제대로 가져 올 수 있는지 아닌지 테스트를 하도록 합니다. 일단 이렇게.. 2022. 7. 30.
웹 크롤링의 실습 -5- 안녕하세요? 이래저래 무언가 정신이 없게 만드는 컨디션 때문에 작업이 잘 되지 않고 있기는 하지만, 그래도 어느정도 소기의 성과를 거두기는 해서, 이번 포스팅에서 관련된 내용을 넣어 보고자 합니다. 일단 하기 위해서는 먼저 밀려 있는 포스팅을 어느정도 마무리 해야 하면서도 동시에 실험노트도 정리하고 있는 중 입니다. 먼저 위 스클니샷에서 볼 수 있는 것처럼, 일단 특정한 문구를 가지고 있으면 쓸만한 것으로 판단을 해서, 여기서 if문으로 체크를 해 주도록 합니다. 이렇게 해서 일단 무언가 데이터를 가지고 오는 것 까지는 성공적으로 끝이 났습니다. 하지만 여기서 끝낼 수는 없는게, 일단 이 데이터를 저장할 수 있도록 해야 합니다. 이렇게 해서 일단 위 스크린샷에서 볼 수 있는 것처럼, 우선 종목명과 증권사.. 2022. 7. 29.