본문 바로가기
무모한 도전-주식 인공지능 만들기

웹 크롤링의 실습 -1-

by 인터넷떠돌이 2022. 7. 25.
반응형

안녕하세요?

 

어떻게 해서 이번 포스팅부터 시작을 해서, 웹 크롤링에 관해서 실습을 하기는 해 보고서 어떻게 제 것으로 만드는 과정을 밟아 가고자 합니다. 일단 이 과정을 밟기 위해서는 다른것이 아니라, 책을 보면서 한번 따라하는 과정도 거쳐봐야 하는데, 다소 답답할 수 있으리라 봅니다.

 

일단 모든 웹사이트는 크롬에서 위 스크린샷에서 볼 수 있는 것처럼, 일단 검사라는 기능을 통해서 어떤 식으로 만들어져 있는지 확인할 수 있습니다.

 

그리고 나서 위 스크린샷에서 볼 수 있는 것처럼, 특정한 파트에 어떤 코드가 사용이 되었는지 알아보기 위해서는 일단 위 스크린샷에서 볼 수 있는 것처럼 보도록 합니다.

 

 

그리고 나서 각각의 항목에 대해서 이렇게 대조를 해 보는 것으로 일단, 어떤 태그를 사용하고 있는지에 대해서 확인할 수 있기는 있습니다.

 

우선 여기서는 다 class = "line"을 쓰고 있다는 것을 확인할 수 있기는 있었습니다. 이제 이를 바탕으로 해서, 어떻게 다음의 스탭을 밟아 보도록 합니다.

 

이제 파이참을 실행시켜 보도록 하고, 위 스크린샷에서 볼 수 있는 것처럼 새로운 파이썬 파일을 생성해 보도록 합니다. 이렇게 해서 프로그램을 간단하게 짜 주도록 합니다.

 

일단 이렇게 해서 팍스넷의 증권정보 게시판에서 정보를 맨 처음에는 어떻게 가져올 수 있는지에 대해서 한번 이야기를 해 보고자 합니다. 일단 이렇게 해서 첫 걸음을 겨우겨우 떼기는 했습니다만, 이게 첫 걸음이지, 앞으로 걸어야 하는 걸음이 많기는 상당히 많습니다.

반응형