본문 바로가기
무모한 도전-주식 인공지능 만들기

드디어 시작한 웹 크롤링 첫걸음 -4-

by 인터넷떠돌이 2022. 4. 13.
반응형

안녕하세요?

 

이번 포스팅에서는 다른것이 아니라, 일단 이번 웹 크롤링의 첫 걸음을 어떻게 해서 다 떼기는 했지만, 그런다고 해서 크롤링의 고수가 된 것은 절대 아니고, 겨우 시작을 했을 뿐 입니다. 일단 관련된 내용을 블로그에 포스팅 하고, 이제 이래저래 다루어 보면서 하나하나 익혀야 하기는 합니다.

 

일단 if문을 붙여 주는 것으로, 저 변수에 내용이 None인 경우에 한해서 그냥 패스하도록 설계를 하기는 했습니다. 이제 이렇게 하였으니, 다음으로 넘어가 봅니다.

 

다음으로 간 것은, 바로 위 슼르니샷에서 볼 수 있는 것처럼 에러가 없이 제대로 실행되고 종료가 되는 상황이 나왔습니다. 이제 다음으로 가 보도록 합니다.

 

그래도 에러가 나서 무엇이 문제인지 봤더니, 위 스크린샷에서 보이는 것처럼 아예 공백으로 자료가 처리된 것이 있었습니다. 이런 경우에도 처리를 하도록 어떻게 처리하고, 이제 실행을 해 보았습니다.

 

일단 이렇게 해서 우선 처음의 목표에 가까운 대로 어떻게 처리를 하기는 했습니다. 다만 이런다고 해서 뉴스명은 있지만, 언론사 이름은 제대로 가지고 오지 못했습니다. 이에 대해서 어떻게 수정을 해야 하는데, 가장 큰 문제가 과거의 웹 페이지랑 달라져서 책에 있는 내용을 100% 따라만 가서는 힘들다는 것 입니다.

반응형