본문 바로가기

주식투자451

드디어 시작한 웹 크롤링 첫걸음 -4- 안녕하세요? 이번 포스팅에서는 다른것이 아니라, 일단 이번 웹 크롤링의 첫 걸음을 어떻게 해서 다 떼기는 했지만, 그런다고 해서 크롤링의 고수가 된 것은 절대 아니고, 겨우 시작을 했을 뿐 입니다. 일단 관련된 내용을 블로그에 포스팅 하고, 이제 이래저래 다루어 보면서 하나하나 익혀야 하기는 합니다. 일단 if문을 붙여 주는 것으로, 저 변수에 내용이 None인 경우에 한해서 그냥 패스하도록 설계를 하기는 했습니다. 이제 이렇게 하였으니, 다음으로 넘어가 봅니다. 다음으로 간 것은, 바로 위 슼르니샷에서 볼 수 있는 것처럼 에러가 없이 제대로 실행되고 종료가 되는 상황이 나왔습니다. 이제 다음으로 가 보도록 합니다. 그래도 에러가 나서 무엇이 문제인지 봤더니, 위 스크린샷에서 보이는 것처럼 아예 공백으로.. 2022. 4. 13.
드디어 시작한 웹 크롤링 첫걸음 -3- 안녕하세요? 이번 포스팅에서는 지난번 포스팅에서 발생하면 안되는 예제의 에러를 보고서 한번 작업을 이어서, 이 오류를 수정하고 나서 움직여 보고자 합니다. 일단 이 작업을 하기 위해서는 이래저래 모르는 것도 많았습니다만, 그래도 달달 책을 외우기만 해서는 이게 안될 일이기는 합니다. ㅇ리단 어떻게 하였나 하면, 바로 list_news2 라는 태그가 과거의 웹페이지 - 다음 뉴스 페이지에서는 있었습니다만, 지금의 웹 페이지에서는 없어서 생기는 문제입니다. 그래서 list_newsissue라고 태그를 바꾸어 주었더니, 이렇게 그럭저럭 쓸만한 내용으로 나오는 것을 확인할 수 있기는 있었습니다. 그리고 나서 위 스크린샷에서 보이는 것처럼 3줄의 코드를 추가하는 방법을 통해서 이번에도 어떻게 먹히는지 아닌지에 대.. 2022. 4. 13.
드디어 시작한 웹 크롤링 첫걸음 -2- 안녕하세요? 이번 포스팅에서는 다른것이 아니라, 일단은 지난번 포스팅에 이어서 한번 작업을 해 보고자 합니다. 우선 해야 할 것으로는 계속해서 예제에 있는 코드는 Ipython 환경에서 사용했는데, 저 처럼 파이참에서 사용하기 위해서는 조금 해야 할 것이 많이 있습니다. 그리고 나서 일단 다음으로 있어야 하는 코드를 붙여넣어 보도록 했습니다. 이런 상황에서 다시 실행을 해서 에러가 나오는지 아닌지 보도록 합니다. 그리고 나서 다음으로 진행을 하고자 했는 것이 있는데, 바로 위 스크린샷에서 볼 수 있는 것과 같이, 일단 여기까지는 에러없이 제대로 실행이 됩니다. 그리고 나서 다음으로 진행을 하고자 하는 것으로, 역시나 위 슼르니샷에서 볼 수 있는 것처럼, 일단 새로운 코드를 덧 씌워서 계속 시도해 보도록 .. 2022. 4. 13.
드디어 시작한 웹 크롤링 첫걸음 -1- 안녕하세요? 오랫동안 소식이 없었는데, 그 동안 Yukkuri Run을 만들기 위해서 좀 힘을 쓴다고 너무 집중을 하고 있어서 다른 무언가를 하기가 힘이 들었습니다. 그래도 조금의 여유가 생긴 김에 일단 미루고 미뤄왔던 이 웹 크롤링을 이용해서 금융정보를 얻고 - 주로 재무제표에 관한 자료를 얻은 다음에, 이를 응용해 보고자 합니다. 일단 새로운 프로젝트를 생성해야 하는데, 하는 방법은 그렇게 어렵지는 않았습니다. 일단 기존에 사용한 적이 있는 파이썬 환경을 그냥 가지고 오도록 합니다. 그리고 나서 위 슼릔샷에서 볼 수 있는 것처럼, 일단 가장 간단하게 어떻게 파이썬 프로그램을 만들어서 시동으로 메세지를 띄우는 것부터 시작해 보고자 합니다. 일단 에러없이 제대로 메세지가 뜨는 것을 확인할 수 있었습니다... 2022. 4. 13.