본문 바로가기

빅데이터3

빅데이터(?)의 처리하는 방법-2- 안녕하세요? 지난번 포스팅부터 무언가 pandas의 데이터 프레임으로 처리를 할 수 없는 작업들-제 컴퓨터의 8기가 RAM으로도 메모리 에러라는 메모리 부족 현상때문에 처리할 수 없는 대량의 데이터-저는 이 정도면 사실상 빅데이터라고 하기 싶은데, 상대적으로 가정용으로 가지고 있는 조금은 구형인 PC에서는 처리할 수 없을 정도로 큰 데이터를 어떻게 처리할 수 있는지에 대해서 한번 들어가 보고자 합니다. 그래서 지난번에는 왜 인지 계속해서 numpy를 인식하지 못하는 가 했더니, 위 스크린샷에서 나와 있는 것처럼 stack overflow를 찾아 보니까, numpy를 업그레이드 시켜 주라는 이야기가 있었습니다. 그래서 pip install --upgrade numpy라고 입력해서 업그레이드를 시켜 보도록 .. 2019. 5. 7.
많이 듣기는 했지만, 정확히는 몰랐는 '빅데이터' 안녕하세요? 4차 산업혁명이니 뭐다 해서 3D 프린터와 인공지능만 생각하기 쉽지만, 그 중에 하나로 포함되어 있는 것이 바로 '빅 데이터'라는 것도 포함되어 있습니다. 지금까지 말로는 많이 빅데이터, 빅데이터 라고 들어는 봤지만, 정확히는 무엇인지 알지는 못했습니다. 그런데 Newton의 2017년 11월호 기사를 보니 이에 대한 설명이 있기에, 이번 포스팅에서 다루고자 합니다. 일단 기사에서 나와있는 가장 간단한 정의를 보자면 [디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터 뿐아니라 문자와 영상 데이터를 포함하는 대규모 데이터]라고 정의가 되어 있습니다. 한마디로 데이터의 그 양이 상당히 크다고 해서 이름에서 부터 '빅'이 붙었는 건지도 모르겠습니다. 그.. 2017. 11. 1.
인공지능 의사 '왓슨'에 대한 최신 동향 안녕하세요? 예전 포스팅에서 인공지능 의사라고 해야 할까요? 의료용 AI인 '왓슨'에 대해서 포스팅을 했던 적이 있었습니다. 링크 : 인공지능 의사인 왓슨에 대한 기사를 읽고나서 그때는 왜 왓슨이 사용되며, 무슨 일을 하는지에 대해서만 설명을 하였는데, 9월달 '과학동아'의 기사를 읽어보니, 이 '왓슨'에 대해서 몇몇 흥미로운 사실이 있기에, 이번 포스팅에서는 관련된 내용을 포스팅 하고자 합니다. 먼저 과학동아의 기사가 작성된 것은 8월달로 보이는데, 이 시점에서 한국에 '왓슨'이 도입된지는 9개월이 되었으며 414명의 환자를 진료하는데 사용이 되었다고 합니다. 한달에 평균 50명의 환자를 진단 했으며, 환자 한명당 20분 이상이 걸렸다고 합니다. 그러면서 이 과학동아의 기사가 나온 2017년 9월까지 .. 2017. 9. 16.