Page 26 -
P. 26

았다. 인터넷상의 가장 방대한 포르노 사이트인 폰허브PornHub를 통

                해서 익명인 전 세계 사람들의 검색과 비디오 조회수에 관해 완벽한
                데이터를 얻었다. 달리 말해 나는 이른바 빅데이터라는 것에 아주

                깊이 빠져들었다. 거기에 그치지 않고 이 새로운 영역을 탐험하는

                학자, 데이터 저널리스트, 기업가 수십 명을 인터뷰했다. 이 책에서
                그들의 연구를 많이 다룰 것이다.

                   하지만 먼저 고백해야 할 것이 하나 있다. 나는 도대체 빅데이
                터가 무엇인지 정확하게 정의하지 못한다. 그 자체가 본래 애매한

                개념이기 때문이다. 크다는 것은 얼마나 큰 것을 말할까? 18,462건
                의 관찰은 스몰데이터small data이고 18,463건은 빅데이터일까? 나는

                자격 요건에 대해 포괄적인 관점을 취하는 편이다. 나는 데이터 대

                부분을 인터넷에서 가져오지만 다른 출처에 대해서도 논의할 것이
                다. 우리는 이용 가능한 갖가지 정보의 양과 질이 폭발적으로 증가

                하는 것을 경험하며 살고 있다. 이 새로운 정보 대부분은 구글과 소
                셜미디어에서 나온다. 일부는 과거에는 캐비닛이나 서류철에 보관

                되어 있던 정보가 디지털화된 결과물이다. 일부는 크게 늘어난 시장
                조사 전문 기관에서 나온다. 이 책에서 논의하는 일부 연구는 거대

                한 데이터세트를 전혀 사용하지 않고 데이터에 대한 새롭고 창의적

                인 접근법(정보가 넘쳐나는 영역에서는 아주 중요한 접근법)을 채
                택하기도 한다.

                   그렇다면 빅데이터가 이렇게 강력한 이유는 정확히 무엇일까?
                특정한 날 온라인에 흩어져 있는 정보 전체에 관해 생각해보자. 우






                30
   21   22   23   24   25   26   27