Page 2 -
P. 2
서문
이 책은 색다르다. 빅데이터나 오픈 데이터 또는 데이터 과학을
주제로 한 대중서든, 데이터 분석 방법을 다룬 전문적인 통계학 서
적이든 데이터에 관한 책들은 대개 우리가 ‘갖고 있는’ 데이터를 다
룬다. 우리 컴퓨터 속 폴더나 책상 위 서류철에 들어 있는 자료, 공
책에 적힌 내용과 같은 데이터 말이다. 반면에 이 책은 우리가 ‘갖고
있지 않은’ 데이터를 다룬다. 그러니까 우리가 지금 갖고 싶거나, 이
전에 가지고 싶었거나, 또는 가진 줄 알지만 실제로는 갖고 있지 ‘않
은’ 데이터에 관한 책이다. 나는 빠진 데이터야말로 우리가 갖고 있
는 데이터 못지않게 중요하다고 보며, 많은 사례를 들어 나의 주장
을 입증하려고 한다. 볼 수 없는 데이터는 우리를 잘못된 길로 이끌
잠재력이 있으며, 앞으로 살펴보겠지만 때로는 파국을 초래하기도
한다. 그런 일이 어떻게 그리고 왜 생기는지 알려주겠다. 또 파국을
5
서문