Page 20 -
P. 20
닐 수 없다.
다크 데이터의 첫 번째 유형과 마찬가지로 두 번째 유형의 사례,
곧 무언가가 빠져 있는지를 우리가 모르는 경우는 어디에나 있다.
사기 행위가 들통나지 않은 경우라든지, 살인이 벌어졌음을 확인시
켜줄 범죄 피해자 조사가 안 된 경우를 생각해보라.
다크 데이터의 이 두 유형은 여러분에게 어떤 기시감을 느끼게
해줄지 모른다. 한 유명한 뉴스 브리핑에서 전직 미국 국방장관 도
널드 럼스펠드Donald Rumsfeld가 인상적인 다음 구절로 그 특징을 잘 짚
어냈다. “알려진 미지 known unknowns란 무언가를 모른다는 걸 우리가
아는 경우입니다. 하지만 알려지지 않은 미지 unknown unknowns도 있습
6
니다. 우리가 모른다는 것조차 모르는 경우입니다.” 럼스펠드는 이
꼬인 말 때문에 언론으로부터 적잖이 조롱을 당했지만, 그런 비난은
부당하다. 그의 말은 지극히 타당할 뿐만 아니라 진실이다.
그런데 처음 나온 두 유형은 시작일 뿐이다. 다음 절에서 다크 데
이터의 다른 유형 몇 가지를 소개하겠다. 이 유형들과 나중에 설명
할 유형들이 이 책이 전하고자 하는 핵심이다. 앞으로 보겠지만 다
크 데이터의 형태는 여러 가지다. 데이터는 불완전할 수 있고, 일부
를 살폈다고 전부를 살폈다는 뜻은 아니고, 측정 과정이 부정확할
수 있고, 측정된 것이 우리가 정말로 측정하고 싶은 것이 아닐 수도
있다. 이것을 알지 못하면 우리는 실제 상황을 매우 잘못 파악할 수
있다. 숲에서 나무가 쓰러지는 소리를 들은 사람이 없다고 해서 나
무가 쓰러질 때 소리가 나지 않는 것은 아니다.
26 1부 | 다크 데이터는 어떻게 생겨나고 어떤 결과를 초래하는가