Page 20 -
P. 20

닐 수 없다.

                다크 데이터의 첫 번째 유형과 마찬가지로 두 번째 유형의 사례,
              곧 무언가가 빠져 있는지를 우리가 모르는 경우는 어디에나 있다.

              사기 행위가 들통나지 않은 경우라든지, 살인이 벌어졌음을 확인시

              켜줄 범죄 피해자 조사가 안 된 경우를 생각해보라.
                다크 데이터의 이 두 유형은 여러분에게 어떤 기시감을 느끼게

              해줄지 모른다. 한 유명한 뉴스 브리핑에서 전직 미국 국방장관 도
              널드 럼스펠드Donald Rumsfeld가 인상적인 다음 구절로 그 특징을 잘 짚

              어냈다. “알려진 미지 known unknowns란 무언가를 모른다는 걸 우리가

              아는 경우입니다. 하지만 알려지지 않은 미지 unknown unknowns도 있습
                                                        6
              니다. 우리가 모른다는 것조차 모르는 경우입니다.”  럼스펠드는 이
              꼬인 말 때문에 언론으로부터 적잖이 조롱을 당했지만, 그런 비난은

              부당하다. 그의 말은 지극히 타당할 뿐만 아니라 진실이다.
                그런데 처음 나온 두 유형은 시작일 뿐이다. 다음 절에서 다크 데

              이터의 다른 유형 몇 가지를 소개하겠다. 이 유형들과 나중에 설명

              할 유형들이 이 책이 전하고자 하는 핵심이다. 앞으로 보겠지만 다
              크 데이터의 형태는 여러 가지다. 데이터는 불완전할 수 있고, 일부

              를 살폈다고 전부를 살폈다는 뜻은 아니고, 측정 과정이 부정확할
              수 있고, 측정된 것이 우리가 정말로 측정하고 싶은 것이 아닐 수도

              있다. 이것을 알지 못하면 우리는 실제 상황을 매우 잘못 파악할 수

              있다. 숲에서 나무가 쓰러지는 소리를 들은 사람이 없다고 해서 나
              무가 쓰러질 때 소리가 나지 않는 것은 아니다.









              26   1부 | 다크 데이터는 어떻게 생겨나고 어떤 결과를 초래하는가
   15   16   17   18   19   20   21   22   23   24   25