Page 14 -
P. 14

보자.

                의학에서 트라우마는 ‘중대한 손상이 장기적으로 일어날 수 있는
              심각한 부상’을 가리킨다. 트라우마는 조기 사망 및 장애를 초래하

              는 ‘수명 손실’의 가장 심각한 원인 중 하나이며, 40세 미만 인구의

              가장 흔한 사망 원인이다. 영국의 ‘트라우마 검사 및 연구 네트워크’
              의 데이터베이스는 유럽 최대의 의료 트라우마 데이터베이스다. 이

              네트워크는 200곳이 넘는 병원에서 트라우마 사건에 관한 데이터
              를 수집하는데, 여기에는 영국과 웨일스에 있는 병원들 중 93퍼센트

              이상과 아일랜드・네덜란드・스위스의 병원들도 포함된다. 그야말로

              트라우마 진단 및 처치의 효율성을 연구하는 데 필요한 데이터의 보
              고다.

                영국 레스터대학교의 에프게니 미르케스Evgeny Mirkes 박사 연구

                                                            4
              팀은 이 데이터베이스의 일부 데이터를 살펴보았다.  그랬더니
              165,559건의 트라우마 사례 중에서 결과가 알려지지 않은 사례가

              19,289건이었다. 트라우마 연구에서 ‘결과’란 환자가 부상 후 적어

              도 30일이 지난 시점에 생존해 있는지를 의미한다. 따라서 11퍼센
              트가 넘는 환자들의 30일 이후 생존 여부가 알려지지 않았다. 이 예

              는 다크 데이터의 흔한 형태, 곧 DD 유형 1 빠져 있는지 우리가 아는 데
              이터를 잘 보여준다. 이 환자들한테 어떤 결과가 나왔으리라는 건 알

              지만, 그게 무엇인지는 모른다.

                뭐가 문제람? 그냥 결과가 알려진 환자 146,270명을 분석한 뒤
              에 그걸 바탕으로 진단을 내리면 되지 않을까? 어쨌거나 146,270은

              큰 수니까(의학 분야에서 이만하면 ‘빅데이터 big data’이므로) 이 데이






              20   1부 | 다크 데이터는 어떻게 생겨나고 어떤 결과를 초래하는가
   9   10   11   12   13   14   15   16   17   18   19