Page 12 -
P. 12
1950년대, 약 4MB(보통 음질의 MP3 노래 한 곡)를 저장할 수 있
었던 ‘IBM RAMAC 305’의 크기는 무려 냉장고 두 대, 무게는 1
톤, 한 달 대여 비용은 수천만 원에 달했습니다. 사정이 이렇다 보
니 데이터를 저장하기 어려워 수많은 데이터를 그냥 흘려버릴 수
밖에 없었죠.
이후 데이터 저장 매체의 크기와 비용이 점차 감소하면서 이제
는 단돈 몇십 원이면 1GB의 저장 공간을 마련할 수 있게 됐습니
다. 이는 1950년대와 비교하면 수억 배나 적은 비용입니다. 비로
소 빠른 속도로 생성되는 많은 양의 데이터를 저장할 수 있는 시
대가 온 것이죠.
전문가의 조언 데이터와 통계의 차이점
데이터는 상대적으로 개별 사건에 대한 정보를 담고 있는 반면, 통계는 여러 사건을 요약한 정보를 담고 있습니다. 교
통사고를 예로 들면, 언제 어디서 누가 어떤 사고를 냈는지 교통사고별로 기록하면 ‘교통사고 데이터’가 되지만, 이 데
이터를 요약해 지난 1년간 발생한 교통사고 수를 기록하면 ‘교통사고 통계’가 됩니다.
02 연산 기술의 발전
데이터가 크다고 해서 바로 가치가 생기는 것은 아닙니다. 큰 데이
터를 분석하고 처리할 수 있는 연산 기술이 없다면 빅데이터는 저장
비용만 축낼 것입니다. 예를 들어 온라인 쇼핑몰에서 데이터를 분석
해 고객에게 실시간으로 제품을 추천할 때 컴퓨터의 연산 속도가 너
28 첫째마당ㅣ빅데이터 세상