Page 11 -
P. 11

정형(구조화, structured) 데이터는 구조와 관리 체계에 규칙이 정해져 있는 데이터를 말합니
                            다. 책에서 다루는 오라클 데이터베이스는 이러한 정형 데이터를 다루는 관계형 데이터베이

                            스 시스템(RDBMS)에 속합니다. 이어서 배우겠지만 기업에서는 안정성 때문에 관계형 데
                            이터베이스를 많이 사용합니다. SQL은 정형 데이터로 만들어진 관계형 데이터베이스를 조

                            작하는 언어입니다.

                            비정형 데이터는 정형 데이터에 상반되는 개념입니다. 비정형 데이터는 최근 빅데이터가 주
                            목을 받기 시작하면서 부각된 데이터 형태인데, 정형 데이터 외의 모든 데이터가 비정형 데

                            이터입니다. 이를테면 이메일 내용과 소셜미디어 포스트, 각종 텍스트 문서, 음원과 이미지,
                            스마트폰에 기록되는 각종 행동 정보와 기계에서 출력되는 각종 메시지와 로그(log, 기록)                       2
                            등을 말합니다.


                            책에서는 정형 데이터, 관계형 데이터베이스 중 하나인 오라클을 다루려 합니다.

                            그림 1-9 빅데이터와 정형 데이터의 영역
                                    빅데이터



                              정형 데이터
                               (RDBMS   비정형 데이터
                               = 오라클 DB)





                             우리가 다룰 영역





                           4       데이터베이스란?




                            데이터는 어떤 것들의 ‘기록 정보’이고, 이러한 데이터를 모아 둔 것을 데이터베이스라고 합
                            니다. 과거에는 이런 정보들을 문서에 직접 손으로 기록하여 관리하는 수밖에 없었습니다.

                            하지만 지금은 IT 기술이 발달하면서 정보들을 컴퓨터로 관리할 수 있게 되었습니다. 이로




                            2   로그는 엄밀하게 말하면 정형과 비정형의 중간 형태인 반정형(semi-structured) 데이터지만 편의상 비정형 데이터로 구분하겠습니다.


                                                                                       01  이제는 데이터의 시대   19



         SQL_06.indd   19                                                                        2018-09-06   오전 7:34:23
   6   7   8   9   10   11   12   13   14   15   16