Page 8 -
P. 8
003
부호화(인코딩)와
복호화(디코딩)*
컴퓨터 내부에서는 숫자, 문자, 이미지, 소리, 동영상 등 모든 자료를 약속된 방법 Part 2
인 0과 1의 코드(Code, 부호)로 표현합니다. 이 과정을 부호화(인코딩, Encod-
ing)라고 하는데, 우리가 입력한 문자나 기호를 컴퓨터가 알아들을 수 있는 코드
로 변환하는 것입니다. 때로는 데이터를 압축하는 과정도 포함됩니다. 반대로, 복
호화(디코딩, Decoding)는 이 코드를 원래 정보로 바꾸는 것을 의미합니다.
문자 정보의 부호화
문자를 부호화하는 대표적인 방법에는 아스키코드(ASCII Code: American
Standard Code for Information Interchange)가 있습니다. 아스키코드는 이름
풀이에서 알 수 있듯 미국의 표준 코드이며, 영문 대소문자, 숫자, 특수기호 등을
표현하기 위해 7비트를 활용합니다. 반면, 유니코드(Unicode)는 전 세계의 다양
한 언어를 동시에 표현하기 위해 16개 이상의 비트를 활용합니다.
알면 플러스 1바이트가 8비트가 된 이유
옛날에는 바이트가 지금처럼 ‘8비트’로 고정된 개념이 아니었습니다. 바이트는 단순히 ‘작은 데
이터 덩어리’를 의미했으며, 컴퓨터마다 그 크기가 달랐습니다. 그러다 사람들이 ‘컴퓨터끼리 데
이터를 주고받을 때 모두 같은 기준을 쓰면 좋겠다.’고 생각하게 되었고, 그 결과 아스키코드라
는 문자 코드의 표준이 마련되었습니다. 아스키코드는 한 문자를 저장하는 데 7비트가 필요했
는데, 7비트만으로는 컴퓨터가 실수할 수도 있어서 오류를 확인할 수 있는 1비트를 더 추가해
8비트를 사용하게 되었습니다. 게다가 8은 2의 3제곱으로, 비트로 모든 것을 처리하는 컴퓨터
가 계산하기에 효율적인 숫자이기도 합니다. 그리하여 8비트가 가장 이상적인 1바이트의 크기
로 자리 잡게 되었습니다. 만약 한국이 처음으로 바이트를 정의했다면 어땠을까요? 한글의 특
성이 반영되어 바이트의 크기나 개념이 현재와는 다르게 정해졌을 수도 있겠지요.
073