Page 24 -
P. 24
P Y THON
5.4
문자 인코딩
인코딩과 디코딩
컴퓨터는 0 또는 1의 조합만 이해할 수 있는 디지털 시스템이다. 그래서 컴퓨터에서는 모든
것을 0과 1의 조합을 통해 표현한다.
영어 알파벳 ‘A’는 영어를 이해하는 사람이 보면 알파벳 중 한 개지만, 모르는 사람이 볼 때는
글자 또는 기호일 뿐이다.
컴퓨터는 사람이 쓰는 언어를 이해하지 못한다. 컴퓨터에 있어 ‘A’라는 글자는 처리해야 할 자
료 중 한 개일 뿐이지 의미를 알지 못한다. 한글도 마찬가지다.
어떤 사람이 ch라는 변수에 ‘A’ 문자를 저장하는 코드를 작성했다고 가정하자.
[코드 5-5]
ch = 'A'
그렇다면 메모리에 ‘A’라는 문자가 저장되어야 한다. 그런데 메모리에는 0과 1의 조합 외에는
저장될 수 없다. ‘A’는 보다시피 0과 1이 아니다. 어떻게 저장되어야 할까?
이럴 때 사용되는 것이 문자 변환 표이다. 문자 변환 표는 사람이 인지하는 문자와 컴퓨터가
이해할 수 있는 0과 1의 조합을 연결한 것이다.
예를 들어 영어 ‘A’~‘D’와 한글 ‘가’~‘라’까지 8글자만 사용할 수 있는 프로그램이 있다고 가정
하고 표 5-1을 보자.
표 5-1 문자 변환 표
문자 이진 코드 문자 이진 코드 문자 이진 코드 문자 이진 코드
A 000 B 001 C 010 D 011
가 100 나 101 다 110 라 111
182 │ 파이썬