전체 페이지뷰

2017년 3월 22일 수요일

XML - Encoding

Encoding이란 유니코드 문자를 해당하는 이진수 표현으로 바꾸는 과정을 말합니다.
XML 프로세서가 XML 문서를 읽어들일 때, 문서를 인코딩 타입에 맞게 변환하게 됩니다. 따라서 XML 선언부에서 유니코드 형식을 특정할 필요가 있는 것입니다.

Encoding Types


두 개의 타입이 주로 사용됩니다.

  • UTF-8
  • UTF-16

UTF라는 것은 UCS Transformation Format의 약자이고, UCS는 Universal Character Set의 약자입니다. 8과 16은 문자를 나타내는 bit 수이고, 8은 1바이트, 16은 2바이트 입니다. 아무 정보가 주어지지 않으면 UTF-8이 디폴트가 됩니다.

Syntax

Encoding 타입은 문서의 Prolog section에 포함됩니다. UTF-8용 문법은 다음과 같습니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
cs

UTF-16도 같습니다
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
cs

Example

인코딩 선언의 예입니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>
cs

UTF-8로 인코딩된 문서의 크기가 UTF-16으로 인코딩된 문서의 크기보다 작습니다.

댓글 없음:

댓글 쓰기