XML 프로세서가 XML 문서를 읽어들일 때, 문서를 인코딩 타입에 맞게 변환하게 됩니다. 따라서 XML 선언부에서 유니코드 형식을 특정할 필요가 있는 것입니다.
Encoding Types
두 개의 타입이 주로 사용됩니다.
- UTF-8
- UTF-16
UTF라는 것은 UCS Transformation Format의 약자이고, UCS는 Universal Character Set의 약자입니다. 8과 16은 문자를 나타내는 bit 수이고, 8은 1바이트, 16은 2바이트 입니다. 아무 정보가 주어지지 않으면 UTF-8이 디폴트가 됩니다.
Syntax
Encoding 타입은 문서의 Prolog section에 포함됩니다. UTF-8용 문법은 다음과 같습니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
| cs |
UTF-16도 같습니다
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
| cs |
Example
인코딩 선언의 예입니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
<name>Tanmay Patil</name>
<company>TutorialsPoint</company>
<phone>(011) 123-4567</phone>
</contact-info>
| cs |
UTF-8로 인코딩된 문서의 크기가 UTF-16으로 인코딩된 문서의 크기보다 작습니다.
댓글 없음:
댓글 쓰기