Xml-encoding
提供:Dev Guides
XML-エンコード
- エンコード*は、Unicode文字を同等のバイナリ表現に変換するプロセスです。 XMLプロセッサは、XMLドキュメントを読み取るときに、エンコードの種類に応じてドキュメントをエンコードします。 したがって、XML宣言でエンコードのタイプを指定する必要があります。
エンコードタイプ
主に2種類のエンコーディングがあります-
- UTF-8
- UTF-16
UTFは_UCS Transformation Format_を表し、UCS自体は_Universal Character Set_を意味します。 数字8または16は、文字を表すために使用されるビット数を指します。 それらは8(1から4バイト)または16(2または4バイト)です。 エンコード情報のないドキュメントの場合、デフォルトでUTF-8が設定されます。
構文
エンコードタイプは、XMLドキュメントのプロローグセクションに含まれています。 UTF-8エンコーディングの構文は次のとおりです-
<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
UTF-16エンコーディングの構文は次のとおりです-
<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>
例
次の例は、エンコーディングの宣言を示しています-
<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
<name>Tanmay Patil</name>
<company>finddevguides</company>
<phone>(011) 123-4567</phone>
</contact-info>
上記の例では、 encoding = "UTF-8" は、8ビットを使用して文字を表すことを指定します。 16ビット文字を表すには、 UTF-16 エンコードを使用できます。
UTF-8でエンコードされたXMLファイルは、UTF-16形式でエンコードされたXMLファイルよりもサイズが小さくなる傾向があります。