Xml-encoding
提供:Dev Guides
XML-エンコード
- エンコード*は、Unicode文字を同等のバイナリ表現に変換するプロセスです。 XMLプロセッサは、XMLドキュメントを読み取るときに、エンコードの種類に応じてドキュメントをエンコードします。 したがって、XML宣言でエンコードのタイプを指定する必要があります。
エンコードタイプ
主に2種類のエンコーディングがあります-
- UTF-8
- UTF-16
UTFは_UCS Transformation Format_を表し、UCS自体は_Universal Character Set_を意味します。 数字8または16は、文字を表すために使用されるビット数を指します。 それらは8(1から4バイト)または16(2または4バイト)です。 エンコード情報のないドキュメントの場合、デフォルトでUTF-8が設定されます。
構文
エンコードタイプは、XMLドキュメントのプロローグセクションに含まれています。 UTF-8エンコーディングの構文は次のとおりです-
UTF-16エンコーディングの構文は次のとおりです-
例
次の例は、エンコーディングの宣言を示しています-
上記の例では、 encoding = "UTF-8" は、8ビットを使用して文字を表すことを指定します。 16ビット文字を表すには、 UTF-16 エンコードを使用できます。
UTF-8でエンコードされたXMLファイルは、UTF-16形式でエンコードされたXMLファイルよりもサイズが小さくなる傾向があります。