Xml-encoding

提供:Dev Guides
移動先:案内検索

XML-エンコード

  • エンコード*は、Unicode文字を同等のバイナリ表現に変換するプロセスです。 XMLプロセッサは、XMLドキュメントを読み取るときに、エンコードの種類に応じてドキュメントをエンコードします。 したがって、XML宣言でエンコードのタイプを指定する必要があります。

エンコードタイプ

主に2種類のエンコーディングがあります-

  • UTF-8
  • UTF-16

UTFは_UCS Transformation Format_を表し、UCS自体は_Universal Character Set_を意味します。 数字8または16は、文字を表すために使用されるビット数を指します。 それらは8(1から4バイト)または16(2または4バイト)です。 エンコード情報のないドキュメントの場合、デフォルトでUTF-8が設定されます。

構文

エンコードタイプは、XMLドキュメントのプロローグセクションに含まれています。 UTF-8エンコーディングの構文は次のとおりです-

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>

UTF-16エンコーディングの構文は次のとおりです-

<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>

次の例は、エンコーディングの宣言を示しています-

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>finddevguides</company>
   <phone>(011) 123-4567</phone>
</contact-info>

上記の例では、 encoding = "UTF-8" は、8ビットを使用して文字を表すことを指定します。 16ビット文字を表すには、 UTF-16 エンコードを使用できます。

UTF-8でエンコードされたXMLファイルは、UTF-16形式でエンコードされたXMLファイルよりもサイズが小さくなる傾向があります。