19。 構造化マークアップ処理ツール
Pythonは、さまざまな形式の構造化データマークアップを処理するためのさまざまなモジュールをサポートしています。 これには、Standard Generalized Markup Language(SGML)とHypertext Markup Language(HTML)を操作するためのモジュール、およびExtensible Markup Language(XML)を操作するためのいくつかのインターフェースが含まれます。
xml パッケージのモジュールでは、少なくとも1つのSAX準拠のXMLパーサーが使用可能である必要があることに注意してください。 Python 2.3以降、ExpatパーサーはPythonに含まれているため、 xml.parsers.expat モジュールは常に使用可能になります。 PyXMLアドオンパッケージに注意する必要があるかもしれません。 そのパッケージは、Python用のXMLライブラリの拡張セットを提供します。
xml.dom および xml.sax パッケージのドキュメントは、DOMおよびSAXインターフェースのPythonバインディングの定義です。
- 19.1.
HTMLParser
—単純なHTMLおよびXHTMLパーサー - 19.2.
sgmllib
—単純なSGMLパーサー - 19.3.
htmllib
—HTMLドキュメントのパーサー - 19.4.
htmlentitydefs
—HTML一般エンティティの定義 - 19.5. XML処理モジュール
- 19.6. XMLの脆弱性
- 19.7.
xml.etree.ElementTree
— ElementTree XML API - 19.8.
xml.dom
—ドキュメントオブジェクトモデルAPI- 19.8.1. モジュールの内容
- 19.8.2. DOM内のオブジェクト
- 19.8.2.1. DOMImplementationオブジェクト
- 19.8.2.2. ノードオブジェクト
- 19.8.2.3. NodeListオブジェクト
- 19.8.2.4. DocumentTypeオブジェクト
- 19.8.2.5. ドキュメントオブジェクト
- 19.8.2.6. 要素オブジェクト
- 19.8.2.7. Attrオブジェクト
- 19.8.2.8. NamedNodeMapオブジェクト
- 19.8.2.9. コメントオブジェクト
- 19.8.2.10. テキストおよびCDATASectionオブジェクト
- 19.8.2.11. ProcessingInstructionオブジェクト
- 19.8.2.12. 例外
- 19.8.3. 適合性
- 19.9.
xml.dom.minidom
—最小限のDOM実装 - 19.10.
xml.dom.pulldom
—部分的なDOMツリーの構築のサポート - 19.11.
xml.sax
—SAX2パーサーのサポート - 19.12.
xml.sax.handler
—SAXハンドラーの基本クラス - 19.13.
xml.sax.saxutils
—SAXユーティリティ - 19.14.
xml.sax.xmlreader
—XMLパーサーのインターフェース - 19.15.
xml.parsers.expat
—Expatを使用した高速XML解析