Jsoup-overview

提供:Dev Guides
移動先:案内検索

jsoup-概要

jsoupは、HTMLベースのコンテンツを操作するためのJavaベースのライブラリです。 DOM、CSS、およびjqueryのようなメソッドを使用して、データを抽出および操作するための非常に便利なAPIを提供します。 WHATWG HTML5仕様を実装し、最新のブラウザーと同じDOMにHTMLを解析します。

jsoupライブラリは、WHATWG HTML5仕様を実装し、HTMLコンテンツを最新のブラウザーごとに同じDOMに解析します。

jsonpライブラリは次の機能を提供します。

  • 複数読み取りサポート-URL、ファイル、または文字列を使用してHTMLを読み取り、解析します。
  • * CSSセレクタ*-DOMトラバーサルまたはCSSセレクタを使用して、データを検索および抽出できます。
  • DOM Manipulation -HTML要素、属性、およびテキストを操作できます。
  • * XSS攻撃を防ぐ*-XSS攻撃を防ぐために、指定された安全なホワイトリストに対してユーザーが送信したコンテンツをクリーンアップできます。
  • Tidy -整然としたHTMLを出力します。
  • 無効なデータを処理します-jsoupは、閉じられていないタグ、暗黙的なタグを処理でき、ドキュメント構造を確実に作成できます。