Scrapy-command-line-tools
Scrapy-コマンドラインツール
説明
Scrapyコマンドラインツールは、Scrapyを制御するために使用されます。これは、 'Scrapyツール' と呼ばれることがよくあります。 これには、一連の引数とオプションを持つさまざまなオブジェクトのコマンドが含まれています。
構成設定
Scrapyは、 scrapy.cfg ファイルで構成設定を見つけます。 以下はいくつかの場所です-
- システム内のC:\ scrapy(project folder)\ scrapy.cfg
- 〜/.config/scrapy.cfg($ XDG_CONFIG_HOME)および〜/.scrapy.cfg($ HOME)グローバル設定
- プロジェクトのルート内でscrapy.cfgを見つけることができます。
スクレイピーは、次の環境変数を使用して構成することもできます-
- SCRAPY_SETTINGS_MODULE
- SCRAPY_PROJECT
- SCRAPY_PYTHON_SHELL
デフォルト構造スクレイピープロジェクト
次の構造は、Scrapyプロジェクトのデフォルトのファイル構造を示しています。
スクレイピーツールの使用
スクレイピーツールは、次のようにいくつかの使用法と使用可能なコマンドを提供します-
プロジェクトを作成する
次のコマンドを使用して、Scrapyでプロジェクトを作成できます-
これにより、 project_name ディレクトリというプロジェクトが作成されます。 次に、次のコマンドを使用して、新しく作成されたプロジェクトに移動します-
プロジェクトの管理
あなたは、プロジェクトを制御し、スクレイピーツールを使用してそれらを管理し、また次のコマンドを使用して、新しいスパイダーを作成することができます-
クロールなどのコマンド Scrapyプロジェクト内で使用する必要があります。 次のセクションで、Scrapyプロジェクト内でどのコマンドを実行する必要があるかがわかります。
Scrapyには、プロジェクトに使用できるいくつかの組み込みコマンドが含まれています。 利用可能なコマンドのリストを表示するには、次のコマンドを使用します-
次のコマンドを実行すると、Scrapyは使用可能なコマンドのリストを表示します-
- fetch -Scrapyダウンローダーを使用してURLを取得します。
- runspider -プロジェクトを作成せずに自己完結型のスパイダーを実行するために使用されます。
- settings -プロジェクトの設定値を指定します。
- shell -指定されたURLのインタラクティブなスクレイピングモジュールです。
- startproject -新しいScrapyプロジェクトを作成します。
- version -Scrapyバージョンを表示します。
- view -Scrapyダウンローダーを使用してURLを取得し、ブラウザーにコンテンツを表示します。
リストされているように、いくつかのプロジェクト関連のコマンドを持つことができます-
- クロール-クモを使用してデータをクロールするために使用されます。
- check -クロールされたコマンドによって返されたアイテムをチェックします。
- list -プロジェクトに存在する利用可能なスパイダーのリストを表示します。
- 編集-エディターを使用してスパイダーを編集できます。
- parse -指定されたURLをスパイダーで解析します。
- ベンチ-クイックベンチマークテストの実行に使用されます(ベンチマークは、Scrapyが1分間にクロールできるページ数を示します)。
カスタムプロジェクトコマンド
Scrapyプロジェクトで COMMANDS_MODULE 設定を使用してカスタムプロジェクトコマンドをビルドできます。 設定にデフォルトの空の文字列が含まれます。 次のカスタムコマンドを追加できます-
スクレイピーコマンドは、次のように示されているsetup.pyファイルのscrapy.commandsセクションを使用して追加できます-
上記のコードは、 setup.py ファイルに cmd_demo コマンドを追加します。